Latest web development tutorials

HTML UTF-8 참조 설명서

유니 코드 컨소시엄 (유니 코드 컨소시엄)

유니 코드 컨소시엄 (유니 코드 컨소시엄) 유니 코드 표준 (유니 코드 표준)을 개발. 이들의 목적은 기존의 문자 세트를 대체 (유니 코드 변환 형식을 나타내며, 즉 UTF) 표준 유니 변환 형식을 사용하는 것이다.

유니 코드 표준은 달성 HTML, XML, 자바, 자바 스크립트, E 메일, ASP, PHP 성공적인 구상이다. 또한 유니 코드 표준 많은 운영 체제 및 모든 최신 브라우저를 지원합니다.

ISO, W3C와 ECMA가 선도적 인 표준 개발 기관과의 유니 코드 동맹.


유니 코드 문자 집합

유니 코드는 상이한 문자 세트에 의해 구현 될 수있다. 가장 일반적으로 사용되는 인코딩은 UTF-8 및 UTF-16 :

字符集 描述
UTF-8 UTF8 中的字符可以是 1 到 4 字节长。UTF-8 可以代表 Unicode 标准中的任何字符。UTF-8 向后兼容 ASCII。UTF-8 是电子邮件和网页的首选编码。
UTF-16 16 位 Unicode 转换格式是一种可变长度的 Unicode 字符编码,能够编码整个 Unicode 指令表。UTF-16 主要用于操作系统和环境,如 Microsoft Windows、Java 和 .NET。

팁 : 유니 코드 처음 128 문자 (ASCII - 대 - 일 대응)이 유효한 ASCII 문자 UTF-8 인코딩도 효과가 수행되도록 동일한 바이너리 옥텟의 ASCII 값을 인코딩 사용합니다.

팁 : 모든 HTML 4 프로세서를 지원 UTF-8, 모든 HTML 5 및 XML 프로세서 지원 UTF-8과 UTF-16!


HTML5 표준 : 유니 코드 UTF-8

는 ISO-8859 문자 세트의 크기가 제한 및 다국어 환경에서 호환되지 않기 때문에, 유니 코드 컨소시엄은 유니 코드 표준을 개발했다.

유니 코드 표준 커버 (거의) 모든 문자, 문장 부호 및 기호.

유니 코드 처리, 저장 및 텍스트의 운송 및 플랫폼 독립적 인 언어를 할 수 있습니다.

HTML-5의 기본 문자 인코딩은 UTF-8입니다.

여기에 몇 가지 HTML5 지원 UTF-8 문자 세트입니다 :

字符集 十进制 十六进制
C0 控制与基本的 Latin(C0 Controls and Basic Latin) 0-127 0000-007F
C1 控制与 Latin-1 的补充(C1 Controls and Latin-1 Supplement) 128-255 0080-00FF
Latin 扩展 A(Latin Extended-A) 256-383 0100-017F
Latin 扩展 B(Latin Extended-B) 384-591 0180-024F

HTML5 페이지가 UTF-8 문자를 사용하는 경우 다음과 같이 <메타> 태그에 지정해야 다릅니다 :

<meta charset="ISO-8859-1">