Latest web development tutorials

HTML Instrukcja UTF-8 Referencje

Konsorcjum Unicode (Unicode Consortium)

Konsorcjum Unicode (Unicode Consortium) opracowała standard Unicode (standard Unicode). Ich celem jest wykorzystanie standardowego formatu Unicode Transformation (tj UTF, oznacza Unicode Transformation Format), aby zastąpić istniejące zestawy znaków.

Standard Unicode jest udaną inicjatywą w HTML, XML, Java, JavaScript, E-mail, ASP, PHP zostały osiągnięte. standardem Unicode również wiele systemów operacyjnych i wszystkie nowoczesne wsparcie przeglądarek.

Sojusz Unicode z wiodących organizacji rozwoju standardów, które ISO, W3C i ECMA.


Zestaw znaków Unicode

Unicode mogą być realizowane za pomocą różnych zestawów znaków. Najpowszechniej stosowane kodowanie UTF-8 i UTF-16:

字符集 描述
UTF-8 UTF8 中的字符可以是 1 到 4 字节长。UTF-8 可以代表 Unicode 标准中的任何字符。UTF-8 向后兼容 ASCII。UTF-8 是电子邮件和网页的首选编码。
UTF-16 16 位 Unicode 转换格式是一种可变长度的 Unicode 字符编码,能够编码整个 Unicode 指令表。UTF-16 主要用于操作系统和环境,如 Microsoft Windows、Java 和 .NET。

Wskazówka: Unicode pierwsze 128 znaków ASCII (korespondencji do jednego) wykorzystują wartość ASCII samym oktetu binarnym jest zakodowany tak, że ważne ASCII kodowania UTF-8 jest również prowadzenie skuteczne.

Wskazówka: Wszystkie HTML 4 procesory Wsparcie UTF-8, wszystkie HTML 5 i procesory XML Wsparcie UTF-8 i UTF-16!


standardy HTML5: Unicode UTF-8

Ponieważ ISO-8859 Rozmiar zestaw znaków jest ograniczona i nie jest kompatybilny w środowisku wielojęzycznym, Konsorcjum Unicode opracowany standard Unicode.

Standardowe Unicode okładki (prawie) wszystkie znaki interpunkcyjne i symbole.

Unicode umożliwia przetwarzanie, przechowywanie i transport tekstu i język niezależny od platformy.

HTML 5 w domyślnym kodowaniem znaków UTF-8.

Oto pewne wsparcie HTML5 zestawu znaków UTF-8:

字符集 十进制 十六进制
C0 控制与基本的 Latin(C0 Controls and Basic Latin) 0-127 0000-007F
C1 控制与 Latin-1 的补充(C1 Controls and Latin-1 Supplement) 128-255 0080-00FF
Latin 扩展 A(Latin Extended-A) 256-383 0100-017F
Latin 扩展 B(Latin Extended-B) 384-591 0180-024F

Jeśli strona HTML5 używa UTF-8 różni się od charakteru, trzeba określić w znaczniku <meta> w następujący sposób:

Przykłady

<meta charset="ISO-8859-1">