HTML UTF-8 Справочное руководство
Консорциум Unicode (Консорциум Unicode)
Консорциум Unicode (Консорциум Unicode) разработал стандарт Unicode (стандарт Unicode). Их цель состоит в том, чтобы использовать стандартный формат Unicode преобразования (т.е. UTF, расшифровывается как Unicode Transformation Format), чтобы заменить существующие наборы символов.
Стандарт Unicode является успешной инициативой, в HTML, XML, Java, JavaScript, электронная почта, ASP, PHP достигнуты. стандарт Unicode также многие операционные системы и все современные браузеры поддержки.
Unicode альянс с ведущими организациями по разработке стандартов, которые имеют ISO, W3C и ECMA.
Набор символов Unicode
Unicode, могут быть реализованы с помощью различных наборов символов. Наиболее часто используемый кодировка UTF-8 и UTF-16:
字符集 | 描述 |
---|---|
UTF-8 | UTF8 中的字符可以是 1 到 4 字节长。UTF-8 可以代表 Unicode 标准中的任何字符。UTF-8 向后兼容 ASCII。UTF-8 是电子邮件和网页的首选编码。 |
UTF-16 | 16 位 Unicode 转换格式是一种可变长度的 Unicode 字符编码,能够编码整个 Unicode 指令表。UTF-16 主要用于操作系统和环境,如 Microsoft Windows、Java 和 .NET。 |
Совет: Unicode первые 128 символов (ASCII-однозначное соответствие) использовать значение ASCII того же двоичного октета кодируется таким образом, что действительный текст ASCII UTF-8 кодировке также проводит эффективным.
Совет: Все HTML 4 процессоры поддерживают UTF-8, все HTML 5 и процессоры XML поддержка UTF-8 и UTF-16!
стандарты HTML5: Unicode UTF-8
Поскольку набор символов размер ISO-8859 ограничена и не совместимы в многоязычной среде, консорциум Unicode разработал стандарт Unicode.
стандартные обложки Unicode (почти) все символы, знаки и символы.
Unicode позволяет обработку, хранение и транспортировку текста, а также независимый от платформы язык.
HTML-5 в кодировке символов по умолчанию является UTF-8.
Вот некоторая поддержка HTML5 набор UTF-8 символов:
字符集 | 十进制 | 十六进制 |
---|---|---|
C0 控制与基本的 Latin(C0 Controls and Basic Latin) | 0-127 | 0000-007F |
C1 控制与 Latin-1 的补充(C1 Controls and Latin-1 Supplement) | 128-255 | 0080-00FF |
Latin 扩展 A(Latin Extended-A) | 256-383 | 0100-017F |
Latin 扩展 B(Latin Extended-B) | 384-591 | 0180-024F |
Если HTML5 страница использует UTF-8 символов отличается от, вам нужно указать в теге <META> следующим образом: