Latest web development tutorials

HTML Набор символов

Для корректного отображения страницы HTML, браузер должен знать набор символов, которые будут использоваться (кодировка символов).


HTML Набор символов

В HTML, что правильный код символ?

HTML5 кодировка символов по умолчанию является UTF-8.

Это не всегда так. Раннее кодирование сети символ ASCII-код.

Позже, из HTML 2.0 для HTML 4.01, ISO-8859-1 был идентифицирован в качестве стандарта.

С появлением HTML5 и XML, UTF-8, наконец, прибыл, решить множество проблем кодирования символов.

Ниже приводится краткий обзор стандартов кодирования символов.


В начале: ASCII

Компьютерная информация (номер, текст, изображения) в электронике является бинарной 1 и 0 (01000101) для хранения.

В целях упорядочения хранения буквенно-цифровых символов, созданный ASCII (полное название Американский стандартный код для обмена информацией). Она определяется как каждый символ хранится уникальный семизначный двоичной поддержки 0-9, верхний / нижний регистр букв алфавита (AZ, AZ), а также некоторые специальные символы, такие как $ + - () @ <>.

Поскольку ASCII использует байт (7 представляет символ, соотношение указывает на управление передачей), поэтому он может представлять только 128 различных символов. Есть 32 из этих символов, зарезервированы для использования в качестве других целей контроля.

ASCII большим недостатком является то, что он исключает не английскими буквами.

ASCII все еще широко используются сегодня, особенно в больших компьютерных системах.

Для понимания ASCII, пожалуйста , см полную ссылку ASCII руководство .


В операционной системе Windows: ANSI

ANSI (также известный как Windows-1252), является система Windows 95 и Windows, перед началом установки символов по умолчанию.

ANSI ASCII является расширением, он присоединился международный характер. Он использует целый байт (8 бит) для представления 256 различных символов.

С момента вступления в Windows, ANSI набор символов по умолчанию, все браузеры поддерживают ANSI.

Для более глубокого понимания ANSI, пожалуйста , см полный ANSI справочное руководство .


В HTML 4 являются: ISO-8859-1

Так как большинство стран используют отличные от ASCII символы, стандарт HTML 2.0, изменить характер по умолчанию, кодирующий ISO-8859-1.

ISO-8859-1 расширен ASCII, он присоединился международный характер. И ANSI, он использует целый байт (8 бит) для представления 256 различных символов.

примечание Когда браузер обнаруживает ISO-8859-1 на странице, как правило, по умолчанию является ANSI, потому что в дополнение к ANSI 32 дополнительных символов, что другие аспекты ANSI по существу эквивалентны ISO-8859-1.

Если HTML 4 страница использует другой набор символов ISO-8859-1, вам нужно указать в теге <META>, следующим образом:

примеров

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

примечание

HTML5 набор символов по умолчанию является UTF-8.
Вся поддержка HTML 4 процессоров UTF-8, все HTML5 и поддержка XML процессоров UTF-8 и UTF-16.

Для углубленного понимания ISO-8859-1, смотрите полный ISO-8859-1 Reference Manual .


В HTML5: Unicode (UTF-8)

Поскольку наборы символов, перечисленные выше, ограничены, в многоязычной среде не совместимы, поэтому Консорциум Unicode (Консорциум Unicode) разработал стандарт Unicode (стандарт Unicode).

стандартные обложки Unicode (почти) все символы, знаки и символы.

Unicode позволяет обработку, хранение и транспортировку текста, а также независимый от платформы язык.

HTML5 кодировка символов по умолчанию является UTF-8.

Для углубленного понимания Unicode (UTF-8), пожалуйста , см полную справку Unicode инструкцию .