HTML Набор символов
Для корректного отображения страницы HTML, браузер должен знать набор символов, которые будут использоваться (кодировка символов).
HTML Набор символов
В HTML, что правильный код символ?
HTML5 кодировка символов по умолчанию является UTF-8.
Это не всегда так. Раннее кодирование сети символ ASCII-код.
Позже, из HTML 2.0 для HTML 4.01, ISO-8859-1 был идентифицирован в качестве стандарта.
С появлением HTML5 и XML, UTF-8, наконец, прибыл, решить множество проблем кодирования символов.
Ниже приводится краткий обзор стандартов кодирования символов.
В начале: ASCII
Компьютерная информация (номер, текст, изображения) в электронике является бинарной 1 и 0 (01000101) для хранения.
В целях упорядочения хранения буквенно-цифровых символов, созданный ASCII (полное название Американский стандартный код для обмена информацией). Она определяется как каждый символ хранится уникальный семизначный двоичной поддержки 0-9, верхний / нижний регистр букв алфавита (AZ, AZ), а также некоторые специальные символы, такие как $ + - () @ <>.
Поскольку ASCII использует байт (7 представляет символ, соотношение указывает на управление передачей), поэтому он может представлять только 128 различных символов. Есть 32 из этих символов, зарезервированы для использования в качестве других целей контроля.
ASCII большим недостатком является то, что он исключает не английскими буквами.
ASCII все еще широко используются сегодня, особенно в больших компьютерных системах.
Для понимания ASCII, пожалуйста , см полную ссылку ASCII руководство .
В операционной системе Windows: ANSI
ANSI (также известный как Windows-1252), является система Windows 95 и Windows, перед началом установки символов по умолчанию.
ANSI ASCII является расширением, он присоединился международный характер. Он использует целый байт (8 бит) для представления 256 различных символов.
С момента вступления в Windows, ANSI набор символов по умолчанию, все браузеры поддерживают ANSI.
Для более глубокого понимания ANSI, пожалуйста , см полный ANSI справочное руководство .
В HTML 4 являются: ISO-8859-1
Так как большинство стран используют отличные от ASCII символы, стандарт HTML 2.0, изменить характер по умолчанию, кодирующий ISO-8859-1.
ISO-8859-1 расширен ASCII, он присоединился международный характер. И ANSI, он использует целый байт (8 бит) для представления 256 различных символов.
Когда браузер обнаруживает ISO-8859-1 на странице, как правило, по умолчанию является ANSI, потому что в дополнение к ANSI 32 дополнительных символов, что другие аспекты ANSI по существу эквивалентны ISO-8859-1. |
Если HTML 4 страница использует другой набор символов ISO-8859-1, вам нужно указать в теге <META>, следующим образом:
примеров
HTML5 набор символов по умолчанию является UTF-8. |
Для углубленного понимания ISO-8859-1, смотрите полный ISO-8859-1 Reference Manual .
В HTML5: Unicode (UTF-8)
Поскольку наборы символов, перечисленные выше, ограничены, в многоязычной среде не совместимы, поэтому Консорциум Unicode (Консорциум Unicode) разработал стандарт Unicode (стандарт Unicode).
стандартные обложки Unicode (почти) все символы, знаки и символы.
Unicode позволяет обработку, хранение и транспортировку текста, а также независимый от платформы язык.
HTML5 кодировка символов по умолчанию является UTF-8.
Для углубленного понимания Unicode (UTF-8), пожалуйста , см полную справку Unicode инструкцию .