Latest web development tutorials

Zestaw znaków HTML

Aby poprawnie wyświetlić stronę HTML, przeglądarka musi znać zestaw znaków do użycia (kodowanie).


Zestaw znaków HTML

W HTML, co jest poprawny kod znaku jest?

HTML5 domyślne kodowanie znaków UTF-8.

To nie zawsze tak jest. Wczesne kodowanie znaków sieciowa jest kodem ASCII.

Później, z HTML 2.0 z HTML 4.01, ISO-8859-1 został zidentyfikowany jako standard.

Wraz z pojawieniem się HTML5 i XML, UTF-8 nadeszła, rozwiązać wiele problemów kodowania znaków.

Poniżej znajduje się krótki przegląd standardów kodowania znaków.


Na początku: ASCII

informacje o komputerze (liczba, tekst, obrazy) w elektronice jest binarne 1 i 0 (01000101) do przechowywania.

W celu uregulowania przechowywanie znaków alfanumerycznych, utworzony ASCII (pełna nazwa American Standard Code wymiany informacji). Jest ona definiowana jako każda postać jest przechowywany z unikalną siedem cyfr binarnych wsparcia 0-9, dużymi / małymi literami litery alfabetu (AZ, az) i niektóre znaki specjalne, takie jak $ + - () @ <>.

Od ASCII używa bajt (7 przedstawia postać, równi wskazuje kontroli transmisji), dzięki czemu może reprezentować tylko 128 różnych znaków. Istnieje 32 z tych znaków są zarezerwowane do użytku jako innych celów kontrolnych.

ASCII największą wadą jest to, że obejmuje nie-angielskich liter.

ASCII jest nadal w powszechnym użyciu, zwłaszcza w dużych systemów komputerowych.

Do wglądu w ASCII, zobacz pełną instrukcję odniesienia ASCII .


W systemie Windows: ANSI

ANSI (znany również jako windows-1252), jest Windows 95 i Windows systemów starszych niż domyślny zestaw znaków.

ANSI ASCII jest rozszerzeniem, to dołączył charakter międzynarodowy. Wykorzystuje cały bajt (8 bitów), reprezentująca 256 różnych postaci.

Ponieważ zestaw staje znaków ANSI domyślnego systemu Windows, wszystkie przeglądarki obsługują ANSI.

Dla zrozumienia dogłębnej ANSI, zobacz pełną ANSI Reference Manual .


W HTML 4 to: ISO-8859-1

Ponieważ większość krajów używać znaków innych niż ASCII, standard HTML 2.0, zmiana domyślnego kodowania znaków ISO-8859-1.

ISO-8859-1 jest rozszerzony ASCII, to dołączył charakter międzynarodowy. Oraz ANSI, wykorzystuje cały bajt (8 bitów), reprezentująca 256 różnych postaci.

uwaga Gdy przeglądarka wykryje ISO-8859-1 na stronie, zazwyczaj domyślnie jest ANSI, ponieważ oprócz ANSI 32 dodatkowych znaków, że inne aspekty ANSI zasadniczo równoważne ISO-8859-1.

Jeżeli HTML 4 strona wykorzystuje inny zestaw znaków ISO-8859-1, trzeba określić w znaczniku <meta> w następujący sposób:

Przykłady

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

uwaga

HTML5 Domyślny zestaw znaków UTF-8.
Cała obsługa HTML 4 procesory UTF-8, wszystkie z HTML5 i procesory XML Wsparcie UTF-8 i UTF-16.

Na dogłębne zrozumienie ISO-8859-1, proszę zobaczyć pełną ISO-8859-1 Reference Manual .


W HTML5: Unicode (UTF-8)

Ponieważ zestawy znaków wymienione powyżej są ograniczone, w wielojęzycznym środowisku nie są kompatybilne, więc konsorcjum Unicode (Unicode Consortium) opracowała standard Unicode (standard Unicode).

Standardowe Unicode okładki (prawie) wszystkie znaki interpunkcyjne i symbole.

Unicode umożliwia przetwarzanie, przechowywanie i transport tekstu i język niezależny od platformy.

HTML5 domyślne kodowanie znaków UTF-8.

Na dogłębne zrozumienie Unicode (UTF-8), zapoznaj się z instrukcją odniesienia Unicode .