Latest web development tutorials

Set di caratteri HTML

Per visualizzare correttamente una pagina HTML, il browser deve conoscere il set di caratteri da utilizzare (la codifica dei caratteri).


Set di caratteri HTML

In HTML, qual è il codice di carattere corretto è?

codifica dei caratteri di default HTML5 è UTF-8.

Questo non è sempre il caso. codifica dei caratteri rete precoce è il codice ASCII.

Più tardi, da HTML 2.0 a HTML 4.01, ISO-8859-1 è stato identificato come standard.

Con l'emergere di HTML5 e XML, UTF-8 è finalmente arrivato, di risolvere un sacco di problemi di codifica dei caratteri.

Quanto segue è una breve panoramica degli standard di codifica dei caratteri.


In principio: ASCII

informazioni sul computer (numero, testo, immagini) in elettronica è binario 1 e 0 (01.000.101) per la memorizzazione.

Al fine di regolare lo stoccaggio di caratteri alfanumerici, creato ASCII (nome completo della American Standard Code for Information Interchange). Essa è definita come ogni carattere viene memorizzato con un unico sette cifre supporto binario 0-9, maiuscole / minuscole lettere dell'alfabeto (az, AZ), e alcuni caratteri speciali, come ad esempio $ + - () @ <>.

Dal momento che ASCII utilizza un byte (7 rappresenta il carattere, una parità indica il controllo della trasmissione), in modo che possa rappresentare solo 128 caratteri diversi. Ci sono 32 di questi caratteri sono riservati per l'uso come le altre finalità di controllo.

ASCII più grande svantaggio è che esclude le lettere non inglesi.

ASCII è ancora in uso oggi largamente diffuso, soprattutto nelle grandi sistemi informatici.

Per spaccato ASCII, si prega di consultare il manuale di riferimento completo ASCII .


In Windows: ANSI

ANSI (noto anche come Windows 1252), è un Windows 95 e Windows sistemi precedenti il ​​set di caratteri di default.

ANSI ASCII è un'estensione, si è unito il carattere internazionale. Esso utilizza un intero byte (8 bit) per rappresentare 256 caratteri diversi.

Da quando è diventato carattere ANSI di Windows impostare il valore predefinito, tutti i browser supportano ANSI.

Per comprensione approfondita di ANSI, si prega di consultare il manuale completo di riferimento ANSI .


In HTML 4 sono: ISO-8859-1

Poiché la maggior parte dei paesi utilizzano caratteri diversi da ASCII, lo standard HTML 2.0, cambiare il carattere di default codifica ISO-8859-1.

ISO-8859-1 è esteso ASCII, si è unito il carattere internazionale. E ANSI, utilizza un intero byte (8 bit) per rappresentare 256 caratteri diversi.

nota Quando un browser rileva ISO-8859-1 nella pagina, di solito il valore predefinito è ANSI, perché oltre a ANSI 32 caratteri in più che gli altri aspetti della ANSI sostanzialmente equivalenti a ISO-8859-1.

Se l'HTML 4 pagina utilizza un carattere diverso set ISO-8859-1, è necessario specificare nel tag <meta>, come segue:

Esempi

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

nota

set di caratteri predefinito HTML5 è UTF-8.
Tutto il supporto HTML 4 processori UTF-8, tutti di HTML5 e supportare i processori XML UTF-8 e UTF-16.

Per conoscenza approfondita di ISO-8859-1, si prega di consultare il manuale di riferimento completo ISO-8859-1 .


In HTML5: Unicode (UTF-8)

Poiché i set di caratteri di cui sopra sono limitati, in un ambiente multilingue non sono compatibili, in modo da Unicode Consortium (Unicode Consortium) ha sviluppato lo standard Unicode (Unicode Standard).

coperture standard Unicode (quasi) tutti i personaggi, punteggiatura e simboli.

Unicode consente l'elaborazione, lo stoccaggio e il trasporto del testo, e il linguaggio indipendente dalla piattaforma.

codifica dei caratteri di default HTML5 è UTF-8.

Per comprensione approfondita di Unicode (UTF-8), si prega di consultare il manuale di riferimento completo Unicode .