Latest web development tutorials

Juego de caracteres HTML

Para visualizar correctamente una página HTML, el navegador debe conocer el conjunto de caracteres a utilizar (la codificación de caracteres).


Juego de caracteres HTML

En HTML, lo que es el código de caracteres es correcta?

HTML 5 caracteres por defecto de codificación es UTF-8.

Este no es siempre el caso. A principios de la red es la codificación de caracteres de código ASCII.

Más tarde, a partir de HTML 2.0 a HTML 4.01, ISO-8859-1 fue identificado como el estándar.

Con la aparición de HTML5 y XML, UTF-8 ha llegado finalmente, resolver muchos de los problemas de codificación de caracteres.

La siguiente es una breve descripción de los estándares de codificación de caracteres.


En el principio: ASCII

Información del equipo (número, texto, imágenes) en la electrónica es binario 1 y 0 (01000101) para almacenar.

Con el fin de regular el almacenamiento de caracteres alfanuméricos, creado ASCII (nombre completo del Código Estándar Americano para Intercambio de Información). Se define como cada carácter se almacena con un único soporte binario de siete dígitos 0-9, letras mayúsculas / minúsculas del alfabeto (az, AZ), y algunos caracteres especiales, como $ + - () @ <>.

Desde ASCII utiliza un byte (7 representa el carácter, una paridad indica control de la transmisión), por lo que sólo puede representar 128 caracteres diferentes. Hay 32 de estos caracteres están reservados para uso como los otros fines de control.

ASCII mayor inconveniente es que excluye las cartas no están en inglés.

ASCII se encuentra todavía en uso generalizado hoy en día, sobre todo en los grandes sistemas informáticos.

Para conocer a fondo ASCII, consulte el manual de referencia ASCII completo .


En Windows: ANSI

ANSI (también conocido como Windows-1252), es un sistema de Windows 95 y Windows anteriores al conjunto de caracteres por defecto.

ANSI ASCII es una extensión, que se unió al carácter internacional. Utiliza toda una byte (8 bits) para representar 256 caracteres diferentes.

Desde que se convirtió caracteres de Windows ANSI establece el valor por defecto, todos los navegadores soportan ANSI.

Para la comprensión en profundidad de la norma ANSI, por favor consulte el manual de referencia completo ANSI .


En HTML 4 son: ISO-8859-1

Como la mayoría de los países utilizan caracteres que no sean ASCII, el estándar HTML 2.0, cambiar el carácter por defecto la codificación ISO-8859-1.

ISO-8859-1 se extiende ASCII, que se unió al carácter internacional. Y ANSI, utiliza un byte completo (8 bits) para representar 256 caracteres diferentes.

nota Cuando un navegador detecta ISO-8859-1, en la página, por lo general el valor predeterminado es ANSI, porque además de ANSI 32 caracteres adicionales que otros aspectos de la norma ANSI sustancialmente equivalentes a ISO-8859-1.

Si la página HTML 4 utiliza un juego de caracteres diferente ISO-8859-1, es necesario especificar en la etiqueta <meta>, de la siguiente manera:

Ejemplos

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

nota

HTML5 juego de caracteres predeterminado es UTF-8.
Todo el soporte de HTML 4 procesadores UTF-8, todos HTML5 y soporte procesadores XML UTF-8 y UTF-16.

Para la comprensión en profundidad de la norma ISO-8859-1, consulte el Manual de referencia ISO-8859-1 completa .


En HTML5: Unicode (UTF-8)

Debido a que los juegos de caracteres enumerados anteriormente se limitan, en un entorno multilingüe no son compatibles, por lo que el Consorcio Unicode (Unicode Consortium) ha desarrollado el estándar Unicode (Unicode estándar).

cubiertas estándar Unicode (casi) todos los caracteres, signos de puntuación y símbolos.

Unicode permite el procesamiento, el almacenamiento y el transporte del texto, y el lenguaje independiente de la plataforma.

HTML 5 caracteres por defecto de codificación es UTF-8.

Para la comprensión en profundidad de Unicode (UTF-8), consulte el manual de referencia completa de Unicode .