Latest web development tutorials

HTML Manuale UTF-8 Riferimento

Il consorzio Unicode (Unicode Consortium)

Il consorzio Unicode (Unicode Consortium) ha sviluppato lo standard Unicode (Unicode Standard). Il loro obiettivo è quello di utilizzare il formato Unicode Transformation standard (ad esempio UTF, sta per Unicode Transformation Format) per sostituire i set di caratteri esistenti.

Lo standard Unicode è un'iniziativa di successo, in HTML, XML, Java, JavaScript, e-mail, ASP, PHP sono raggiunti. standard Unicode anche molti sistemi operativi e tutti i moderni browser supporto.

alleanza Unicode con le principali organizzazioni di sviluppo standard che hanno ISO, W3C, e ECMA.


set di caratteri Unicode

Unicode può essere implementata da diversi set di caratteri. La codifica più comunemente usato è UTF-8 e UTF-16:

字符集 描述
UTF-8 UTF8 中的字符可以是 1 到 4 字节长。UTF-8 可以代表 Unicode 标准中的任何字符。UTF-8 向后兼容 ASCII。UTF-8 是电子邮件和网页的首选编码。
UTF-16 16 位 Unicode 转换格式是一种可变长度的 Unicode 字符编码,能够编码整个 Unicode 指令表。UTF-16 主要用于操作系统和环境,如 Microsoft Windows、Java 和 .NET。

Suggerimento: Unicode primi 128 caratteri (ASCII-to-one corrispondenza) usa un valore ASCII dello stesso ottetto binario è codificato in modo che il testo ASCII valido codifica UTF-8 è anche conducendo efficace.

Suggerimento: HTML supporto 4 processori UTF-8, tutto il codice HTML 5 e processori XML supporto UTF-8 e UTF-16!


standard HTML5: Unicode UTF-8

Poiché le dimensioni set di caratteri ISO-8859 è limitato e non è compatibile in un ambiente multilingue, Unicode Consortium ha sviluppato lo standard Unicode.

coperture standard Unicode (quasi) tutti i personaggi, punteggiatura e simboli.

Unicode consente l'elaborazione, lo stoccaggio e il trasporto del testo, e il linguaggio indipendente dalla piattaforma.

HTML-5 nella codifica dei caratteri di default è UTF-8.

Qui ci sono alcuni set caratteri UTF-8 supporto HTML5:

字符集 十进制 十六进制
C0 控制与基本的 Latin(C0 Controls and Basic Latin) 0-127 0000-007F
C1 控制与 Latin-1 的补充(C1 Controls and Latin-1 Supplement) 128-255 0080-00FF
Latin 扩展 A(Latin Extended-A) 256-383 0100-017F
Latin 扩展 B(Latin Extended-B) 384-591 0180-024F

Se la pagina HTML5 utilizza caratteri UTF-8 è diverso da, è necessario specificare nel tag <meta> nel modo seguente:

Esempi

<meta charset="ISO-8859-1">