HTML Manuale UTF-8 Riferimento
Il consorzio Unicode (Unicode Consortium)
Il consorzio Unicode (Unicode Consortium) ha sviluppato lo standard Unicode (Unicode Standard). Il loro obiettivo è quello di utilizzare il formato Unicode Transformation standard (ad esempio UTF, sta per Unicode Transformation Format) per sostituire i set di caratteri esistenti.
Lo standard Unicode è un'iniziativa di successo, in HTML, XML, Java, JavaScript, e-mail, ASP, PHP sono raggiunti. standard Unicode anche molti sistemi operativi e tutti i moderni browser supporto.
alleanza Unicode con le principali organizzazioni di sviluppo standard che hanno ISO, W3C, e ECMA.
set di caratteri Unicode
Unicode può essere implementata da diversi set di caratteri. La codifica più comunemente usato è UTF-8 e UTF-16:
字符集 | 描述 |
---|---|
UTF-8 | UTF8 中的字符可以是 1 到 4 字节长。UTF-8 可以代表 Unicode 标准中的任何字符。UTF-8 向后兼容 ASCII。UTF-8 是电子邮件和网页的首选编码。 |
UTF-16 | 16 位 Unicode 转换格式是一种可变长度的 Unicode 字符编码,能够编码整个 Unicode 指令表。UTF-16 主要用于操作系统和环境,如 Microsoft Windows、Java 和 .NET。 |
Suggerimento: Unicode primi 128 caratteri (ASCII-to-one corrispondenza) usa un valore ASCII dello stesso ottetto binario è codificato in modo che il testo ASCII valido codifica UTF-8 è anche conducendo efficace.
Suggerimento: HTML supporto 4 processori UTF-8, tutto il codice HTML 5 e processori XML supporto UTF-8 e UTF-16!
standard HTML5: Unicode UTF-8
Poiché le dimensioni set di caratteri ISO-8859 è limitato e non è compatibile in un ambiente multilingue, Unicode Consortium ha sviluppato lo standard Unicode.
coperture standard Unicode (quasi) tutti i personaggi, punteggiatura e simboli.
Unicode consente l'elaborazione, lo stoccaggio e il trasporto del testo, e il linguaggio indipendente dalla piattaforma.
HTML-5 nella codifica dei caratteri di default è UTF-8.
Qui ci sono alcuni set caratteri UTF-8 supporto HTML5:
字符集 | 十进制 | 十六进制 |
---|---|---|
C0 控制与基本的 Latin(C0 Controls and Basic Latin) | 0-127 | 0000-007F |
C1 控制与 Latin-1 的补充(C1 Controls and Latin-1 Supplement) | 128-255 | 0080-00FF |
Latin 扩展 A(Latin Extended-A) | 256-383 | 0100-017F |
Latin 扩展 B(Latin Extended-B) | 384-591 | 0180-024F |
Se la pagina HTML5 utilizza caratteri UTF-8 è diverso da, è necessario specificare nel tag <meta> nel modo seguente: