คู่มือการใช้งาน HTML UTF-8 อ้างอิง
ยูนิโค้ด Consortium (Unicode Consortium)
ยูนิโค้ด Consortium (Unicode Consortium) พัฒนามาตรฐาน Unicode (มาตรฐาน Unicode) เป้าหมายของพวกเขาคือการใช้มาตรฐาน Unicode รูปแบบการเปลี่ยนแปลง (เช่น UTF ย่อมาจากรูปแบบการแปลง Unicode) ที่จะเปลี่ยนชุดตัวอักษรที่มีอยู่
มาตรฐาน Unicode เป็นความคิดริเริ่มที่ประสบความสำเร็จในรูปแบบ HTML, XML, Java, JavaScript, E-mail, ASP, PHP จะประสบความสำเร็จ มาตรฐาน Unicode ยังระบบปฏิบัติการจำนวนมากและทุกการสนับสนุนเบราว์เซอร์ที่ทันสมัย
พันธมิตร Unicode กับองค์กรพัฒนามาตรฐานชั้นนำที่มี ISO, W3C และ ECMA
ชุดอักขระ Unicode
Unicode สามารถดำเนินการโดยชุดตัวอักษรที่แตกต่างกัน การเข้ารหัสที่ใช้กันมากที่สุดเป็น UTF-8 และ UTF-16:
字符集 | 描述 |
---|---|
UTF-8 | UTF8 中的字符可以是 1 到 4 字节长。UTF-8 可以代表 Unicode 标准中的任何字符。UTF-8 向后兼容 ASCII。UTF-8 是电子邮件和网页的首选编码。 |
UTF-16 | 16 位 Unicode 转换格式是一种可变长度的 Unicode 字符编码,能够编码整个 Unicode 指令表。UTF-16 主要用于操作系统和环境,如 Microsoft Windows、Java 和 .NET。 |
เคล็ดลับ: Unicode 128 ตัวอักษรแรก (ASCII ต่อหนึ่งการติดต่อ) ใช้ค่า ASCII ของ octet ไบนารีเดียวกันมีการเข้ารหัสเพื่อให้ข้อความ ASCII ที่ถูกต้องเข้ารหัส UTF-8 นอกจากนี้ยังมีการดำเนินการที่มีประสิทธิภาพ
เคล็ดลับ: การสนับสนุน HTML ทั้งหมด 4 โปรเซสเซอร์ UTF-8 ทั้งหมด HTML 5 และประมวลผล XML สนับสนุน UTF-8 และ UTF-16!
มาตรฐาน HTML5: Unicode UTF-8
เนื่องจากขนาดชุดอักขระ ISO-8859 มี จำกัด และเข้ากันไม่ได้ในสภาพแวดล้อมที่พูดได้หลายภาษาที่ Unicode Consortium พัฒนามาตรฐาน Unicode
Unicode ครอบคลุมมาตรฐาน (เกือบ) ทุกตัวอักษรเครื่องหมายวรรคตอนและสัญลักษณ์
Unicode ช่วยให้การประมวลผลการจัดเก็บและการขนส่งของข้อความและภาษาแพลตฟอร์ม
HTML-5 ในการเข้ารหัสอักขระเริ่มต้นเป็น UTF-8
นี่คือบางส่วนสนับสนุน HTML5 ชุด UTF-8 ตัวอักษร:
字符集 | 十进制 | 十六进制 |
---|---|---|
C0 控制与基本的 Latin(C0 Controls and Basic Latin) | 0-127 | 0000-007F |
C1 控制与 Latin-1 的补充(C1 Controls and Latin-1 Supplement) | 128-255 | 0080-00FF |
Latin 扩展 A(Latin Extended-A) | 256-383 | 0100-017F |
Latin 扩展 B(Latin Extended-B) | 384-591 | 0180-024F |
หากหน้า HTML5 ใช้อักขระ UTF-8 จะแตกต่างจากที่คุณจะต้องระบุใน <meta> แท็กดังนี้