Latest web development tutorials

HTML UTF-8リファレンスマニュアル

ユニコードコンソーシアム(ユニコードコンソーシアム)

ユニコードコンソーシアム(ユニコードコンソーシアム)は、Unicode標準(Unicode標準)を開発しました。 彼らの目標は、標準のUnicode変換フォーマットを使用することです(つまりUTF、Unicode変換フォーマットの略)は、既存の文字セットを交換します。

Unicode標準は達成されているHTML、XMLやJava、JavaScriptの、Eメール、ASP、PHPで成功したイニシアチブです。 また、Unicode標準多くのオペレーティング・システムとすべての最新ブラウザのサポート。

ISO、W3C、およびECMAを持つ大手規格開発機関とUnicodeの提携。


Unicode文字セット

Unicodeは異なる文字セットによって実現することができます。 最も一般的に使用されるエンコーディングはUTF-8とUTF-16です。

字符集 描述
UTF-8 UTF8 中的字符可以是 1 到 4 字节长。UTF-8 可以代表 Unicode 标准中的任何字符。UTF-8 向后兼容 ASCII。UTF-8 是电子邮件和网页的首选编码。
UTF-16 16 位 Unicode 转换格式是一种可变长度的 Unicode 字符编码,能够编码整个 Unicode 指令表。UTF-16 主要用于操作系统和环境,如 Microsoft Windows、Java 和 .NET。

ヒント:Unicodeの最初の128文字(ASCII対1に対応)は、その有効なASCIIテキストをUTF-8エンコーディングにも効果的導通しているので、同じバイナリオクテットのASCII値が符号化されている使用しています。

ヒント:すべてのHTML 4プロセッサのサポートUTF-8、すべてのHTML 5とXMLプロセッサのサポートUTF-8とUTF-16!


HTML5規格:UnicodeのUTF-8

ISO-8859文字セットのサイズが限られており、多言語環境での互換性はありませんので、ユニコードコンソーシアムは、Unicode標準を開発しました。

ユニコード標準カバー(ほぼ)すべての文字、句読点や記号。

Unicodeは、処理、テキストの保管および輸送、およびプラットフォームに依存しない言語を可能にします。

HTML-5デフォルトの文字エンコーディングでは、UTF-8です。

ここではいくつかのHTML5サポートUTF-8文字セットは、次のとおりです。

字符集 十进制 十六进制
C0 控制与基本的 Latin(C0 Controls and Basic Latin) 0-127 0000-007F
C1 控制与 Latin-1 的补充(C1 Controls and Latin-1 Supplement) 128-255 0080-00FF
Latin 扩展 A(Latin Extended-A) 256-383 0100-017F
Latin 扩展 B(Latin Extended-B) 384-591 0180-024F

HTML5ページはUTF-8文字を使用している場合は、次のように<メタ>タグで指定する必要が異なっています:

<meta charset="ISO-8859-1">