HTML文字セット
正しくHTMLページを表示するには、ブラウザが使用する文字セット(文字エンコーディング)を知っている必要があります。
HTML文字セット
HTMLでは、正しい文字コードは何ですか?
HTML5デフォルトの文字エンコーディングはUTF-8です。
これは必ずしもそうではありません。 初期のネットワークの文字エンコーディングはASCIIコードです。
その後、HTML 2.0からHTML 4.01に、ISO-8859-1は、標準として同定されました。
HTML5およびXMLの出現により、UTF-8は、最終的に文字エンコーディングの問題の多くを解決するため、到着しました。
以下は、文字エンコーディング標準の簡単な概要です。
初めに:ASCII
エレクトロニクスのコンピュータ情報(番号、テキスト、画像)は、格納するための2進数の1と0(01000101)です。
英数字のストレージを調整するためには、ASCII(情報交換用米国標準コードの完全な名前)を作成しました。 各文字はユニークな7桁のバイナリをサポート0-9に格納されているのように定義されている、$など、アルファベットの大文字/小文字(aからz、AからZ)、およびいくつかの特殊文字、+ - !()@ <>。
ASCIIバイトを使用するので(7文字を表し、パリティは、送信制御を示している)ので、それだけで128種類の文字を表すことができます。 これらの文字の32は、他の制御目的として使用するために予約されているがあります。
ASCII最大の欠点は、それが、英語以外の文字を除外することです。
ASCIIは、特に大規模なコンピュータシステムでは、広く使用され、今日でもあります。
ASCIIへの洞察は、以下を参照してくださいフルASCIIリファレンスマニュアルを 。
Windowsの場合:ANSI
ANSIは、(また、Windows-1252としても知られている)、デフォルトの文字セットの前にWindows 95とWindowsシステムです。
ANSI ASCIIは、それが国際的な文字に入社し、拡張したものです。 これは、256種類の文字を表現するために全体のバイト(8ビット)を使用しています。
なってWindowsのANSI文字がデフォルトを設定するので、すべてのブラウザがANSIをサポートしています。
ANSIの深い理解は、以下を参照してください完全なANSIリファレンスマニュアルを 。
HTML 4では、次のとおりです。ISO-8859-1
ほとんどの国は、ASCII以外の文字、HTML 2.0標準を使用しているので、デフォルトの文字エンコーディングのISO-8859-1を変更します。
ISO-8859-1はASCIIを拡張され、それが国際的な文字に参加しました。 およびANSIは、それは、256種類の文字を表現するために全体のバイト(8ビット)を使用しています。
ブラウザがページにISO-8859-1を検出した場合、通常はデフォルトが原因ISO-8859-1と実質的に同等のANSIの他の側面のANSI 32の余分な文字に加え、ANSIです。 |
HTML 4ページが別の文字セットISO-8859-1を使用している場合は、次のように、<メタ>タグで指定する必要があります。
例
HTML5デフォルトの文字セットがUTF-8です。 |
ISO-8859-1の深い理解は、以下を参照してくださいフルISO-8859-1リファレンスマニュアルを 。
HTML5では:ユニコード(UTF-8)
上記の文字セットが制限されているため、多言語環境での互換性はありませんので、ユニコードコンソーシアム(ユニコードコンソーシアム)は、Unicode標準(Unicode標準)を開発しました。
ユニコード標準カバー(ほぼ)すべての文字、句読点や記号。
Unicodeは、処理、テキストの保管および輸送、およびプラットフォームに依存しない言語を可能にします。
HTML5デフォルトの文字エンコーディングはUTF-8です。
ユニコード(UTF-8)の深い理解は、以下を参照してください完全なUnicodeのリファレンスマニュアルを 。