Latest web development tutorials

HTML文字セット

正しくHTMLページを表示するには、ブラウザが使用する文字セット(文字エンコーディング)を知っている必要があります。


HTML文字セット

HTMLでは、正しい文字コードは何ですか?

HTML5デフォルトの文字エンコーディングはUTF-8です。

これは必ずしもそうではありません。 初期のネットワークの文字エンコーディングはASCIIコードです。

その後、HTML 2.0からHTML 4.01に、ISO-8859-1は、標準として同定されました。

HTML5およびXMLの出現により、UTF-8は、最終的に文字エンコーディングの問題の多くを解決するため、到着しました。

以下は、文字エンコーディング標準の簡単な概要です。


初めに:ASCII

エレクトロニクスのコンピュータ情報(番号、テキスト、画像)は、格納するための2進数の1と0(01000101)です。

英数字のストレージを調整するためには、ASCII(情報交換用米国標準コードの完全な名前)を作成しました。 各文字はユニークな7桁のバイナリをサポート0-9に格納されているのように定義されている、$など、アルファベットの大文字/小文字(aからz、AからZ)、およびいくつかの特殊文字、+ - !()@ <>。

ASCIIバイトを使用するので(7文字を表し、パリティは、送信制御を示している)ので、それだけで128種類の文字を表すことができます。 これらの文字の32は、他の制御目的として使用するために予約されているがあります。

ASCII最大の欠点は、それが、英語以外の文字を除外することです。

ASCIIは、特に大規模なコンピュータシステムでは、広く使用され、今日でもあります。

ASCIIへの洞察は、以下を参照してくださいフルASCIIリファレンスマニュアルを


Windowsの場合:ANSI

ANSIは、(また、Windows-1252としても知られている)、デフォルトの文字セットの前にWindows 95とWindowsシステムです。

ANSI ASCIIは、それが国際的な文字に入社し、拡張したものです。 これは、256種類の文字を表現するために全体のバイト(8ビット)を使用しています。

なってWindowsのANSI文字がデフォルトを設定するので、すべてのブラウザがANSIをサポートしています。

ANSIの深い理解は、以下を参照してください完全なANSIリファレンスマニュアルを


HTML 4では、次のとおりです。ISO-8859-1

ほとんどの国は、ASCII以外の文字、HTML 2.0標準を使用しているので、デフォルトの文字エンコーディングのISO-8859-1を変更します。

ISO-8859-1はASCIIを拡張され、それが国際的な文字に参加しました。 およびANSIは、それは、256種類の文字を表現するために全体のバイト(8ビット)を使用しています。

ノート ブラウザがページにISO-8859-1を検出した場合、通常はデフォルトが原因ISO-8859-1と実質的に同等のANSIの他の側面のANSI 32の余分な文字に加え、ANSIです。

HTML 4ページが別の文字セットISO-8859-1を使用している場合は、次のように、<メタ>タグで指定する必要があります。

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

ノート

HTML5デフォルトの文字セットがUTF-8です。
すべてのHTML 4プロセッサのサポートUTF-8、HTML5およびXMLプロセッサのすべてがUTF-8とUTF-16をサポートしています。

ISO-8859-1の深い理解は、以下を参照してくださいフルISO-8859-1リファレンスマニュアルを


HTML5では:ユニコード(UTF-8)

上記の文字セットが制限されているため、多言語環境での互換性はありませんので、ユニコードコンソーシアム(ユニコードコンソーシアム)は、Unicode標準(Unicode標準)を開発しました。

ユニコード標準カバー(ほぼ)すべての文字、句読点や記号。

Unicodeは、処理、テキストの保管および輸送、およびプラットフォームに依存しない言語を可能にします。

HTML5デフォルトの文字エンコーディングはUTF-8です。

ユニコード(UTF-8)の深い理解は、以下を参照してください完全なUnicodeのリファレンスマニュアルを