Latest web development tutorials

HTML-Zeichensatz

Um richtig eine HTML-Seite angezeigt wird, muss der Browser die Zeichen kennen eingestellt werden (die Zeichenkodierung).


HTML-Zeichensatz

In HTML, was ist der richtige Zeichencode ist?

HTML5 Standard - Zeichenkodierung UTF-8 ist .

Dies ist nicht immer der Fall. Frühe Netzwerk-Zeichencodierung ist ASCII-Code.

Später von HTML 2.0 in HTML 4.01, wurde ISO-8859-1 als Standard identifiziert.

Mit dem Aufkommen von HTML5 und XML, UTF-8 ist endlich da, eine Menge Zeichencodierung Probleme zu lösen.

Nachfolgend finden Sie eine kurze Übersicht über die Zeichencodierung Standards.


Am Anfang: ASCII

Computer-Informationen (Anzahl, Texte, Bilder) in der Elektronik ist binär 1 und 0 (01000101) zum Speichern.

Um die Speicherung von alphanumerischen Zeichen zu regeln, erstellt ASCII (vollständiger Name der American Standard Code for Information Interchange). Es ist definiert als jedes Zeichen mit einem einzigartigen siebenstelligen binären Unterstützung 0-9, Groß- / Kleinbuchstaben des Alphabets (az, AZ), und einige Sonderzeichen wie $ + gespeichert ist - () @ <>.

Da ASCII ein Byte verwendet (7 das Zeichen darstellt, zeigt ein Paritätsgetriebesteuerung), so kann es nur 128 verschiedene Zeichen darstellen. Es gibt 32 dieser Zeichen für die Verwendung als die anderen Steuerzwecke reserviert sind.

ASCII größte Nachteil ist, dass es nicht-englischen Buchstaben ausschließt.

ASCII ist noch heute weit verbreitet, insbesondere in großen Computersystemen.

Für einen Einblick in ASCII finden Sie die vollständige ASCII - Referenzhandbuch .


In Windows: ANSI

ANSI (auch als Windows 1252 bezeichnet), ist ein Windows 95 und Windows-Systeme vor dem Standardzeichensatz.

ANSI ASCII ist eine Erweiterung, es den internationalen Charakter verbunden. Es verwendet ein ganzes Byte (8 Bits) 256 verschiedene Zeichen darzustellen.

Da immer Windows-ANSI-Zeichen den Standard festgelegt, unterstützen alle Browser ANSI.

Für umfassende Verständnis von ANSI finden Sie die vollständige ANSI - Referenzhandbuch .


In HTML 4 sind: ISO-8859-1

Da die meisten Länder Zeichen als ASCII andere verwenden, ändern Sie die HTML 2.0-Standard, den Standard-Zeichenkodierung ISO-8859-1.

ISO-8859-1 ist ASCII erweitert, es schloss sich der internationalen Charakter. Und ANSI, verwendet es ein ganzes Byte (8 Bits) 256 verschiedene Zeichen darzustellen.

Note Wenn ein Browser ISO-8859-1 auf der Seite erkennt, in der Regel ist der Standard ANSI, weil zusätzlich ANSI bis 32 zusätzliche Zeichen, dass andere Aspekte des ANSI im wesentlichen äquivalent zu ISO-8859-1.

Wenn HTML 4 Seite einen anderen Zeichensatz ISO-8859-1 verwendet, müssen Sie in der <meta> -Tag angeben, wie folgt:

Beispiele

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

Note

HTML5 Standardzeichensatz ist UTF-8.
Alle HTML-4-Prozessoren unterstützen UTF-8, die alle HTML5 und XML-Prozessoren unterstützen UTF-8 und UTF-16.

Für umfassende Verständnis von ISO-8859-1 finden Sie die vollständige ISO-8859-1 - Referenzhandbuch .


In HTML5: Unicode (UTF-8)

Da Zeichensätze oben aufgeführt sind begrenzt, in einer mehrsprachigen Umgebung sind nicht kompatibel, so dass das Unicode Consortium (Unicode Consortium) entwickelt, um den Unicode-Standard (Unicode Standard).

Unicode-Standard deckt (fast) alle Zeichen, Satzzeichen und Symbole.

Unicode ermöglicht die Verarbeitung, Lagerung und Transport des Textes und plattformunabhängige Sprache.

HTML5 Standard - Zeichenkodierung UTF-8 ist .

Für umfassende Verständnis von Unicode (UTF-8) finden Sie die komplette Unicode - Referenzhandbuch .