Latest web development tutorials

HTML 문자 집합

올바르게 HTML 페이지를 디스플레이하기 위해 브라우저를 사용하도록 문자 세트 (문자 인코딩)을 알아야한다.


HTML 문자 집합

HTML에서 올바른 문자 코드가 무엇입니까?

HTML5 기본 문자 인코딩은 UTF-8입니다.

항상 그런 것은 아니다. 초기 네트워크 문자 인코딩은 ASCII 코드이다.

나중에, 4.01를 HTML로 HTML 2.0, ISO-8859-1 표준으로 확인되었다.

HTML5 및 XML의 출현으로, UTF-8은 마지막 문자 인코딩 많은 문제를 해결 도착.

다음은 문자 인코딩 표준의 간단한 개요이다.


태초에 : ASCII

전자 컴퓨터 정보 (번호, 텍스트, 이미지)를 저장하기위한 이진 1과 0 (01000101)입니다.

영숫자의 저장을 조절하기 위해, ASCII를 (정보 교환을위한 미국 표준 코드의 전체 이름) 만들었습니다. 각 캐릭터는 고유 한 7 자리 바이너리 지원을 0-9로 저장됩니다 같이 정의되어, 같은 $와 같은 알파벳의 상단 / 소문자 (AZ, AZ), 일부 특수 문자 + -! () @ <>.

ASCII가 바이트를 사용하므로 (7 문자를 나타내는 패리티 전송 제어를 나타냄), 그래서 128 다른 문자를 나타낼 수있다. 이러한 문자 (32)가 다른 제어 목적으로 사용하기 위해 예약되어 있습니다.

ASCII 가장 큰 단점은 영어가 아닌 문자를 제외한다는 것이다.

ASCII 특히 대형 컴퓨터 시스템에서 널리 사용 오늘날입니다.

ASCII에 대한 통찰력을 참조하시기 바랍니다 전체 ASCII 참조 설명서를 .


Windows의 경우 : ANSI

ANSI (또한 윈도우 1252라고도 함), 기본 문자 세트에 이전 Windows 95 및 Windows 시스템이다.

ANSI의 ASCII는 국제 문자를 결합, 확장입니다. 그것은 256 개의 다른 특성을 나타내는 전체 바이트 (8 비트)를 사용한다.

되는 윈도우 ANSI 문자는 기본 설정 때문에 모든 브라우저가 ANSI를 지원합니다.

ANSI에 대한 심층적 인 이해를 참조하십시오 전체 ANSI 참조 설명서를 .


HTML 4 : ISO-8859-1

대부분의 국가가 ASCII 이외의 문자를 사용하기 때문에, HTML 2.0 표준은 ISO-8859-1 인코딩 기본 문자를 변경합니다.

ISO-8859-1은 국제 문자에 합류, ASCII를 확장된다. 그리고 ANSI, 그것은 256 개의 다른 특성을 나타내는 전체 바이트 (8 비트)를 사용한다.

주의 브라우저가 페이지에 ISO-8859-1을 감지하면 추가로 ISO-8859-1에 ANSI의 다른 측면은 실질적으로 동등한 32 여분의 문자를 ANSI로하기 때문에, 일반적으로 기본은 ANSI입니다.

HTML 4 페이지가 다른 문자 집합 ISO-8859-1을 사용하는 경우 다음과 같이는 <메타> 태그에 지정해야합니다 :

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

주의

HTML5 기본 문자 세트는 UTF-8입니다.
모든 HTML 4 프로세서 지원 UTF-8 모두 HTML5 및 XML 프로세서 지원 UTF-8 및 UTF-16.

ISO-8859-1에 대한 심층적 인 이해를 참조하십시오 전체 ISO-8859-1 참조 설명서를 .


HTML5에서 유니 코드 (UTF-8)

위에 나열된 문자 세트가 한정되어 있기 때문에, 다국어 환경에서 호환되지 않는, 그래서 유니 코드 컨소시엄 (유니 코드 컨소시엄) 유니 코드 표준 (유니 코드 표준)을 개발.

유니 코드 표준 커버 (거의) 모든 문자, 문장 부호 및 기호.

유니 코드 처리, 저장 및 텍스트의 운송 및 플랫폼 독립적 인 언어를 할 수 있습니다.

HTML5 기본 문자 인코딩은 UTF-8입니다.

유니 코드 (UTF-8)에 대한 심층적 인 이해를 참조하시기 바랍니다 완전한 유니 코드 참조 설명서를 .