프로젝트 작업 과정에서 우리는 종종 팀 간의 더 나은 협력과 더 나은 완전한 프로젝트를 촉진하기 위해 다양한 사양을 설정합니다. 우리는 종종 Google의 IM 소프트웨어 Gtalk에서 사용하는 Open XMPP 프로토콜과 같은 다양한 프로토콜을 듣습니다. 다른 IM 소프트웨어도 XMPP 프로토콜을 준수하는 한 GTALK와 함께 사용하고 전달할 수 있습니다. 인터넷에는 정보가 많지 않으며이 정보 자체는 독립적으로 존재합니다. 직렬로 연결하고 사용자에게 제시하는 방법 HTTP 프로토콜을 사용해야합니다.
동일한 토큰으로 브라우저마다 커널이 다르고 기본 스타일의 렌더링이 다르기 때문에 각 브라우저가 다른 브라우저에서 동일한 웹 문서에서 제시 한 스타일이 일관되도록하기 위해 각 브라우저가 따르는 규칙이 필요합니다. 이 규칙은 DocType 선언입니다.
인터넷은 상호 운용 가능하기 때문에 둘 이상의 웹 문서에는 데이터 교환이 포함될 수 있습니다. XML 언어를 사용하면 사용자가 태그를 사용자 정의 할 수 있으므로 교환 된 두 문서는 동일한 태그를 가질 수 있으므로 동일한 태그가 충돌합니다. 따라서 교환 문서에 존재할 수있는 동일한 태그를 구별하려면 네임 스페이스가 필요합니다.
XHTML은 HTML을 XML로 전환하는 언어로서 XML 언어로 사용자 정의 태그를 구현할 수 없으므로 XHMTL 문서의 네임 스페이스는 다음과 같습니다.
<html xmlns = http : //www.w3.org/1999/xhtml>
XMLNS는 소위 네임 스페이스 인 XHTML 네임 스페이스의 약어입니다. DocType 선언과 마찬가지로 XMLNS도 선언입니다. DocType 선언은 여전히 HTML 문서에 존재하는 것과 달리 XMLNS는 HTML 문서에 존재하지 않으며 일반적으로 볼 수있는 XMLN은 XHTML 문서에 나타납니다.
웹 페이지를 만들 때, 처음에 docType (문서 유형)를 선언하는 것 외에도 XHTML 문서 인 경우 네임 스페이스를 선언해야하며 세 번째는 웹 페이지 문서의 문자 인코딩 유형입니다.
<meta http-equiv = content-type content = text/html; charset = utf-8 ' />
브라우저에서 올바르게 해석하고 W3C로 확인하기 위해서는 각 XHTML 문서는 사용 된 문자 인코딩을 선언해야합니다. 여러 번, 웹 문서의 대부분의 차량 코드는 잘못된 문자 인코딩으로 인해 발생합니다.
UTF-8은 유니 코드의 가변 길이 인코딩 식입니다. 전 세계적으로 보편적 인 문자 인코딩으로서 점점 더 많은 웹 문서에서 사용되고 있습니다. UTF-8 문자 인코딩을 사용하는 웹 페이지는 다른 지역의 사용자가 동일한 웹 페이지에 액세스 할 때 다른 문자 인코딩으로 인한 차량 코드를 피할 수 있습니다.
그러나 대부분의 국내 웹 사이트, 특히 대형 포털 웹 사이트를 열면 문자 인코딩에 대한 진술은 UTF-8이 아니라 GB2312입니다.
<meta http-equiv = content-type content = text/html; charset = gb2312 ' />
물론 GB2312 외에도 GBK 또는 GB18030 인코딩을 사용하는 웹 사이트가 있습니다. 이 세 문자 인코딩은 단순화 된 중국어 세트에 속합니다. 즉, 컴퓨터에 단순화 된 중국어 세트가 설치되어 있지 않으면 GB2312로 인코딩 된 중국어 웹 페이지에 액세스 할 때 차량 코드가 표시됩니다.
GB2312 문자 인코딩을 사용할 때 다른 영역에서 사용자 액세스로 인해 차량 코드가 발생할 수 있으므로 UTF-8을 사용하지 않는 이유는 무엇입니까?
이유 중 하나는 역사적 이유 일 수있는 반면, 다른 더 중요한 이유는 두 인코딩의 다른 저장 방법으로 인해 다른 문서 크기가되어야합니다.
GB2312 문자 인코딩 세트를 사용할 때 중국어는 2 바이트를 차지하는 반면 UTF-8 인코딩에서 중국어가 차지하는 바이트의 수는 종종 3 바이트 또는 3 바이트 이상입니다. 따라서 동일한 중국어 문서의 경우 GB2312 문자 인코딩을 사용하는 저장량은 UTF-8 인코딩에 저장된 문서 크기보다 작습니다.
텍스트가 많고 방문한 중국 웹 사이트의 경우 GB2312로 인코딩 된 웹 페이지 문서를 사용하면 다운로드 및 전송에 많은 트래픽이 절약 될 수 있습니다. 또한 중국 웹 사이트의 사용자 그룹은 기본적으로 중국 사용자에게 잠겨 있기 때문에 많은 웹 사이트가 UTF-8 인코딩 대신 GB2312로 인코딩 된 이유입니다.
그러나 중국에는 텍스트와 방문이 많지 않은 웹 사이트는 많지 않습니다. 또한, 차량 코드의 문제가 짝을 이룰 수 있으므로 웹 페이지를 만들 때 UTF-8 인코딩을 사용하는 것이 좋습니다.
물론, 어떤 종류의 인코딩이 사용 되더라도 가장 중요한 것은 전체 사이트에서 사용하는 인코딩을 통합해야한다는 것입니다.
위의 방법 외에 문자 인코딩 선언의 경우 또 다른 선언 방법이 표시 될 수도 있습니다.
<meta http-equiv = content-language content = gb2312 ' />
<meta http-equiv = content-language content = zh-cn />
이 선언 방법은 이전 버전의 브라우저를 목표로합니다. 이 선언 방법은 브라우저가 일반적으로 업데이트 된 경우 오늘날 권장되지 않습니다.