Durante el proceso de trabajo del proyecto, a menudo establecemos diversas especificaciones para facilitar una mejor cooperación entre los equipos y mejores proyectos completos; A menudo escuchamos varios protocolos, como el protocolo Open XMPP utilizado por el software IM GTALK de Google. Mientras otro software IM también cumpla con el Protocolo XMPP, se puede usar y comunicarse con GTALK; No hay cuenta de información en Internet, y esta información misma existe de forma independiente. Cómo conectarlo en serie y presentarlo a los usuarios requiere el uso del protocolo HTTP.
Del mismo modo, debido a que los navegadores tienen diferentes núcleos y diferentes representaciones de estilos predeterminados, necesitan una regla que siga cada navegador para garantizar que los estilos presentados por el mismo documento web en diferentes navegadores sean consistentes. Esta regla es la Declaración de Doctype.
Debido a que Internet es interoperable, cualquiera o más documentos web pueden involucrar el intercambio de datos. Debido a que el idioma XML permite a los usuarios personalizar las etiquetas, cualquiera de los dos documentos intercambiados puede tener las mismas etiquetas, lo que resulta en conflictos de las mismas etiquetas. Por lo tanto, se necesita un espacio de nombres para distinguir las mismas etiquetas que pueden existir en el documento de intercambio.
Como lenguaje para la transición de HTML a XML, XHTML no puede implementar etiquetas definidas por el usuario en lenguaje XML, por lo que los espacios de nombres en los documentos XHMTL son las mismas:
<html xmlns = http: //www.w3.org/1999/xhtml>
XMLNS es la abreviatura del espacio de nombres XHTML, que es el llamado espacio de nombres. Al igual que la Declaración de Doctype, XMLNS también es una declaración. A diferencia de la declaración de doctype todavía existe en el documento HTML, los XMLN no existen en el documento HTML, y los XMLN que generalmente vemos aparecen en el documento XHTML.
Al hacer una página web, además de declarar DOCTYPE (tipo de documento) al principio, si es un documento XHTML, también necesita declarar el espacio de nombres, y la tercera cosa para declarar es el tipo de codificación de caracteres del documento de la página web:
<meta http-oquiv = content-type content = text/html; charset = utf-8 ' />
Para ser interpretado correctamente por el navegador y verificado por W3C, cada documento XHTML debe declarar la codificación de caracteres utilizada. Muchas veces, la mayoría de los códigos confusos en documentos web son causados por una codificación de carácter incorrecto.
UTF-8 es una expresión de codificación de longitud variable de Unicode. Como una codificación de personajes universales globalmente, se está utilizando en más y más documentos web. Las páginas web que utilizan la codificación de caracteres UTF-8 pueden maximizar la evitación del código confuso causado por diferentes codificaciones de caracteres cuando los usuarios en diferentes regiones acceden a la misma página web.
Pero cuando abrimos la mayoría de los sitios web nacionales, especialmente los sitios web de portales grandes, la declaración sobre la codificación de caracteres no es UTF-8, sino GB2312:
<meta http-oquiv = content-type content = text/html; charset = GB2312 ' />
Por supuesto, además de GB2312, hay algunos sitios web que usan la codificación GBK o GB18030. Estas tres codificaciones de personajes pertenecen al conjunto de personajes chino simplificado. Es decir, si una computadora no tiene un conjunto de caracteres chino simplificado instalado, cuando accede a una página web china con carácter codificado como GB2312, se muestra el código confuso.
Dado que el código confuso puede ocurrir debido al acceso al usuario en diferentes regiones cuando se usa la codificación de caracteres GB2312, ¿por qué no usar UTF-8?
Una de las razones puede ser razones históricas, mientras que la otra razón más importante debe ser los diferentes tamaños de documentos debido a los diferentes métodos de almacenamiento de las dos codificaciones.
Al usar el conjunto de codificación de caracteres GB2312, un personaje chino ocupa 2 bytes, mientras que el número de bytes ocupados por un personaje chino en la codificación UTF-8 a menudo es 3 bytes, o incluso más de 3 bytes. Por lo tanto, para el mismo documento chino, el volumen de almacenamiento utilizando la codificación de caracteres GB2312 es menor que el tamaño del documento almacenado en la codificación UTF-8.
Para los sitios web chinos con mucho texto y muchas visitas, el uso de documentos de página web codificada por GB2312 puede guardar mucho tráfico en la descarga y la transmisión. Además, debido a que el grupo de usuarios de sitios web chinos está básicamente bloqueado en usuarios chinos, por lo que muchos sitios web usan GB2312 codificados en lugar de UTF-8 codificados.
Sin embargo, no hay muchos sitios web con muchos mensajes de texto y visitas en China. Además, el problema del código confuso puede emparejarse, por lo que se recomienda usar la codificación UTF-8 al crear páginas web.
Por supuesto, no importa qué tipo de codificación se use, lo más importante es que la codificación utilizada por todo el sitio debe ser unificada.
Para las declaraciones de codificación de personajes además del método anterior, también puede ver otro método de declaración:
<meta http-oquiv = content-language content = gb2312 ' />
<meta http-oquiv = content-language content = zh-cn />
Este método de declaración está dirigido a versiones antiguas de navegadores. Este método de declaración no se recomienda hoy cuando los navegadores se han actualizado generalmente.