Durante o processo de trabalho do projeto, geralmente estabelecemos várias especificações para facilitar uma melhor cooperação entre as equipes e os projetos melhores completos; Frequentemente, ouvimos vários protocolos, como o protocolo Open XMPP usado pelo software IM GTalk do Google. Enquanto outro software de IM também está em conformidade com o protocolo XMPP, ele poderá ser usado e comunicado com GTalk; Não há contagem de informações na Internet, e essas informações em si existam de forma independente. Como conectá -lo em série e apresentá -lo aos usuários requer o uso do protocolo HTTP.
Da mesma forma, como os navegadores têm diferentes kernels e diferentes renderizações dos estilos padrão, eles precisam de uma regra que cada navegador segue para garantir que os estilos apresentados pelo mesmo documento da Web em diferentes navegadores sejam consistentes. Esta regra é a Declaração Doctype.
Como a Internet é interoperável, dois ou mais documentos da Web podem envolver troca de dados. Como o idioma XML permite que os usuários personalizem tags, quaisquer dois documentos trocados podem ter as mesmas tags, resultando em conflitos das mesmas tags. Portanto, é necessário um espaço para nome para distinguir as mesmas tags que podem existir no documento do Exchange.
Como um idioma para a transição de HTML para XML, o XHTML não pode implementar tags definidos pelo usuário no idioma XML, portanto os espaços para nome nos documentos XHMTL são os mesmos:
<html xmlns = http: //www.w3.org/1999/xhtml>
XMLNS é a abreviação do espaço para nome XHTML, que é o chamado namespace. Como a declaração Doctype, o XMLNS também é uma declaração. Ao contrário da declaração Doctype ainda existe no documento HTML, o XMLNS não existe no documento HTML, e os XMLNs que geralmente vemos aparecem no documento XHTML.
Ao fazer uma página da web, além de declarar Doctype (tipo de documento) no início, se for um documento XHTML, ele também precisa declarar o espaço para nome, e a terceira coisa a declarar é o tipo de codificação de caracteres do documento da página da web:
<meta http-equiv = content-type content = text/html; charset = utf-8 ' />
Para ser interpretado corretamente pelo navegador e verificado pelo W3C, cada documento XHTML deve declarar a codificação do caractere usada. Muitas vezes, a maioria dos códigos distorcidos nos documentos da Web é causada por codificação incorreta de caracteres.
O UTF-8 é uma expressão de codificação de comprimento variável do unicode. Como uma codificação global de caracteres universais, ele está sendo usado em cada vez mais documentos da Web. As páginas da Web usando a codificação de caracteres UTF-8 podem maximizar a prevenção de um código distorcido causado por diferentes codificações de caracteres quando os usuários em diferentes regiões acessam a mesma página da web.
Mas quando abrimos a maioria dos sites domésticos, especialmente os grandes sites de portal, a declaração sobre a codificação de caracteres não é UTF-8, mas GB2312:
<meta http-equiv = content-type content = text/html; charset = gb2312 ' />
Obviamente, além do GB2312, existem alguns sites que usam a codificação GBK ou GB18030. Essas três codificações de caracteres pertencem ao conjunto de caracteres chineses simplificados. Ou seja, se um computador não possui um conjunto de caracteres chineses simplificado instalado, quando acessa uma página da Web chinesa com o caractere codificado como GB2312, o código ilegal é exibido.
Como o código iluminado pode ocorrer devido ao acesso ao usuário em diferentes regiões ao usar a codificação de caracteres GB2312, por que não usar o UTF-8?
Uma das razões pode ser as razões históricas, enquanto a outra razão mais importante deve ser os diferentes tamanhos dos documentos devido a diferentes métodos de armazenamento das duas codificações.
Ao usar o conjunto de codificação de caracteres GB2312, um caractere chinês ocupa 2 bytes, enquanto o número de bytes ocupados por um caractere chinês na codificação UTF-8 é frequentemente 3 bytes, ou mais de 3 bytes. Portanto, para o mesmo documento chinês, o volume de armazenamento usando a codificação de caracteres GB2312 é menor que o tamanho do documento armazenado na codificação UTF-8.
Para sites chineses com muito texto e muitas visitas, o uso de documentos da página da web codificados por GB2312 pode economizar muito tráfego em download e transmissão. Além disso, como o grupo de usuários de sites chineses está basicamente bloqueado nos usuários chineses, e é por isso que muitos sites usam codificados por GB2312 em vez de codificados por UTF-8.
No entanto, não há muitos sites com muito texto e visitas na China. Além disso, o problema do código ilegal pode ser emparelhado, por isso é recomendável usar a codificação UTF-8 ao criar páginas da web.
Obviamente, não importa que tipo de codificação seja usado, o mais importante é que a codificação usada por todo o site deve ser unificada.
Para declarações de codificação de caracteres Além do método acima, você também pode ver outro método de declaração:
<meta http-equiv = conteúdo-linguagem de conteúdo = gb2312 ' />
<meta http-equiv = conteúdo-linguagem de conteúdo = zh-cn />
Este método de declaração é destinado a versões antigas dos navegadores. Este método de declaração não é recomendado hoje quando os navegadores foram geralmente atualizados.