A codificação da página da web é traduzida como codificação da página da web em inglês, que é uma biblioteca que especifica seu formato de codificação de caracteres específico em uma página da web.
O GBK é um padrão compatível com GB2312 após expansão com base no nacional nacional GB2312. O texto que codifica GBK é representado por bytes duplos, ou seja, os caracteres chineses e ingleses são representados por bytes duplos. Para distinguir chinês, o bit mais alto é definido como 1. GBK contém todos os caracteres chineses, é codificado nacional e tem pior versatilidade que o UTF8, mas o UTF8 ocupa um banco de dados maior que o GBK.
UTF-8: Unicode TransformationFormat-8bit, permite BOM, mas geralmente não contém BOM. É uma codificação de vários bytes usada para resolver caracteres internacionais. Ele usa 8 bits (ou seja, um byte) para inglês e 24 (três bytes) para a codificação chinesa. O UTF-8 contém personagens que todos os países ao redor do mundo precisam usar. É codificado internacionalmente e tem forte versatilidade. O texto codificado UTF-8 pode ser exibido em navegadores que suportam conjuntos de caracteres UTF8 em vários países. Se for a codificação UTF8, os chineses também podem ser exibidos no inglês dos estrangeiros, ou seja, e eles não precisam baixar o pacote de suporte ao idioma chinês do IE.
Embora a versão UTF-8 tenha boa compatibilidade internacional, o chinês exige 50% do espaço de armazenamento do banco de dados que a versão GBK/BIG5, por isso não é recomendável usar e é apenas para usuários que possuem requisitos especiais para compatibilidade internacional. Simplificando: para sites com mais chinês, é adequado usar a codificação GBK para salvar o espaço do banco de dados. Para sites com mais inglês, é adequado usar o UTF-8 para salvar o espaço do banco de dados.
Como converter GBK, GB2312, etc. para UTF8? GBK, GB2312, etc. e UTF8 devem ser codificados através do Unicode para se converter: GBK, GB2312-UNICODE-UTF8; UTF8-UNICODE-GBK, GB2312. Usando o salvamento do Windows Notepad, você pode converter entre os métodos de codificação GBK, Unicode, Unicode Big Endian e UTF-8.
Como fazer o navegador reconhecer corretamente a codificação da Web? Geralmente, deve haver a seguinte frase em uma página da web: <meta http-equiv = content-type content = text/html; charset = gb2312>, indicando que a codificação do conjunto de caracteres desta página da web é GB2312. (ou UTF-8)
Às vezes, a página é codificada especificada, por que às vezes parece ilegal? Isso pode ocorrer porque a codificação da declaração da página é inconsistente com o próprio arquivo. Muitas vezes, é causado pela abertura da página com uma codificação de erro e salvando -a ou usando algum software FTP para modificar o arquivo on -line, como o foteftp, o que faz com que a codificação do software seja convertida e configurada incorretamente. No momento, use o bloco de notas do Window para abri -lo e salve como a codificação correspondente para resolver o problema.
Ao usar o IE como navegador em sistemas operacionais do Windows, esse problema ocorre geralmente: ao navegar nas páginas da Web codificadas com o UTF-8, o navegador não pode reconhecer automaticamente a codificação usada pela página, mesmo que a página da web tenha declarado o formato de codificação: <meta http-equiv = content-type = text/html; charset = utf-8 />, que causa algumas páginas que contêm a codificação chinesa UTF-8 para produzir saída em branco. Se você estiver usando navegadores do Firefox ou Sarafi, isso não causará esse problema. Isso ocorre porque quando o IE analisa a codificação da Web, as tags no HTML são preferidas e, em seguida, as mensagens no cabeçalho HTTP são exatamente o oposto.
Como o UTF-8 representa um homem em 3 bytes, o GB2312 ou BIG5 comum são dois. Ao emitir a página, devido aos motivos acima, quando o navegador analisa e produz o conteúdo do <título> </title>, se houver caracteres estranhos de largura completa na frente do </title>, meio caractere chinês aparecerá quando o IE analisar UTF-8 como dois bytes. Nesse momento, o caractere meio chinês será combinado com o <title> <title> <title>, fazendo com que a página inteira esteja vazia e saída. Neste momento, se você olhar para o arquivo de origem, descobrirá que a página inteira foi realmente emitida, mas o navegador não exibe o conteúdo. A solução mais fácil é colocar <meta http-equiv = content-type content = text/html; charset = utf-8 /> antes de <Title> </title>.