Die Webseiten -Codierung wird als Webseiten -Codierung in Englisch übersetzt. Dies ist eine Bibliothek, die das spezifische Charakter -Codierungsformat in einer Webseite angibt.
GBK ist ein Standard, der nach der Ausdehnung des Nationalen Standards GB2312 mit GB2312 kompatibel ist. Die Textcodierung von GBK wird durch Doppelbytes dargestellt, dh sowohl chinesische als auch englische Zeichen werden durch Doppelbytes dargestellt. Um Chinesisch zu unterscheiden, wird das höchste Bit auf 1. GBK eingestellt. GBK enthält alle chinesischen Zeichen, ist national codiert und hat eine schlechtere Vielseitigkeit als UTF8, aber UTF8 nimmt eine größere Datenbank ein als GBK.
UTF-8: Unicode TransformationFormat-8bit ermöglicht die BOM, enthält jedoch normalerweise keine BOM. Es handelt sich um eine Multi-Byte-Kodierung, die zur Lösung internationaler Charaktere verwendet wird. Es verwendet 8 Bit (d. H. Ein Byte) für Englisch und 24 (drei Bytes), damit Chinesen codieren können. UTF-8 enthält Charaktere, die alle Länder auf der ganzen Welt verwenden müssen. Es ist international codiert und hat eine starke Vielseitigkeit. Der utf-8-codierte Text kann auf Browsern angezeigt werden, die UTF8-Zeichensets in verschiedenen Ländern unterstützen. Wenn es sich um eine UTF8 -Codierung handelt, können Chinesen auch auf dem englischen IE der Ausländer angezeigt werden, und sie müssen das IE -Unterstützungspaket in IE nicht herunterladen.
Obwohl die UTF-8-Version eine gute internationale Kompatibilität aufweist, benötigen Chinesen 50% des Datenbankspeicherraums als die GBK/Big5-Version, sodass nicht empfohlen wird, sie zu verwenden, und ist nur für Benutzer, die spezielle Anforderungen an internationale Kompatibilität haben. Einfach ausgedrückt: Für Websites mit mehr Chinesen ist es geeignet, GBK -Codierung zu verwenden, um den Datenbankraum zu speichern. Für Websites mit mehr Englisch ist es geeignet, UTF-8 zu verwenden, um den Datenbankraum zu speichern.
Wie konvertieren Sie GBK, GB2312 usw. in UTF8? GBK, GB2312 usw. und UTF8 müssen über Unicode codiert werden, um sich gegenseitig umzuwandeln: GBK, GB2312-Unicode-UTF8; UTF8-Unicode-GBK, GB2312. Mit dem Speichern von Windows Notepad können Sie zwischen GBK, Unicode, Unicode Big Endian und UTF-8-Codierungsmethoden konvertieren.
Wie kann der Browser die Web -Codierung korrekt erkennen? Im Allgemeinen muss auf einer Webseite der folgende Satz sein: <meta http-äquiv = content-type content = text/html; charSet = gb2312>, was angibt, dass die Zeichensatzcodierung dieser Webseite GB2312 ist. (oder UTF-8)
Manchmal hat die Seite Codierung angegeben. Warum erscheint sie manchmal verstümmelt? Dies kann daran liegen, dass die Kodierung der Seitenerklärung nicht mit der Datei selbst vereinbar ist. Es wird häufig durch das Öffnen der Seite mit einer Fehlercodierung und Speichern von FTP -Software verursacht, um die Datei online zu ändern, z. Verwenden Sie zu diesem Zeitpunkt das Notepad von Windows, um es zu öffnen, und speichern Sie als entsprechende Codierung, um das Problem zu lösen.
Wenn IE als Browser unter Windows-Betriebssystemen verwendet wird, tritt dieses Problem häufig auf: Beim Durchsuchen von Webseiten, die mit UTF-8 codiert sind, kann der Browser die von der Seite verwendete Codierung nicht automatisch erkennen, selbst wenn die Webseite das Codierungsformat deklariert hat: <meta http-äquiv = content-type content = text/html; charSet = utf-8 />, wodurch einige Seiten mit chinesischer UTF-8-Codierung zur Erzeugung von Blindausgaben verursacht werden. Wenn Sie Firefox- oder Sarafi -Browser verwenden, wird dieses Problem nicht verursacht. Dies liegt daran, dass die Tags in HTML bevorzugt werden, wenn IE die Web -Codierung analysiert und dann die Nachrichten im HTTP -Header genau das Gegenteil sind.
Da UTF-8 einen Mann in 3 Bytes darstellt, sind die gewöhnlichen GB2312 oder Big5 zwei. Wenn die Seite aus den oben genannten Gründen ausgibt, wenn der Browser den Inhalt von <title> </title> analysiert und ausgibt, wird der IE UTF-8 als zwei Bytes und einen halben chinesischen Charakter behandelt, wenn es ungerade Full-Width-Zeichen gibt. Zu diesem Zeitpunkt wird der halb chinesische Charakter mit dem <title> <titel> <title> kombiniert, wodurch der IE den <title> -Teil nicht lesen kann, wodurch die gesamte Seite leer und ausgegeben wird. Wenn Sie sich die Quelldatei ansehen, werden Sie zu diesem Zeitpunkt feststellen, dass die gesamte Seite tatsächlich ausgegeben wurde, der Browser den Inhalt jedoch nicht anzeigt. Die einfachste Lösung besteht darin, <meta http-äquiv = content-type content = text/html zu platzieren; charset = utf-8 /> vor <Titels> < /title>.