Während des Projektprozesses stellen wir häufig verschiedene Spezifikationen fest, um eine bessere Zusammenarbeit zwischen Teams und bessere vollständige Projekte zu ermöglichen. Wir hören oft verschiedene Protokolle, wie das von Googles IM -Software -GTALK verwendete Open XMPP -Protokoll. Solange andere IM -Software auch das XMPP -Protokoll entspricht, kann sie mit GTALK verwendet und kommuniziert werden. Es gibt keine Anzahl von Informationen im Internet, und diese Informationen selbst existieren unabhängig. So verbinden Sie es in Reihe und präsentieren Sie es mit Benutzern die Verwendung des HTTP -Protokolls.
Aus dem gleichen Grund benötigen Browser, da sie unterschiedliche Kernel und unterschiedliche Renderings von Standardstilen haben, eine Regel, die jeder Browser folgt, um sicherzustellen, dass die von demselben Webdokument auf verschiedenen Browsern präsentierten Stile konsistent sind. Diese Regel ist die DocType -Erklärung.
Da das Internet interoperabel ist, können zwei oder mehr Webdokumente den Datenaustausch beinhalten. Da die XML -Sprache Benutzern ermöglicht, Tags anzupassen, können zwei ausgetauschte Dokumente dieselben Tags haben, was zu Konflikten derselben Tags führt. Daher ist ein Namespace erforderlich, um dieselben Tags zu unterscheiden, die im Exchange -Dokument vorhanden sind.
Als Sprache für den Übergang von HTML zu XML kann XHTML keine benutzerdefinierten Tags in der XML-Sprache implementieren, sodass die Namespaces in XHMTL-Dokumenten gleich sind:
<html xmlns = http: //www.w3.org/1999/xhtml>
XMLNS ist die Abkürzung des XHTML-Namespace, der sogenannte Namespace. Wie die DocType -Erklärung ist XMLNS ebenfalls eine Erklärung. Im Gegensatz zur DOCType -Erklärung ist im HTML -Dokument weiterhin vorhanden, existiert XMLNS im HTML -Dokument nicht, und im XHTML -Dokument werden die XMLNs angezeigt.
Bei der Erstellung einer Webseite und beim Deklarieren von docType (Dokumenttyp) am Anfang muss auch der Namespace deklariert werden, wenn es sich um ein XHTML -Dokument handelt.
<meta http-äquiv = content-type content = text/html; charset = utf-8 ' />
Um vom Browser korrekt interpretiert und durch W3C überprüft zu werden, sollte jedes XHTML -Dokument die verwendete Zeichenkodierung deklarieren. Oft werden die meisten verstümmelten Codes in Webdokumenten durch falsche Zeichenkodierung verursacht.
UTF-8 ist eine codierende Expression von Unicode mit variabler Länge. Als weltweit universelle Charaktercodierung wird es in immer mehr Webdokumenten verwendet. Webseiten mit UTF-8-Zeichenkodierung können die Vermeidung von verstümmelten Code maximieren, die durch verschiedene Zeichenkodierungen verursacht werden, wenn Benutzer in verschiedenen Regionen auf dieselbe Webseite zugreifen.
Wenn wir jedoch die meisten inländischen Websites eröffnen, insbesondere große Portalwebsites, ist die Erklärung zur Charaktercodierung nicht UTF-8, sondern GB2312:
<meta http-äquiv = content-type content = text/html; charSet = gb2312 ' />
Zusätzlich zu GB2312 gibt es einige Websites, die GBK oder GB18030 -Codierung verwenden. Diese drei Charaktercodierungen gehören zum vereinfachten chinesischen Charakter -Set. Das heißt, wenn ein Computer keinen vereinfachten chinesischen Zeichensatz installiert hat, wird der verstümmelte Code angezeigt, wenn er auf eine chinesische Webseite mit dem als GB2312 codierten Zeichen zugreift.
Da durch den Benutzerzugriff in verschiedenen Regionen bei Verwendung von GB2312-Zeichencodierung der Benutzer auftreten kann, warum nicht UTF-8 verwenden?
Einer der Gründe kann historische Gründe sein, während der andere wichtigere Grund aufgrund unterschiedlicher Speichermethoden der beiden Codierungen die unterschiedlichen Dokumentgrößen sein sollte.
Bei der Verwendung des GB2312-Codierungssatzes nimmt ein chinesischer Zeichen 2 Bytes ein, während die Anzahl der Bytes, die von einem chinesischen Charakter in der UTF-8-Codierung besetzt sind, häufig 3 Bytes oder sogar mehr als 3 Bytes beträgt. Für dasselbe chinesische Dokument ist das Speichervolumen unter Verwendung von GB2312-Zeichencodierung kleiner als die in der UTF-8-Codierung gespeicherte Dokumentgröße.
Für chinesische Websites mit viel Text und vielen Besuchen können mithilfe von GB2312-kodierten Webseitendokumenten viel Verkehr beim Download und Übertragung sparen. Da die Benutzergruppe der chinesischen Websites im Grunde genommen auf chinesische Benutzer gesperrt ist, verwenden viele Websites GB2312-kodiert anstelle von UTF-8-codiert.
Es gibt jedoch nicht viele Websites mit viel Text und Besuchen in China. Darüber hinaus kann das Problem des verstümmelten Code gepaart werden. Es wird daher empfohlen, die UTF-8-Codierung beim Erstellen von Webseiten zu verwenden.
Unabhängig davon, welche Art von Codierung verwendet wird, ist das Wichtigste, dass die von der gesamten Site verwendete Codierung einheitlich sein muss.
Für die Zeichen -Codierungs -Deklarationen zusätzlich zur obigen Methode können Sie auch eine andere Deklarationsmethode sehen:
<meta http-äquiv = inhaltssprachiger content = gb2312 ' />
<meta http-äquiv = inhaltssprachiger content = zh-cn />
Diese Deklarationsmethode richtet sich an alte Versionen von Browsern. Diese Deklarationsmethode wird heute nicht empfohlen, wenn die Browser im Allgemeinen aktualisiert wurden.