プロジェクト作業の過程で、チーム間のより良い協力とより良いプロジェクトを促進するために、さまざまな仕様を確立することがよくあります。 GoogleのIMソフトウェアGTALKで使用されているオープンXMPPプロトコルなど、さまざまなプロトコルをよく耳にします。他のIMソフトウェアもXMPPプロトコルに準拠している限り、GTALKと使用して通信できます。インターネット上の情報のカウントはなく、この情報自体は独立して存在します。直列に接続してユーザーに提示する方法には、HTTPプロトコルの使用が必要です。
同様に、ブラウザは異なるカーネルとデフォルトスタイルの異なるレンダリングを持っているため、各ブラウザが異なるブラウザで同じWebドキュメントによって提示されたスタイルが一貫していることを確認するために、各ブラウザがフォローするルールが必要です。このルールはDoctype宣言です。
インターネットは相互運用可能であるため、2つ以上のWebドキュメントにはデータ交換が含まれる場合があります。 XML言語では、ユーザーがタグをカスタマイズできるため、交換された2つのドキュメントは同じタグを持っている可能性があり、同じタグの競合になります。したがって、Exchangeドキュメントに存在する可能性のある同じタグを区別するには、名前空間が必要です。
HTMLをXMLに移行するための言語として、XHTMLはXML言語でユーザー定義のタグを実装できないため、XHMTLドキュメントの名前空間は同じです。
<html xmlns = http://www.w3.org/1999/xhtml>
XMLNSは、いわゆる名前空間であるXHTMLネームスペースの略語です。 Doctype宣言のように、XMLNSも宣言です。 Doctype宣言はまだHTMLドキュメントに存在するのとは異なり、XMLNSはHTMLドキュメントには存在せず、通常表示されるXMLNSはXHTMLドキュメントに表示されます。
Webページを作成する場合、最初にDoctype(ドキュメントタイプ)を宣言することに加えて、XHTMLドキュメントの場合、名前空間を宣言する必要があり、宣言する3番目のことはWebページの文字をエンコードする文字エンコードタイプです。
<メタhttp-equiv = content-type content = text/html; charset = utf-8 ' />
ブラウザによって正しく解釈され、W3Cによって検証されるために、各XHTMLドキュメントは使用される文字エンコードを宣言する必要があります。多くの場合、Webドキュメント内の文字化けコードのほとんどは、誤った文字エンコードによって引き起こされます。
UTF-8は、ユニコードの可変長さのエンコード式です。グローバルに普遍的なキャラクターエンコードとして、それはますます多くのWebドキュメントで使用されています。 UTF-8文字エンコードを使用したWebページは、異なる地域のユーザーが同じWebページにアクセスすると、異なる文字エンコーディングによって引き起こされる文字化けコードの回避を最大化できます。
しかし、ほとんどの国内ウェブサイト、特に大規模なポータルWebサイトを開くと、キャラクターエンコーディングに関する声明はUTF-8ではなく、GB2312です。
<メタhttp-equiv = content-type content = text/html; charset = gb2312 ' />
もちろん、GB2312に加えて、GBKまたはGB18030エンコーディングを使用するWebサイトがいくつかあります。これらの3つのキャラクターエンコーディングは、単純化された漢字セットに属します。つまり、コンピューターに単純化された漢字セットがインストールされていない場合、GB2312としてエンコードされた文字を備えた中国のWebページにアクセスすると、文字化けコードが表示されます。
GB2312文字エンコードを使用する場合、異なる領域でのユーザーアクセスのために文字化けコードが発生する可能性があるため、UTF-8を使用してみませんか?
理由の1つは歴史的な理由かもしれませんが、もう1つのより重要な理由は、2つのエンコーディングのストレージ方法が異なるため、異なるドキュメントサイズである必要があります。
GB2312文字エンコーディングセットを使用する場合、漢字は2バイトを占有しますが、UTF-8エンコードの漢字が占めるバイト数は、多くの場合3バイト、または3バイト以上です。したがって、同じ中国の文書の場合、GB2312文字エンコードを使用した保存量は、UTF-8エンコーディングに保存されているドキュメントサイズよりも小さくなります。
多くのテキストと多くの訪問がある中国のWebサイトの場合、GB2312エンコードされたWebページドキュメントを使用すると、ダウンロードと送信のトラフィックを大幅に節約できます。さらに、中国のウェブサイトのユーザーグループは基本的に中国のユーザーにロックされているため、多くのウェブサイトがUTF-8エンコードの代わりにGB2312エンコードを使用しています。
ただし、中国には多くのテキストと訪問があるウェブサイトはあまりありません。さらに、Carled Codeの問題がペアになる可能性があるため、Webページを作成するときにUTF-8エンコードを使用することをお勧めします。
もちろん、どんな種類のエンコードが使用されていても、最も重要なことは、サイト全体で使用されるエンコードを統一しなければならないことです。
上記の方法に加えて宣言をエンコードする文字をエンコードする場合、別の宣言方法も表示されます。
<メタhttp-equiv = content-language content = gb2312 ' />
<メタhttp-equiv = content-language content = zh-cn />
この宣言方法は、ブラウザの古いバージョンを対象としています。この宣言方法は、ブラウザが一般的に更新されている場合、今日は推奨されません。