Webページのエンコーディングは、WebページでエンコードするWebページとして翻訳されます。これは、Webページの特定の文字エンコード形式を指定するライブラリです。
GBKは、National Standard GB2312に基づいた拡張後、GB2312と互換性のある標準です。 GBKのテキストエンコードは、2倍のバイトで表されます。つまり、中国語と英語の両方のキャラクターは2倍のバイトで表されます。中国語を区別するために、最高のビットは1に設定されます。GBKにはすべての漢字が含まれ、全国コード化されており、UTF8よりも汎用性が低下しますが、UTF8はGBKよりも大きなデータベースを占めています。
UTF-8:Unicode TransformationFormat-8BitはBOMを許可しますが、通常はBOMを含みません。これは、国際的なキャラクターを解決するために使用されるマルチバイトエンコードです。英語には8ビット(1バイト)、中国語にエンコードするのに24(3バイト)を使用します。 UTF-8には、世界中のすべての国が使用する必要があるキャラクターが含まれています。国際的にエンコードされており、汎用性が強いです。 UTF-8エンコードされたテキストは、さまざまな国でUTF8文字セットをサポートするブラウザに表示できます。 UTF8エンコードの場合、中国人は外国人の英語IEにも表示でき、IE中国語サポートパッケージをダウンロードする必要はありません。
UTF-8バージョンには優れた国際的な互換性がありますが、中国人はGBK/BIG5バージョンよりもデータベースストレージスペースの50%を必要とするため、使用することはお勧めせず、国際的な互換性の特別な要件を持つユーザー専用です。簡単に言えば、中国語が多いウェブサイトの場合、GBKエンコーディングを使用してデータベーススペースを保存するのに適しています。英語が多いWebサイトの場合、UTF-8を使用してデータベーススペースを保存するのに適しています。
GBK、GB2312などをUTF8に変換する方法は? GBK、GB2312など、およびUTF8は、互いに変換するためにUnicodeを介してエンコードする必要があります:GBK、GB2312-Unicode-UTF8。 UTF8-UNICODE-GBK、GB2312。 Windows Notepadの保存を使用して、GBK、Unicode、Unicode Big Endian、およびUTF-8エンコードメソッド間で変換できます。
ブラウザにWebエンコーディングを正しく認識する方法は?一般に、Webページには次の文がなければなりません。 charset = gb2312>、このWebページのキャラクターセットエンコードがGB2312であることを示しています。 (またはUTF-8)
ページが指定されたコード化されている場合がありますが、なぜ文字化けされるのはなぜですか?これは、ページ宣言エンコードがファイル自体と矛盾しているためかもしれません。多くの場合、エラーエンコードでページを開いてから保存するか、FTPソフトウェアを使用してオンラインでファイルを変更することが原因です。この時点で、ウィンドウのメモ帳を使用してそれを開き、対応するエンコードとして保存して問題を解決します。
WindowsオペレーティングシステムでIEをブラウザとして使用する場合、この問題はしばしば発生します。UTF-8でエンコードされたWebページを閲覧すると、ブラウザはページで使用されるエンコードを自動的に認識できません。 charset = utf-8 />は、中国のUTF-8エンコーディングを含むいくつかのページが空白の出力を生成します。 FirefoxまたはSarafiブラウザを使用している場合、これはこの問題を引き起こしません。これは、IEがWebエンコーディングを解析する場合、HTMLのタグが推奨され、HTTPヘッダーのメッセージが正反対であるためです。
UTF-8は3バイトの男性を表すため、通常のGB2312またはBIG5は2つです。上記の理由により、ページを出力するとき、ブラウザが<title> </title>のコンテンツを解析して出力するとき、</title>の前に奇妙な全幅文字がある場合、IEがUTF-8を2バイトとして解析すると、漢字の半分が表示されます。この時点で、中間の半分の文字は<Title> <Title> <Title>と組み合わされ、ページ全体が空に出力されます。この時点で、ソースファイルを見ると、ページ全体が実際に出力されていることがわかりますが、ブラウザはコンテンツを表示しません。最も簡単な解決策は、<Meta http-equiv = content-type content = text/htmlを置くことです。 charset = utf-8 /> <title> < /title>の前。