Pengkodean halaman web diterjemahkan sebagai pengkodean halaman web dalam bahasa Inggris, yang merupakan perpustakaan yang menentukan format pengkodean karakter spesifiknya di halaman web.
GBK adalah standar yang kompatibel dengan GB2312 setelah ekspansi berdasarkan standar Nasional GB2312. Pengkodean teks GBK diwakili oleh byte ganda, yaitu karakter Cina dan Inggris diwakili oleh byte ganda. Untuk membedakan Cina, bit tertinggi ditetapkan ke 1. GBK berisi semua karakter Cina, diberi kode nasional, dan memiliki keserbagunaan yang lebih buruk daripada UTF8, tetapi UTF8 menempati basis data yang lebih besar daripada GBK.
UTF-8: Unicode TransformationFormat-8bit, memungkinkan BOM, tetapi biasanya tidak mengandung BOM. Ini adalah pengkodean multi-byte yang digunakan untuk memecahkan karakter internasional. Ini menggunakan 8 bit (mis. Satu byte) untuk bahasa Inggris dan 24 (tiga byte) untuk orang Cina untuk menyandikan. UTF-8 berisi karakter yang perlu digunakan oleh semua negara di seluruh dunia. Ini dikodekan secara internasional dan memiliki keserbagunaan yang kuat. Teks yang dikodekan UTF-8 dapat ditampilkan di browser yang mendukung set karakter UTF8 di berbagai negara. Jika pengkodean UTF8, bahasa Mandarin juga dapat ditampilkan di bahasa Inggris orang asing, dan mereka tidak perlu mengunduh paket dukungan bahasa Cina IE.
Meskipun versi UTF-8 memiliki kompatibilitas internasional yang baik, Cina membutuhkan 50% ruang penyimpanan basis data daripada versi GBK/BIG5, sehingga tidak disarankan untuk digunakan dan hanya untuk pengguna yang memiliki persyaratan khusus untuk kompatibilitas internasional. Sederhananya: Untuk situs web dengan lebih banyak orang Cina, sangat cocok untuk menggunakan pengkodean GBK untuk menyimpan ruang basis data. Untuk situs web dengan lebih banyak bahasa Inggris, sangat cocok untuk menggunakan UTF-8 untuk menyimpan ruang basis data.
Bagaimana cara mengonversi GBK, GB2312, dll ke UTF8? GBK, GB2312, dll. Dan UTF8 harus dikodekan melalui Unicode untuk saling mengonversi: GBK, GB2312-UNICODE-UTF8; UTF8-UNICODE-GBK, GB2312. Menggunakan Windows Notepad's Save As, Anda dapat mengonversi antara GBK, Unicode, Unicode Big Endian dan Metode Pengkodean UTF-8.
Bagaimana cara membuat browser mengenali pengkodean web dengan benar? Secara umum, harus ada kalimat berikut di halaman web: <meta http-equiv = konten-tipe konten = teks/html; Charset = GB2312>, menunjukkan bahwa pengkodean set karakter dari halaman web ini adalah GB2312. (atau UTF-8)
Kadang -kadang halaman telah mengkodekan yang ditentukan, mengapa terkadang tampak kacau? Ini mungkin karena pengkodean deklarasi halaman tidak konsisten dengan file itu sendiri. Sering disebabkan oleh membuka halaman dengan pengkodean kesalahan dan menyimpannya, atau menggunakan beberapa perangkat lunak FTP untuk memodifikasi file secara online, seperti CutefTP, yang menyebabkan konfigurasi pengkodean perangkat lunak dikonversi dan salah dikonversi. Pada saat ini, gunakan notepad Window untuk membukanya, dan simpan sebagai pengkodean yang sesuai untuk menyelesaikan masalah.
Saat menggunakan IE sebagai browser pada sistem operasi Windows, masalah ini sering terjadi: Saat menjelajahi halaman web yang dikodekan dengan UTF-8, browser tidak dapat secara otomatis mengenali pengkodean yang digunakan oleh halaman, bahkan jika halaman web telah menyatakan format pengkodean: <meta http-equiv = konten-tipe konten = teks/html; Charset = UTF-8 />, yang menyebabkan beberapa halaman yang berisi pengkodean UTF-8 Cina untuk menghasilkan output kosong. Jika Anda menggunakan browser Firefox atau Sarafi, ini tidak akan menyebabkan masalah ini. Ini karena ketika IE Parses Web Encoding, tag di HTML lebih disukai, dan kemudian pesan di header HTTP justru sebaliknya.
Karena UTF-8 mewakili seorang pria dalam 3 byte, GB2312 atau BIG5 biasa adalah dua. Saat mengeluarkan halaman, karena alasan di atas, ketika browser mem-parsing dan mengeluarkan konten <title> </title>, jika ada karakter lebar penuh yang aneh di depan </title>, IE akan memperlakukan UTF-8 sebagai dua byte dan setengah karakter Cina. Pada saat ini, setengah karakter Cina akan dikombinasikan dengan <title> <title> <title>, menyebabkan IE tidak dapat membaca bagian <Title>, membuat seluruh halaman kosong dan output. Pada saat ini, jika Anda melihat file sumber, Anda akan menemukan bahwa seluruh halaman sebenarnya telah output, tetapi browser tidak menampilkan konten. Solusi termudah adalah dengan menempatkan <meta http-equiv = konten-tipe konten = teks/html; charset = UTF-8 /> Sebelum <Title> </iteme>.