Selama proses pekerjaan proyek, kami sering menetapkan berbagai spesifikasi untuk memfasilitasi kerja sama yang lebih baik di antara tim dan proyek lengkap yang lebih baik; Kami sering mendengar berbagai protokol, seperti protokol XMPP terbuka yang digunakan oleh perangkat lunak IM Google GTALK. Selama perangkat lunak IM lainnya juga mematuhi protokol XMPP, dapat digunakan dan dikomunikasikan dengan GTALK; Tidak ada hitungan informasi di internet, dan informasi ini sendiri ada secara mandiri. Cara menghubungkannya secara seri dan menyajikannya kepada pengguna memerlukan penggunaan protokol HTTP.
Dengan cara yang sama, karena browser memiliki kernel yang berbeda dan rendering gaya default yang berbeda, mereka membutuhkan aturan yang diikuti oleh setiap browser untuk memastikan bahwa gaya yang disajikan oleh dokumen web yang sama pada browser yang berbeda konsisten. Aturan ini adalah deklarasi Doctype.
Karena Internet dapat dioperasikan, dua atau lebih dokumen Web dapat melibatkan pertukaran data. Karena bahasa XML memungkinkan pengguna untuk menyesuaikan tag, dua dokumen yang dipertukarkan mungkin memiliki tag yang sama, menghasilkan konflik dari tag yang sama. Oleh karena itu, namespace diperlukan untuk membedakan tag yang sama yang mungkin ada dalam dokumen pertukaran.
Sebagai bahasa untuk transisi HTML ke XML, XHTML tidak dapat mengimplementasikan tag yang ditentukan pengguna dalam bahasa XML, sehingga ruang nama dalam dokumen XHMTL adalah sama:
<html xmlns = http: //www.w3.org/1999/xhtml>
Xmlns adalah singkatan dari namespace xhtml, yang merupakan namespace yang disebut. Seperti deklarasi Doctype, XMLN juga merupakan deklarasi. Berbeda dengan deklarasi Doctype masih ada dalam dokumen HTML, XMLN tidak ada dalam dokumen HTML, dan XMLN yang biasanya kita lihat muncul dalam dokumen XHTML.
Saat membuat halaman web, selain mendeklarasikan Doctype (Jenis Dokumen) di awal, jika itu adalah dokumen XHTML, ia juga perlu mendeklarasikan namespace, dan hal ketiga untuk menyatakan adalah jenis pengkodean karakter dari dokumen halaman web:
<meta http-equiv = konten-tipe konten = teks/html; charset = UTF-8 ' />
Untuk ditafsirkan dengan benar oleh browser dan diverifikasi oleh W3C, setiap dokumen XHTML harus menyatakan pengkodean karakter yang digunakan. Sering kali, sebagian besar kode yang kacau dalam dokumen web disebabkan oleh pengkodean karakter yang salah.
UTF-8 adalah ekspresi pengkodean panjang variabel dari unicode. Sebagai pengkodean karakter universal global, ia digunakan dalam lebih banyak dan lebih banyak dokumen web. Halaman web menggunakan pengkodean karakter UTF-8 dapat memaksimalkan penghindaran kode kacau yang disebabkan oleh pengkodean karakter yang berbeda ketika pengguna di berbagai wilayah mengakses halaman web yang sama.
Tetapi ketika kami membuka sebagian besar situs web domestik, terutama situs web portal besar, pernyataan tentang pengkodean karakter bukan UTF-8, tetapi GB2312:
<meta http-equiv = konten-tipe konten = teks/html; Charset = GB2312 ' />
Tentu saja, selain GB2312, ada beberapa situs web yang menggunakan pengkodean GBK atau GB18030. Tiga pengkodean karakter ini termasuk dalam set karakter Cina yang disederhanakan. Dengan kata lain, jika komputer tidak memiliki set karakter Cina yang disederhanakan diinstal, ketika mengakses halaman web Cina dengan karakter yang dikodekan sebagai GB2312, kode kacau ditampilkan.
Karena kode kacau dapat terjadi karena akses pengguna di berbagai daerah saat menggunakan pengkodean karakter GB2312, mengapa tidak menggunakan UTF-8?
Salah satu alasannya mungkin alasan historis, sedangkan alasan lain yang lebih penting adalah ukuran dokumen yang berbeda karena metode penyimpanan yang berbeda dari dua pengkodean.
Saat menggunakan set pengkodean karakter GB2312, karakter Cina menempati 2 byte, sedangkan jumlah byte yang ditempati oleh karakter Cina dalam pengkodean UTF-8 sering kali 3 byte, atau bahkan lebih dari 3 byte. Oleh karena itu, untuk dokumen Cina yang sama, volume penyimpanan menggunakan pengkodean karakter GB2312 lebih kecil dari ukuran dokumen yang disimpan dalam pengkodean UTF-8.
Untuk situs web Cina dengan banyak teks dan banyak kunjungan, menggunakan dokumen halaman web yang dikodekan GB2312 dapat menyimpan banyak lalu lintas dalam unduhan dan transmisi. Selain itu, karena kelompok pengguna situs web Cina pada dasarnya terkunci pada pengguna Cina, itulah sebabnya banyak situs web menggunakan GB2312-encoded alih-alih UTF-8-encoded.
Namun, tidak ada banyak situs web dengan banyak teks dan kunjungan di Cina. Selain itu, masalah kode kacau dapat dipasangkan, sehingga disarankan untuk menggunakan pengkodean UTF-8 saat membuat halaman web.
Tentu saja, tidak peduli apa pun pengkodean yang digunakan, yang paling penting adalah bahwa pengkodean yang digunakan oleh seluruh situs harus disatukan.
Untuk deklarasi pengkodean karakter selain metode di atas, Anda juga dapat melihat metode deklarasi lain:
<meta http-equiv = konten-konten konten = gb2312 ' />
<meta http-equiv = konten-konten konten = zh-cn />
Metode deklarasi ini ditujukan untuk versi lama browser. Metode deklarasi ini tidak direkomendasikan hari ini ketika browser telah diperbarui secara umum.