การเข้ารหัสหน้าเว็บถูกแปลเป็นการเข้ารหัสหน้าเว็บเป็นภาษาอังกฤษซึ่งเป็นไลบรารีที่ระบุรูปแบบการเข้ารหัสอักขระเฉพาะในหน้าเว็บ
GBK เป็นมาตรฐานที่เข้ากันได้กับ GB2312 หลังจากการขยายตัวตามมาตรฐานระดับชาติ GB2312 การเข้ารหัสข้อความของ GBK นั้นแสดงโดยสองไบต์นั่นคือทั้งตัวละครจีนและภาษาอังกฤษจะถูกแสดงด้วยไบต์สองเท่า เพื่อแยกแยะภาษาจีนบิตสูงสุดถูกตั้งค่าเป็น 1. GBK มีอักขระจีนทั้งหมดเป็นรหัสระดับชาติและมีความสามารถรอบตัวที่แย่กว่า UTF8 แต่ UTF8 ครอบครองฐานข้อมูลขนาดใหญ่กว่า GBK
UTF-8: Unicode TransformationFormat-8bit อนุญาตให้ BOM แต่มักจะไม่มี BOM มันเป็นการเข้ารหัสแบบหลายไบต์ที่ใช้ในการแก้ปัญหาตัวละครนานาชาติ มันใช้ 8 บิต (เช่นหนึ่งไบต์) สำหรับภาษาอังกฤษและ 24 (สามไบต์) เพื่อให้จีนเข้ารหัส UTF-8 มีตัวละครที่ทุกประเทศทั่วโลกต้องใช้ มันถูกเข้ารหัสในระดับสากลและมีความเก่งกาจ ข้อความที่เข้ารหัส UTF-8 สามารถแสดงบนเบราว์เซอร์ที่รองรับชุดอักขระ UTF8 ในประเทศต่างๆ หากเป็นการเข้ารหัส UTF8 จีนก็สามารถแสดงบนภาษาอังกฤษของชาวต่างชาติได้เช่นและพวกเขาไม่จำเป็นต้องดาวน์โหลดแพ็คเกจสนับสนุนภาษาจีน IE
แม้ว่าเวอร์ชัน UTF-8 มีความเข้ากันได้ระหว่างประเทศที่ดี แต่จีนต้องการ 50% ของพื้นที่จัดเก็บฐานข้อมูลมากกว่ารุ่น GBK/BIG5 ดังนั้นจึงไม่แนะนำให้ใช้และสำหรับผู้ใช้ที่มีข้อกำหนดพิเศษสำหรับความเข้ากันได้ระหว่างประเทศ เพียงแค่ใส่: สำหรับเว็บไซต์ที่มีภาษาจีนมากขึ้นเหมาะที่จะใช้การเข้ารหัส GBK เพื่อบันทึกพื้นที่ฐานข้อมูล สำหรับเว็บไซต์ที่มีภาษาอังกฤษมากขึ้นเหมาะที่จะใช้ UTF-8 เพื่อบันทึกพื้นที่ฐานข้อมูล
วิธีการแปลง GBK, GB2312 ฯลฯ เป็น UTF8 GBK, GB2312 ฯลฯ และ UTF8 จะต้องเข้ารหัสผ่าน Unicode เพื่อแปลงซึ่งกันและกัน: GBK, GB2312-Unicode-UTF8; UTF8-Unicode-GBK, GB2312 การใช้ Save Windows Notepad's AS คุณสามารถแปลงระหว่าง GBK, Unicode, Unicode Big Endian และ UTF-8 วิธีการเข้ารหัส
วิธีทำให้เบราว์เซอร์จดจำการเข้ารหัสเว็บได้อย่างถูกต้อง? โดยทั่วไปจะต้องมีประโยคต่อไปนี้ในหน้าเว็บ: <meta http-equiv = เนื้อหาประเภทเนื้อหา = text/html; charset = gb2312> ระบุว่าการเข้ารหัสชุดอักขระของหน้าเว็บนี้คือ GB2312 (หรือ UTF-8)
บางครั้งหน้าได้ระบุการเข้ารหัสแล้วทำไมบางครั้งจึงปรากฏว่าอ่านไม่ออก? อาจเป็นเพราะการเข้ารหัสการประกาศหน้าไม่สอดคล้องกับไฟล์เอง มันมักจะเกิดจากการเปิดหน้าด้วยการเข้ารหัสข้อผิดพลาดและบันทึกหรือใช้ซอฟต์แวร์ FTP บางตัวเพื่อแก้ไขไฟล์ออนไลน์เช่นน่ารักซึ่งทำให้ซอฟต์แวร์เข้ารหัสกำหนดค่าการกำหนดค่าและแปลงไม่ถูกต้อง ในเวลานี้ใช้ Notepad ของหน้าต่างเพื่อเปิดและบันทึกเป็นการเข้ารหัสที่สอดคล้องกันเพื่อแก้ปัญหา
เมื่อใช้ IE เป็นเบราว์เซอร์ในระบบปฏิบัติการ Windows ปัญหานี้มักจะเกิดขึ้น: เมื่อเรียกดูหน้าเว็บที่เข้ารหัสด้วย UTF-8 เบราว์เซอร์จะไม่สามารถจดจำการเข้ารหัสที่ใช้โดยหน้าโดยอัตโนมัติแม้ว่าเว็บเพจจะประกาศรูปแบบการเข้ารหัส: <Meta HTTP-Equiv = เนื้อหา charset = utf-8 /> ซึ่งทำให้หน้าบางหน้าที่มีการเข้ารหัส UTF-8 จีนเพื่อสร้างเอาต์พุตว่างเปล่า หากคุณใช้เบราว์เซอร์ Firefox หรือ Sarafi สิ่งนี้จะไม่ทำให้เกิดปัญหานี้ นี่เป็นเพราะเมื่อ IE Parses การเข้ารหัสเว็บแท็กใน HTML เป็นที่ต้องการและจากนั้นข้อความในส่วนหัว HTTP นั้นตรงกันข้าม
เนื่องจาก UTF-8 หมายถึงผู้ชายใน 3 ไบต์ GB2312 หรือ BIG5 ธรรมดาเป็นสองคน เมื่อเอาท์พุทหน้าเนื่องจากเหตุผลข้างต้นเมื่อเบราว์เซอร์แยกวิเคราะห์และส่งออกเนื้อหาของ <title> </title> หากมีอักขระความกว้างเต็มรูปแบบคี่ต่อหน้า </title> IE จะรักษา UTF-8 เป็นสองไบต์และครึ่งตัวอักษรจีน ในเวลานี้อักขระจีนครึ่งหนึ่งจะถูกรวมเข้ากับ <title> <title> <title> <title> ทำให้ IE ไม่สามารถอ่านชิ้นส่วน <title> ได้ทำให้ทั้งหน้าว่างเปล่าและเอาต์พุต ในเวลานี้หากคุณดูไฟล์ต้นฉบับคุณจะพบว่าทั้งหน้าได้รับการส่งออกจริง แต่เบราว์เซอร์ไม่แสดงเนื้อหา ทางออกที่ง่ายที่สุดคือใส่ <meta http-equiv = เนื้อหาประเภทเนื้อหา = text/html; charset = utf-8 /> ก่อน <title> </title>