يتم ترجمة ترميز صفحة الويب كصفحة ويب ترميز باللغة الإنجليزية ، وهي مكتبة تحدد تنسيق ترميز الأحرف الخاص بها في صفحة ويب.
GBK هو معيار متوافق مع GB2312 بعد التوسع بناءً على المعيار الوطني GB2312. يتم تمثيل النص الذي يشفر GBK بواسطة بايت مزدوج ، أي أن الشخصيات الصينية والإنجليزية ممثلة ببايت مزدوج. من أجل التمييز بين الصينيين ، يتم تعيين أعلى بت على 1. يحتوي GBK على جميع الأحرف الصينية ، وموسم وطني ، وله براعة أسوأ من UTF8 ، ولكن UTF8 يحتل قاعدة بيانات أكبر من GBK.
UTF-8: Unicode TransformationFormat-8bit ، يسمح BOM ، ولكن عادة لا يحتوي على BOM. إنه ترميز متعدد البايت يستخدم لحل الشخصيات الدولية. يستخدم 8 بت (أي بايت واحد) للغة الإنجليزية و 24 (ثلاثة بايت) للصينيين للتشفير. يحتوي UTF-8 على شخصيات تحتاج جميع البلدان في جميع أنحاء العالم إلى استخدامها. يتم ترميزه دوليًا وله براعة قوية. يمكن عرض النص المشفر UTF-8 على المتصفحات التي تدعم مجموعات أحرف UTF8 في مختلف البلدان. إذا تم ترميز UTF8 ، فيمكن أيضًا عرض الصينيين على اللغة الإنجليزية للأجانب ، ولا يحتاجون إلى تنزيل حزمة دعم اللغة الصينية.
على الرغم من أن إصدار UTF-8 له توافق دولي جيد ، إلا أن الصينية تتطلب 50 ٪ من مساحة تخزين قاعدة البيانات من إصدار GBK/BIG5 ، لذلك لا ينصح بالاستخدام وهو فقط للمستخدمين الذين لديهم متطلبات خاصة للتوافق الدولي. ببساطة: بالنسبة لمواقع الويب التي تحتوي على المزيد من الصينية ، فمن المناسب استخدام ترميز GBK لحفظ مساحة قاعدة البيانات. بالنسبة لمواقع الويب التي تحتوي على المزيد من اللغة الإنجليزية ، فهي مناسبة لاستخدام UTF-8 لحفظ مساحة قاعدة البيانات.
كيفية تحويل GBK ، GB2312 ، وما إلى ذلك إلى UTF8؟ يجب ترميز GBK ، GB2312 ، وما إلى ذلك و UTF8 من خلال Unicode لتحويل بعضها البعض: GBK ، GB2312-UNICODE-UTF8 ؛ UTF8-UNICODE-GBK ، GB2312. باستخدام Windows Notepad's Save AS ، يمكنك التحويل بين طرق الترميز GBK و Unicode و Unicode Big Endian و UTF-8.
كيفية جعل المتصفح يتعرف بشكل صحيح على ترميز الويب؟ بشكل عام ، يجب أن تكون هناك الجملة التالية في صفحة الويب: <meta http-equiv = content-type content = text/html ؛ charset = gb2312> ، مما يشير إلى أن ترميز مجموعة الأحرف لصفحة الويب هذه هو GB2312. (أو UTF-8)
في بعض الأحيان تم ترميز الصفحة المحددة ، لماذا تظهر أحيانًا مشوهة؟ قد يكون هذا لأن ترميز إعلان الصفحة لا يتماشى مع الملف نفسه. غالبًا ما يكون ناتجًا عن فتح الصفحة مع ترميز خطأ ثم حفظها ، أو استخدام بعض برامج FTP لتعديل الملف عبر الإنترنت ، مثل CuteFTP ، مما يؤدي إلى تحويل ترميز البرنامج وتكوينه بشكل غير صحيح. في هذا الوقت ، استخدم مفكرة النافذة لفتحها ، وحفظها كترميز مطابق لحل المشكلة.
عند استخدام IE كمتصفح على أنظمة تشغيل Windows ، تحدث هذه المشكلة غالبًا: عند تصفح صفحات الويب المشفرة باستخدام UTF-8 ، لا يمكن للمتصفح التعرف تلقائيًا على الترميز المستخدم في الصفحة ، حتى إذا أعلنت صفحة الويب عن تنسيق الترميز: <meta http-equiv = content-type content = text ؛ charset = UTF-8 /> ، مما يسبب بعض الصفحات التي تحتوي على ترميز UTF-8 الصيني لإنتاج ناتج فارغ. إذا كنت تستخدم متصفحات Firefox أو Sarafi ، فلن يسبب ذلك هذه المشكلة. هذا لأنه عندما تقوم IE بتشفير الويب ، تفضل العلامات في HTML ، ثم تكون الرسائل الموجودة في رأس HTTP عكس ذلك تمامًا.
نظرًا لأن UTF-8 يمثل رجلاً في 3 بايت ، فإن GB2312 العادي أو Big5 هما اثنان. عند إخراج الصفحة ، بسبب الأسباب المذكورة أعلاه ، عندما يقوم المتصفح بتوزيع ويخرج محتوى <title> </title> ، إذا كان هناك شخصيات عرضية غريبة أمام </title> ، فسيظهر نصف حرف صيني عندما يظهر IE utf-8 كبايت. في هذا الوقت ، سيتم دمج الحرف النصف الصيني مع <title> <title> <title> ، مما يتسبب في أن تكون الصفحة بأكملها فارغة وإخراج. في هذا الوقت ، إذا نظرت إلى الملف المصدر ، فستجد أن الصفحة بأكملها قد تم إخراجها بالفعل ، لكن المتصفح لا يعرض المحتوى. الحل الأسهل هو وضع <meta http-equiv = محتوى نوع المحتوى = text/html ؛ charset = utf-8 /> قبل <title> </title>.