أصدرت OpenAI CriticGPT، وهو نموذج للذكاء الاصطناعي لتحديد وتصحيح الأخطاء في التعليمات البرمجية التي تم إنشاؤها بواسطة ChatGPT. يعتمد CriticGPT على نموذج GPT-4 القوي، ويركز على مراجعة التعليمات البرمجية، ويتم تحسينه من خلال التعلم المعزز والتعليقات البشرية، بهدف تحسين جودة التعليمات البرمجية وكفاءة المراجعة. فهو يقوم بعمل ممتاز في الحد من "التصيد" غير المجدي والإيجابيات الكاذبة، وفي بعض الحالات يكشف بنجاح عن أخطاء لم يلاحظها أحد من قبل. ستقدم هذه المقالة بالتفصيل الميزات الرئيسية وعملية التطوير والنتائج التجريبية والتطبيقات المحتملة والقيود الخاصة بـ CriticGPT.
أعلن باحثو OpenAI يوم الخميس عن إطلاق CriticGPT، وهو نموذج مبتكر للذكاء الاصطناعي مصمم لتحديد وتصحيح الأخطاء في التعليمات البرمجية التي تم إنشاؤها بواسطة ChatGPT. يمثل هذا الاختراق خطوة مهمة إلى الأمام في التحسين الذاتي ومراقبة جودة تكنولوجيا الذكاء الاصطناعي.

الملامح الرئيسية لCriticGPT
1. استنادًا إلى سلسلة GPT-4: تم تصميم CriticGPT على نموذج اللغة القوي GPT-4.
2. التركيز على مراجعة الكود: يُستخدم بشكل أساسي لتحليل كود البرمجة الذي تم إنشاؤه بواسطة ChatGPT والإشارة إلى الأخطاء المحتملة.
3. التعاون بين الإنسان والآلة: يعمل كمساعد الذكاء الاصطناعي للمدربين البشريين لتحسين كفاءة ودقة مراجعة التعليمات البرمجية.
4. تعزيز التعلم: تحسين "محاذاة" نظام الذكاء الاصطناعي من خلال التعلم من ردود الفعل البشرية (RLHF).

عملية التطوير والنتائج
استخدم الباحثون أساليب تدريب مبتكرة لتطوير CriticGPT:
1. إعداد مجموعة البيانات: استخدم نماذج التعليمات البرمجية مع الأخطاء المدرجة عمدًا للتدريب.
2. المشاركة البشرية: يُطلب من المدربين البشريين تعديل الكود المكتوب بواسطة ChatGPT وإدخال الأخطاء وتقديم الملاحظات.
3. تطبيق التكنولوجيا الجديدة: تقديم تقنية "البحث القسري لأخذ العينات" (FSBS) لتحقيق التوازن بين توليد التعليقات التفصيلية والأسئلة الوهمية.

تظهر النتائج التجريبية:
- في 63% من حالات الأخطاء التي تحدث بشكل طبيعي، يفضل البشر CriticGPT.
- CriticGPT يقلل من مشاكل "التصيد" عديمة الفائدة والإيجابية الكاذبة/الهلوسة.
- نجح CriticGPT في العثور على أخطاء وتأكيدها في 24% من الحالات التي كانت تعتبر مثالية في السابق.
التطبيقات والقيود المحتملة
على الرغم من أن CriticGPT يستهدف في المقام الأول مراجعات التعليمات البرمجية، إلا أن الأبحاث تظهر أن لديها القدرة على التعميم على المهام غير المتعلقة بالبرمجة. ومع ذلك، يواجه هذا النموذج أيضًا بعض القيود:
1. تم تدريبه بشكل أساسي على إجابات ChatGPT الأقصر وقد لا يكون مناسبًا للمهام الأكثر تعقيدًا.
2. على الرغم من انخفاض السلوك الوهمي، إلا أنه لم يتم القضاء عليه بشكل كامل.
3. لا يزال هناك مجال للتحسين في تحديد الأخطاء الموزعة على أجزاء متعددة.
النظرة المستقبلية
تخطط OpenAI لدمج النماذج المشابهة لـ CriticGPT في خط أنابيب وضع العلامات RLHF الخاص بها لتقديم مساعدة الذكاء الاصطناعي للمدربين. يمثل هذا تقدمًا مهمًا في تطوير أدوات لتقييم مخرجات نموذج اللغة الكبيرة (LLM). ومع ذلك، أكد الباحثون أيضًا أنه حتى مع مساعدة الذكاء الاصطناعي، تظل المهام المعقدة للغاية تمثل تحديًا للمقيمين البشريين.
مع استمرار تطور تكنولوجيا الذكاء الاصطناعي، ستلعب الابتكارات مثل CriticGPT دورًا رئيسيًا في تحسين دقة وموثوقية أنظمة الذكاء الاصطناعي، مما يؤدي إلى مزيد من المواءمة بين الذكاء الاصطناعي والاحتياجات البشرية.
العنوان: https://openai.com/index/finding-gpt4s-mistakes-with-gpt-4/
يبشر ظهور CriticGPT بإحراز تقدم كبير في التصحيح الذاتي ومراقبة جودة نماذج الذكاء الاصطناعي، مما يوفر اتجاهًا جديدًا للتطوير المستقبلي لتكنولوجيا الذكاء الاصطناعي. على الرغم من أن CriticGPT لا تزال لديها بعض القيود، إلا أن قيمتها التطبيقية المحتملة ضخمة وتستحق الاهتمام والبحث المستمر.