تقارير محرر Downcodes: حقق فريق DeepMind من Google مؤخرًا تقدمًا كبيرًا ونجح في تطوير تقنية مبتكرة تسمى SCoRe (التصحيح الذاتي من خلال التعلم المعزز)، والتي يمكنها حل مشكلة التصحيح الذاتي لنماذج اللغات الكبيرة (LLM) بشكل فعال. على عكس الطرق السابقة التي اعتمدت على نماذج متعددة أو التحقق الخارجي، يمكن لـ SCoRe تحديد الأخطاء وتصحيحها بنفسه، مما يجلب أملًا جديدًا في موثوقية ودقة نماذج الذكاء الاصطناعي. يكمن جوهر هذه التقنية في طريقة التعلم المعزز الفريدة من نوعها على مرحلتين. يعمل النموذج باستمرار على تحسين قدراته على تصحيح الأخطاء من خلال التعلم الذاتي والتحسين.
حقق فريق أبحاث DeepMind التابع لشركة Google مؤخرًا تقدمًا كبيرًا وقام بتطوير تقنية مبتكرة تسمى SCoRe (التصحيح الذاتي من خلال التعلم المعزز، التصحيح الذاتي من خلال التعلم المعزز). تهدف هذه التقنية إلى حل التحدي طويل الأمد المتمثل في أن نماذج اللغات الكبيرة (LLMs) تواجه مشكلة في التصحيح الذاتي وتحديد الأخطاء وإصلاحها دون الاعتماد على نماذج متعددة أو فحوصات خارجية.
يكمن جوهر تقنية SCoRe في نهجها المكون من مرحلتين. تعمل المرحلة الأولى على تحسين تهيئة النموذج بحيث يمكنه إنشاء تصحيحات في المحاولة الثانية مع الحفاظ على تشابه الاستجابة الأولية للنموذج الأساسي. تستخدم المرحلة الثانية التعلم المعزز متعدد المراحل لتعليم النموذج كيفية تحسين الإجابتين الأولى والثانية. هذا النهج فريد من نوعه لأنه يستخدم فقط بيانات التدريب المولدة ذاتيًا، حيث يقوم النموذج بإنشاء أمثلة خاصة به عن طريق حل المشكلة ومحاولة تحسين الحل.

في الاختبارات الفعلية، أظهر SCoRe تحسينات كبيرة في الأداء. أظهرت الاختبارات التي أجريت باستخدام نموذجي Gemini 1.0 Pro و1.5 Flash من Google تحسنًا بنسبة 15.6 نقطة مئوية في التصحيح الذاتي في مهمة الاستدلال الرياضي لمعيار MATH. في مهمة إنشاء التعليمات البرمجية الخاصة بـ HumanEval، تحسن الأداء بنسبة 9.1 نقطة مئوية. توضح هذه النتائج أن SCoRe قد أحرز تقدمًا كبيرًا في تحسين قدرات التصحيح الذاتي لنماذج الذكاء الاصطناعي.
يسلط الباحثون الضوء على أن SCoRe هي الطريقة الأولى لتحقيق تصحيح ذاتي إيجابي جوهري، مما يسمح للنموذج بتحسين إجاباته دون تعليقات خارجية. ومع ذلك، فإن الإصدار الحالي من SCoRe ينفذ فقط جولة واحدة من التدريب على التصحيح الذاتي، وقد تستكشف الأبحاث المستقبلية إمكانية اتخاذ خطوات تصحيح متعددة.
يكشف هذا البحث الذي أجراه فريق DeepMind عن رؤية مهمة: تدريس الاستراتيجيات الوصفية ذاتية التصحيح يتطلب تجاوز أساليب التدريب على نماذج اللغة القياسية. يفتح التعلم المعزز متعدد المراحل إمكانيات جديدة في مجال الذكاء الاصطناعي ومن المتوقع أن يعزز تطوير أنظمة ذكاء اصطناعي أكثر ذكاءً وموثوقية.
لا توضح هذه التكنولوجيا المتقدمة إمكانية التحسين الذاتي للذكاء الاصطناعي فحسب، بل توفر أيضًا أفكارًا جديدة لحل مشكلات الموثوقية والدقة في نماذج اللغة واسعة النطاق، والتي قد يكون لها تأثير عميق على تطوير تطبيقات الذكاء الاصطناعي المستقبلية.
يمثل ظهور تقنية SCoRe علامة فارقة في مجال قدرات التصحيح الذاتي في مجال الذكاء الاصطناعي، مما يضع أساسًا متينًا لبناء أنظمة ذكاء اصطناعي أكثر موثوقية وذكاءً. ويتطلع محرر موقع Downcodes إلى تطبيق تقنية SCoRe في المزيد من المجالات في المستقبل، مما يضخ حيوية جديدة في تطوير الذكاء الاصطناعي.