في امتحان القبول بالكلية لعام 2024، شاركت تسعة نماذج كبيرة من الذكاء الاصطناعي في التحدي غير المسبوق المتمثل في اجتياز امتحان القبول بالكلية، وخاصة امتحان خنان الصعب للغاية. يهدف هذا الاختبار الذي نظمته وسائل الإعلام إلى تقييم القدرات الفعلية للذكاء الاصطناعي في المجال الأكاديمي وتوفير بيانات قيمة لفهمنا للاختلافات بين الذكاء الاصطناعي والذكاء البشري. نتائج هذا الاختبار لافتة للنظر، حتى أن نتائج بعض نماذج الذكاء الاصطناعي تجاوزت نتائج الخط الأول، مما أثار اهتمامًا واسع النطاق ومناقشات ساخنة وقدمت تفكيرًا جديدًا لاتجاه التطوير المستقبلي لتكنولوجيا الذكاء الاصطناعي.
ومن بين أنظمة الذكاء الاصطناعي التسعة التي شاركت في الاختبار، تجاوزت درجات أربعة أنظمة ذكاء اصطناعي الخط الأول في امتحان القبول في كلية خنان. وحصل GPT-4o على المركز الأول برصيد 562 نقطة، متجاوزًا الخط الأول بـ 41 نقطة، بينما تبعه Doubao من ByteDance بـ 542.5 نقطة، ليصبح الأفضل بين النماذج المحلية.

يحقق الذكاء الاصطناعي أداءً جيدًا في مواد الفنون الحرة، وخاصة المواد الصينية والإنجليزية، ولكنه ليس جيدًا في المواد العلمية، وخاصة الرياضيات. ويمكن ملاحظة أن الذكاء الاصطناعي أظهر مزايا واضحة في موضوعات اللغة، كما أن قدرته على فهم الشعر القديم مثيرة للإعجاب.

يعد أداء الذكاء الاصطناعي في الأسئلة المنطقية البسيطة مقبولا، لكن أدائه في الأسئلة التي تتطلب اشتقاقًا وإثباتًا معقدًا ضعيف، مما يدل على أن قدرته المنطقية بحاجة إلى التحسين. في الفنون الليبرالية الشاملة، كان أداء مادة الجغرافيا هو الأسوأ، بينما في العلوم الشاملة، كان أداء مادة الأحياء جيدًا نسبيًا. كان أداء GPT-4o متميزًا في المادة السياسية حيث حصل على درجة عالية بلغت 91.5 نقطة.
طرق الاختبار ومعايير التسجيل
جولات الاختبار: من أجل تقليل تأثير العشوائية، تم اختبار جميع المواد على جولتين، وتم أخذ متوسط الدرجات كدرجة نهائية.
تنسيق الإدخال: يتم إدخال الصيغ بتنسيق Markdown/LaTeX بالنسبة لأسئلة الصور، يتم إدخال الصور والنصوص المقابلة وفقًا لإمكانيات التعرف على النموذج.
عملية الاختبار: يقوم مزود خدمة بيانات الذكاء الاصطناعي المحترف بإجراء لقطات شاشة اختبارية موحدة وموحدة لضمان عدالة الاختبار.
طريقة التسجيل: يتم استخدام نفس معايير التسجيل مع المرشحين البشريين لضمان عدالة التسجيل.
إن محاولة الذكاء الاصطناعي هذه للمشاركة في امتحان القبول بالكلية لا توضح مزايا الذكاء الاصطناعي في مجالات محددة فحسب، بل تكشف أيضًا عن عيوبه في التفكير المنطقي والبراهين الرياضية. وكما نقل أحد مرشحي الذكاء الاصطناعي في مقالته: "الطريق طويل وطويل، وسوف أبحث عنه صعودًا وهبوطًا". هذا ليس مجرد تصوير لتطور الذكاء الاصطناعي، ولكنه أيضًا وصف حي للاستكشاف المستمر للبشر العالم المجهول. من خلال هذا الاختبار، أصبح لدينا فهم أعمق لمستوى ذكاء الذكاء الاصطناعي، كما أنه يوفر مرجعًا قيمًا لاتجاه التطوير المستقبلي للذكاء الاصطناعي.
تتضمن قائمة المرشحين منتجات الذكاء الاصطناعي المعروفة مثل GPT-4o من OpenAI، وDoubao من ByteDance، وWenxin 4.0 من Baidu، وسيكون لأدائهم في امتحان القبول بالجامعة بلا شك تأثير عميق على تطوير تكنولوجيا الذكاء الاصطناعي.
توفر لنا تجربة امتحان القبول في كلية الذكاء الاصطناعي رؤى عميقة حول الوضع الحالي والاتجاه المستقبلي لتطوير الذكاء الاصطناعي، وتسلط الضوء أيضًا على التحديات التي لا نزال نواجهها في السعي لتحقيق الذكاء الاصطناعي العام. أعتقد أن الذكاء الاصطناعي سيُظهر في المستقبل إمكاناته في المزيد من المجالات وسيحقق تقدمًا أكبر للمجتمع البشري.