أثارت دراسة من جامعة ريدينغ في المملكة المتحدة مخاوف بشأن تطبيق الذكاء الاصطناعي في المجالات الأكاديمية. وجدت الدراسة أنه في الامتحانات الجامعية الحقيقية، لم تتم رؤية 94% من الإجابات الناتجة عن الذكاء الاصطناعي من قبل المعلمين، وكانت درجات الذكاء الاصطناعي أعلى بكثير من الطلاب البشر في 83.4% من الحالات. لم يتم إجراء هذه الدراسة في المختبر، ولكنها استخدمت بيئات اختبار واقعية ومعايير تسجيل النتائج، وكانت النتائج صادمة وتطرح تحديات خطيرة على النزاهة الأكاديمية والنظام التعليمي. استخدمت هذه الدراسة GPT-4 لتوليد إجابات دون أي تعديلات لضمان "أصالة" الذكاء الاصطناعي وأظهرت بشكل كامل قوة الذكاء الاصطناعي في الكتابة الأكاديمية.
في قاعة الامتحانات الجامعية، حدث "غزو" الذكاء الاصطناعي بهدوء. كشفت الأبحاث التي أجرتها جامعة ريدينغ في المملكة المتحدة عن ظاهرة مذهلة: في الامتحانات الجامعية الفعلية، أفلتت 94% من الإجابات التي تم إنشاؤها بواسطة الذكاء الاصطناعي من أعين المعلمين ولم يتم رؤيتها من خلالها. والأمر الأكثر إثارة للصدمة هو أن "زملاء الدراسة" الذين يعملون في مجال الذكاء الاصطناعي سجلوا درجات أعلى بكثير من الطلاب البشر في 83.4% من الحالات. ويبدو أن هذا يشير إلى أن الذكاء الاصطناعي لا يُظهر إمكانية استبدال العمل البشري فحسب، بل يبدأ أيضًا في التفوق على طلاب الجامعات في المهام المعرفية.
ولم يتم إجراء هذا البحث في مختبر مغلق، بل في بيئة فحص حقيقية. أجرى فريق البحث "اختبار تورينج" في كلية علم النفس وعلوم النطق السريرية بجامعة ريدينغ دون إبلاغ المقيمين. يتضمن الاختبار أسئلة ذات إجابات قصيرة وأسئلة مقالية، مع دمج المحتوى الناتج عن الذكاء الاصطناعي، وهو ما يمثل حوالي 5%. استخدم الباحثون كلمات سريعة موحدة للسماح لـGPT-4 بتوليد الإجابات، لكنهم لم يجروا أي تعديلات على المحتوى لضمان "أصالة" الذكاء الاصطناعي.

تتبع عملية وضع العلامات المعايير الصارمة لجامعة ريدينغ وتتضمن وضع العلامات الأولية والمراجعة المستقلة واجتماعات المعايرة مع فريق وضع العلامات. ومع ذلك، حتى في ظل هذا التدقيق، لا يزال من الصعب إنجاز المهام التي يقدمها الذكاء الاصطناعي. تظهر نتائج الأبحاث أن المهام التي ينشئها الذكاء الاصطناعي لا توجد في وحدات متعددة، وغالبًا ما تتركز الدرجات في المجالات ذات الدرجات العالية.
وقد دفع هذا الاكتشاف إلى تأملات عميقة حول النزاهة الأكاديمية والأهداف التعليمية. إذا كان بإمكان الطلاب استخدام الذكاء الاصطناعي لإنشاء محتوى عالي الجودة يصعب اكتشافه، فكيف ينبغي لنا إذن إصلاح نظام التعليم للتكيف مع هذه التكنولوجيا الناشئة، في العام الماضي، أشارت ورقة بحثية في مجلة Nature أيضًا إلى أن الذكاء الاصطناعي أكثر فعالية في إكمال الدراسة الجامعية؟ أثبتت الدورات الدراسية بالفعل القدرة على البحث عن المعلومات ودمجها وتحليلها بشكل نقدي، وهو ما يتزامن مع الأهداف التدريبية للجامعة.
ومن المؤكد أن استنتاجات الدراسة مثيرة للقلق. إن قدرة GPT-4 تجعل من الصعب على الطلاب اكتشاف الغش باستخدام الذكاء الاصطناعي، وهناك احتمال كبير جدًا لتحقيق نتائج أفضل. وهذا لا يشكل تحديًا للنزاهة الأكاديمية فحسب، بل يدفعنا أيضًا إلى التفكير في الاتجاه المستقبلي للتعليم. على الرغم من أن بعض مستخدمي الإنترنت تساءلوا مازحين عما إذا كان هذا البحث قد تم إنجازه أيضًا بواسطة الذكاء الاصطناعي، إلا أن المؤلف ذكر رسميًا أن محتوى البحث تم إجراؤه بالكامل بواسطة البشر.
نتائج هذه الدراسة تجبرنا على إعادة النظر في أساليب وآليات التقييم التربوي للحفاظ على النزاهة الأكاديمية. في مواجهة التطور السريع لتكنولوجيا الذكاء الاصطناعي، ستصبح كيفية تنمية التفكير النقدي والقدرات الابتكارية لدى الطلاب، وكيفية ضمان نزاهة ونزاهة الامتحانات، من القضايا التي يجب التركيز عليها في مجال التعليم في المستقبل. نحن بحاجة إلى استكشاف نماذج التدريس وطرق التقييم الجديدة بنشاط للتكيف مع التحديات الجديدة في عصر الذكاء الاصطناعي.