英国のレディング大学の研究では、学術分野での AI の応用について懸念が生じています。研究によると、実際の大学試験では、AIが生成した解答の94%が教師に見られず、83.4%のケースでAIのスコアが人間の学生よりも大幅に高かったことが判明した。この研究は実験室で行われたものではなく、実際の試験環境と採点基準を使用して行われたもので、その結果は衝撃的であり、学問の誠実さと教育制度に重大な課題をもたらしています。この研究では、AI の「信頼性」を保証するために GPT-4 を使用して何も変更せずに回答を生成し、学術論文における AI の力を十分に実証しました。
大学受験の試験場で、AIの“侵略”が静かに起きている。英国のレディング大学の研究では、驚くべき現象が明らかになりました。実際の大学試験では、AI が生成した解答の 94% が教師の目を逃れ、見破られませんでした。さらに衝撃的なのは、これらの AI の「クラスメート」のスコアが、83.4% のケースで人間の生徒よりも大幅に高かったことです。これは、AI が人間の作業を代替する可能性を示しているだけでなく、認知タスクにおいて大学生を上回り始めていることを示しているようです。
この研究は閉鎖された研究室ではなく、実際の試験環境で行われました。研究チームは、レディング大学の心理学部・臨床言語科学部で、評価者に知らせずに「チューリングテスト」を実施した。試験には短答式問題と論述式問題があり、AIが生成した内容も5%程度混ざっている。研究者らは、標準化されたプロンプトワードを使用して GPT-4 に回答を生成させましたが、AI の「信頼性」を保証するために内容には一切の変更を加えませんでした。

採点プロセスはレディング大学の厳格な基準に従い、予備採点、独立したレビュー、採点チームとの校正会議が含まれます。しかし、そのような監視の下でも、AI によって提出された課題を見破ることは依然として困難です。研究結果によると、AI が生成した課題は複数のモジュールに存在せず、得点は高得点領域に集中していることが多いです。
この発見は、学問の誠実さと教育目標について深く考えることを促しました。学生が AI を使用して、見つけにくい高品質のコンテンツを生成できるのであれば、この新たなテクノロジーに適応するために教育システムをどのように改革すべきでしょうか? 昨年、Nature 誌に掲載された論文でも、大学を卒業するのに AI がより効果的であると指摘しています。コースワーク 情報を検索、統合し、批判的に分析する能力をすでに実証しており、これは大学の研修目標と一致しています。
研究の結論は確かに憂慮すべきものである。 GPT-4 の機能により、学生が AI を使用して不正行為を検出することが困難になり、より良い結果が得られる可能性が非常に高くなります。これは学問の誠実さに課題を突きつけるだけでなく、教育の将来の方向性について考えるきっかけにもなります。この研究もAIによって完成されたのではないかと冗談めかして疑問を呈するネットユーザーもいたが、著者は研究内容はすべて人間によって行われたと厳粛に述べた。
この研究の結果により、私たちは学問の誠実さを維持するための教育評価の方法と仕組みを再検討する必要に迫られています。 AI技術の急速な発展を背景に、学生の批判的思考力や革新的な能力をいかに育むか、試験の公平性・公正性をいかに確保するかが、今後の教育現場で注力すべき課題となる。 人工知能時代の新たな課題に適応するには、新しい教育モデルと評価方法を積極的に模索する必要があります。