영국 레딩대학교의 실험은 교육 분야의 인공지능에 대한 광범위한 우려를 불러일으켰습니다. 연구원들은 ChatGPT-4를 사용하여 시험 답변을 생성하고 이를 가짜 학생으로 제출했습니다. 그 결과는 충격적이었습니다. AI가 생성한 답변은 교수를 속였을 뿐만 아니라 심지어 평균보다 높은 점수를 받았습니다. 이 실험은 AI 기술의 발전을 보여줄 뿐만 아니라 전통적인 교육 평가 시스템에 심각한 도전을 제기합니다.
영국 레딩대학교 연구진이 인공지능이 생성한 시험 답안을 비밀리에 제출해 교수를 속이고 실제 학생보다 좋은 성적을 받는 데 성공했다. 이 프로젝트는 ChatGPT-4를 사용하여 편집되지 않은 답변을 생성하고 이를 허위 학생 신원으로 학부 과정에 대한 온라인 평가에 제출합니다.

놀랍게도 대학 채점 교수는 33개의 답변 중 하나만 AI에서 나온 것이고 나머지 AI 답변은 평균 학생 성적보다 훨씬 높은 점수를 받았다는 사실을 발견했습니다. 저자는 이번 발견이 ChatGPT와 같은 AI 프로세서가 이제 "튜링 테스트"를 통과했음을 보여준다고 말합니다. 즉, 숙련된 태거에게 감지되지 않고 통과할 수 있다는 것입니다.
연구 결론에 따르면 AI의 추상적 추론 능력은 지속적으로 증가하는 반면 탐지 가능성은 감소하여 교육 평가의 무결성에 심각한 문제를 제기합니다. 전문가들은 이번 발견으로 집에 가져가는 시험이나 감독되지 않는 수업 활동이 종식될 것이라고 말합니다. 그들은 교육계에 평가 교육에 AI를 사용하는 것에 대해 깊이 생각하고 신뢰의 위기를 피하기 위한 해결책을 찾을 것을 촉구했습니다.
레딩대학교 교육부총장인 엘리자베스 마크럼은 대학들이 점차 집에서 온라인 시험을 치르는 것에서 벗어나 실제 생활과 업무 시나리오에 지식을 적용하는 것을 포함한 대안을 개발하고 있다고 말했습니다. 그는 또한 일부 평가는 학생들의 AI 사용을 지원하고, AI를 비판적이고 윤리적으로 사용하는 방법을 가르치며, 현대 직장에서 필요한 기술을 개발할 것이라고 지적했습니다. 그러나 전문가들은 학생들이 시험에 AI를 사용하도록 허용하면 기술이 저하되거나 심지어 독립적으로 생각하고 분석하고 쓰는 능력이 상실될 수도 있다고 우려합니다.
하이라이트:
⭐ 레딩 대학교(University of Reading)의 연구원들이 교수들을 성공적으로 속여 평가의 무결성에 대한 교육 부문의 우려를 불러일으켰습니다.
⭐ AI의 추상적 추론 능력은 향상되지만 탐지 가능성은 낮아져 교육 평가의 무결성에 문제가 됩니다.
⭐ 대학들은 점차 집에서 온라인 시험을 포기하고 있습니다. 전문가들은 학생들의 실력 손실을 우려하며 교육에 AI를 활용하는 것에 대한 심도 있는 고민을 촉구합니다.
이 연구는 교육 기관이 교육 및 평가 방법을 재평가하도록 강요합니다. 앞으로의 교육은 전통적인 시험 형식에만 의존하기보다는 학생들의 비판적 사고와 문제 해결 능력을 키우는 데 더 중점을 두어야 할 것입니다. AI시대 교육의 공정성과 효과성을 어떻게 확보할 것인가는 지속적인 과제가 될 것이다.