영국 레딩대학교의 연구에서는 학문 분야에서의 AI 적용에 대한 우려가 제기되었습니다. 연구에 따르면 실제 대학 시험에서 AI가 생성한 답변의 94%는 교사가 볼 수 없었고, AI 점수는 83.4%에서 인간 학생보다 훨씬 높았습니다. 이 연구는 실험실에서 수행되지 않고 실제 시험 환경과 채점 기준을 사용하여 수행되었습니다. 그 결과는 충격적이며 학문적 정직성과 교육 시스템에 심각한 도전을 제기합니다. 이 연구에서는 AI의 '진정성'을 보장하기 위해 GPT-4를 사용하여 아무런 수정 없이 답변을 생성했으며 학술 글쓰기에서 AI의 위력을 충분히 입증했습니다.
대학 수능 시험장에서 AI '침략'이 조용히 일어났다. 영국 레딩대학교 연구 결과에 따르면 실제 대학 시험에서 AI가 생성한 답변의 94%가 교사의 눈을 피해 간과되는 놀라운 현상이 드러났다. 더욱 충격적인 것은 이들 AI '동급생'이 83.4%의 경우에서 인간 학생보다 훨씬 더 높은 점수를 받았다는 것입니다. 이는 AI가 인간의 업무를 대체할 가능성을 보여줄 뿐만 아니라, 인지 업무에서도 대학생을 앞지르기 시작했음을 시사하는 것으로 보인다.
본 연구는 폐쇄된 연구실이 아닌 실제 검사 환경에서 진행되었습니다. 연구팀은 평가자에게 알리지 않은 채 레딩대학교 심리학 및 임상언어과학부에서 '튜링 테스트'를 실시했다. 시험에는 단답형 문제와 논술형 문제가 포함되며 AI 생성 콘텐츠가 혼합되어 약 5%를 차지합니다. 연구원들은 GPT-4가 답변을 생성할 수 있도록 표준화된 프롬프트 단어를 사용했지만 AI의 "진위성"을 보장하기 위해 내용을 수정하지 않았습니다.

마킹 프로세스는 University of Reading의 엄격한 표준을 따르며 예비 마킹, 독립적 검토 및 마킹 팀과의 교정 회의를 포함합니다. 그러나 이러한 정밀 조사에도 불구하고 AI가 제출한 과제는 여전히 꿰뚫어보기가 어렵습니다. 연구 결과에 따르면 AI가 생성한 과제는 여러 모듈에서 발견되지 않으며 점수가 높은 영역에 집중되는 경우가 많습니다.
이 발견은 학문적 진실성과 교육 목표에 대한 심오한 성찰을 촉발시켰습니다. 학생들이 AI를 사용하여 발견하기 어려운 고품질 콘텐츠를 생성할 수 있다면 이 새로운 기술에 적응하기 위해 교육 시스템을 어떻게 개혁해야 합니까? 작년에 Nature의 한 논문에서는 AI가 대학 졸업에 더 효과적이라고 지적했습니다. 교과 과정 대학의 교육 목표와 일치하는 정보를 검색, 통합 및 비판적으로 분석하는 능력을 이미 입증했습니다.
이번 연구의 결론은 확실히 우려스럽습니다. GPT-4의 능력으로 인해 학생들이 AI를 사용하여 부정 행위를 감지하기가 어렵고 더 나은 결과를 얻을 가능성이 매우 높습니다. 이는 학문적 진실성에 대한 도전일 뿐만 아니라, 미래 교육의 방향에 대해 고민하게 만드는 계기가 됩니다. 일부 네티즌들은 농담으로 이 연구도 AI로 완성됐느냐고 의문을 제기했지만, 저자는 연구 내용이 전적으로 인간이 진행한 것이라고 엄숙하게 밝혔다.
이 연구의 결과로 인해 우리는 학업 성실성을 유지하기 위한 교육 평가 방법과 메커니즘을 재검토하게 되었습니다. AI 기술의 급속한 발전 속에서 학생들의 비판적 사고와 혁신 능력을 어떻게 함양할 것인지, 그리고 시험의 공정성과 공정성을 어떻게 보장할 것인지는 앞으로 교육 현장에서 집중적으로 다루어야 할 문제가 될 것이다. 인공지능 시대의 새로운 도전에 적응하기 위해서는 새로운 교수 모델과 평가 방법을 적극적으로 모색해야 합니다.