GPT-4 притворился студентом колледжа и сдал экзамен, чтобы скрыться от глаз учителя: 83,4% результатов оказались выше, чем у студентов-людей.

Автор：Eve Cole Время обновления：2025-02-27 10:25:02

Исследование Университета Рединга в Великобритании вызвало обеспокоенность по поводу применения ИИ в академических областях. Исследование показало, что на реальных экзаменах в колледже 94% ответов, сгенерированных ИИ, не были видны учителям, а оценки ИИ были значительно выше, чем у студентов-людей в 83,4% случаев. Это исследование проводилось не в лаборатории, а с использованием реальных экзаменационных условий и стандартов оценки. Результаты шокируют и создают серьезные проблемы для академической честности и системы образования. В этом исследовании GPT-4 использовался для генерации ответов без каких-либо модификаций, чтобы гарантировать «подлинность» ИИ, и полностью продемонстрировал мощь ИИ в академических текстах.

В экзаменационной комнате университетских экзаменов незаметно произошло «вторжение» ИИ. Исследование Университета Рединга в Великобритании выявило удивительный феномен: на реальных университетских экзаменах 94% ответов, сгенерированных ИИ, ускользнули от глаз преподавателей и не были замечены. Что еще более шокирует, так это то, что эти «одноклассники» с искусственным интеллектом в 83,4% случаев набрали значительно больше баллов, чем студенты-люди. Похоже, это указывает на то, что ИИ не только демонстрирует потенциал в замене человеческого труда, но и начинает превосходить студентов колледжей в решении когнитивных задач.

Это исследование проводилось не в закрытой лаборатории, а в реальной экзаменационной среде. Исследовательская группа провела «тест Тьюринга» в Школе психологии и клинической речи Университета Рединга, не проинформировав оценщиков. Экзамен включает в себя вопросы с короткими ответами и вопросы-эссе, а также контент, созданный искусственным интеллектом, что составляет около 5%. Исследователи использовали стандартизированные слова-подсказки, чтобы позволить GPT-4 генерировать ответы, но не вносили никаких изменений в контент, чтобы гарантировать «подлинность» ИИ.

Процесс выставления оценок соответствует строгим стандартам Университета Рединга и включает в себя предварительную выставление оценок, независимую проверку и калибровочные встречи с командой по выставлению оценок. Однако даже при таком тщательном рассмотрении задания, представленные ИИ, по-прежнему трудно довести до конца. Результаты исследований показывают, что задания, созданные с помощью ИИ, не встречаются в нескольких модулях, а оценки часто концентрируются в областях с высокими оценками.

Это открытие вызвало глубокие размышления об академической честности и образовательных целях. Если студенты могут использовать ИИ для создания высококачественного контента, который трудно обнаружить, то как нам реформировать систему образования, чтобы адаптироваться к этой новой технологии? В прошлом году статья в журнале Nature также отметила, что ИИ более эффективен при окончании колледжа? Курсовая работа Уже продемонстрировала способность искать, интегрировать и критически анализировать информацию, что совпадает с целями обучения вуза.

Выводы исследования, безусловно, вызывают беспокойство. Способность GPT-4 затрудняет учащимся обнаружение мошенничества с помощью ИИ, и существует очень высокая вероятность достижения лучших результатов. Это не только бросает вызов академической честности, но и заставляет нас задуматься о будущем направлении образования. Хотя некоторые пользователи сети в шутку задавались вопросом, было ли это исследование также завершено ИИ, автор торжественно заявил, что содержание исследования было полностью проведено людьми.

Результаты данного исследования заставляют нас пересмотреть методы и механизмы образовательной оценки для поддержания академической честности. В условиях быстрого развития технологий искусственного интеллекта вопросы, на которых необходимо сосредоточить внимание в сфере образования в будущем, заключаются в том, как развивать критическое мышление и инновационные способности учащихся, а также как обеспечить справедливость и беспристрастность экзаменов. Нам необходимо активно изучать новые модели обучения и методы оценки, чтобы адаптироваться к новым вызовам эпохи искусственного интеллекта.