Um estudo da Universidade de Reading, no Reino Unido, levantou preocupações sobre a aplicação da IA em campos acadêmicos. O estudo descobriu que em exames universitários reais, 94% das respostas geradas pela IA não foram vistas pelos professores, e as pontuações da IA foram significativamente mais altas do que as dos alunos humanos em 83,4% dos casos. Este estudo não foi conduzido em laboratório, mas utilizou ambientes de exame e padrões de pontuação da vida real. Os resultados são chocantes e colocam sérios desafios à integridade académica e ao sistema educativo. Este estudo usou GPT-4 para gerar respostas sem quaisquer modificações para garantir a “autenticidade” da IA e demonstrou plenamente o poder da IA na redação acadêmica.
Na sala de exames universitários, a “invasão” da IA ocorreu silenciosamente. Uma investigação da Universidade de Reading, no Reino Unido, revelou um fenómeno surpreendente: em exames universitários reais, 94% das respostas geradas pela IA escaparam aos olhos dos professores e não foram percebidas. O que é ainda mais chocante é que esses “colegas” de IA obtiveram pontuações significativamente mais altas do que os estudantes humanos em 83,4% dos casos. Isto parece indicar que a IA não só mostra potencial em substituir o trabalho humano, mas também começa a superar os estudantes universitários em tarefas cognitivas.
Esta pesquisa não ocorreu em laboratório fechado, mas sim em ambiente real de exame. A equipe de pesquisa conduziu um “teste de Turing” na Escola de Psicologia e Ciências Clínicas da Fala da Universidade de Reading sem informar os avaliadores. O exame inclui questões de resposta curta e questões dissertativas, com conteúdo gerado por IA misturado, representando cerca de 5%. Os pesquisadores usaram palavras de alerta padronizadas para permitir que o GPT-4 gerasse respostas, mas não fizeram nenhuma modificação no conteúdo para garantir a “autenticidade” da IA.

O processo de avaliação segue os rigorosos padrões da Universidade de Reading e inclui avaliação preliminar, revisão independente e reuniões de calibração com a equipe de avaliação. No entanto, mesmo sob tal escrutínio, as tarefas apresentadas pela IA ainda são difíceis de ver. Os resultados da pesquisa mostram que as tarefas geradas pela IA não são encontradas em vários módulos e as pontuações são frequentemente concentradas em áreas de alta pontuação.
Esta descoberta suscitou reflexões profundas sobre a integridade acadêmica e os objetivos educacionais. Se os alunos podem usar a IA para gerar conteúdos de alta qualidade que são difíceis de descobrir, então como deveríamos reformar o sistema educativo para nos adaptarmos a esta tecnologia emergente. No ano passado, um artigo na Nature também apontou que a IA é mais eficaz na conclusão da faculdade? cursos Já demonstrou capacidade de pesquisar, integrar e analisar criticamente informações, o que coincide com os objetivos de formação da universidade.
As conclusões do estudo são certamente preocupantes. A capacidade do GPT-4 torna difícil para os alunos detectarem trapaças usando IA, e há uma probabilidade muito alta de obter melhores resultados. Isto não só representa um desafio à integridade académica, mas também nos leva a pensar sobre a direção futura da educação. Embora alguns internautas questionem, brincando, se esta pesquisa também foi concluída pela IA, o autor afirmou solenemente que o conteúdo da pesquisa foi inteiramente conduzido por humanos.
Os resultados deste estudo obrigam-nos a reexaminar os métodos e mecanismos de avaliação educacional para manter a integridade acadêmica. Face ao rápido desenvolvimento da tecnologia de IA, como cultivar o pensamento crítico e as capacidades inovadoras dos alunos, e como garantir a equidade e justiça dos exames tornar-se-ão questões que precisam de ser focadas no campo da educação no futuro. Precisamos explorar ativamente novos modelos de ensino e métodos de avaliação para nos adaptarmos aos novos desafios da era da inteligência artificial.