Eine Studie der University of Reading im Vereinigten Königreich hat Bedenken hinsichtlich der Anwendung von KI im akademischen Bereich geäußert. Die Studie ergab, dass bei echten Universitätsprüfungen 94 % der von KI generierten Antworten von Lehrern nicht gesehen wurden und die KI-Ergebnisse in 83,4 % der Fälle deutlich höher waren als die von menschlichen Studenten. Diese Studie wurde nicht in einem Labor durchgeführt, sondern unter Verwendung realer Prüfungsumgebungen und Bewertungsstandards. Die Ergebnisse sind schockierend und stellen ernsthafte Herausforderungen für die akademische Integrität und das Bildungssystem dar. Diese Studie nutzte GPT-4, um Antworten ohne jegliche Modifikationen zu generieren, um die „Authentizität“ der KI sicherzustellen und die Leistungsfähigkeit der KI beim wissenschaftlichen Schreiben umfassend zu demonstrieren.
Im Prüfungsraum der Universitätsprüfungen hat die „Invasion“ der KI still und leise stattgefunden. Untersuchungen der University of Reading im Vereinigten Königreich brachten ein erstaunliches Phänomen zutage: Bei tatsächlichen Universitätsprüfungen entgingen 94 % der KI-generierten Antworten den Augen der Lehrer und wurden nicht durchschaut. Noch schockierender ist, dass diese KI-„Klassenkameraden“ in 83,4 % der Fälle deutlich bessere Ergebnisse erzielten als menschliche Schüler. Dies scheint darauf hinzudeuten, dass KI nicht nur das Potenzial hat, menschliche Arbeit zu ersetzen, sondern auch beginnt, Studenten bei kognitiven Aufgaben zu übertreffen.
Diese Forschung fand nicht in einem geschlossenen Labor statt, sondern in einer realen Untersuchungsumgebung. Das Forschungsteam führte einen „Turing-Test“ an der School of Psychology and Clinical Speech Sciences der University of Reading durch, ohne die Bewerter zu informieren. Die Prüfung umfasst Kurzantwortfragen und Aufsatzfragen, wobei KI-generierte Inhalte beigemischt sind, was etwa 5 % ausmacht. Die Forscher verwendeten standardisierte Eingabeaufforderungswörter, um GPT-4 Antworten generieren zu lassen, nahmen jedoch keine Änderungen am Inhalt vor, um die „Authentizität“ der KI sicherzustellen.

Der Bewertungsprozess folgt den strengen Standards der University of Reading und umfasst vorläufige Bewertung, unabhängige Überprüfung und Kalibrierungstreffen mit dem Bewertungsteam. Allerdings sind die von der KI eingereichten Aufgaben selbst bei einer solchen Prüfung immer noch schwer zu durchschauen. Forschungsergebnisse zeigen, dass KI-generierte Aufgaben nicht in mehreren Modulen zu finden sind und die Bewertungen häufig auf Bereiche mit hoher Punktzahl konzentriert sind.
Diese Entdeckung löste tiefgreifende Überlegungen zur akademischen Integrität und zu Bildungszielen aus. Wenn Schüler mithilfe von KI qualitativ hochwertige Inhalte generieren können, die schwer zu entdecken sind, wie sollten wir dann das Bildungssystem reformieren, um es an diese neue Technologie anzupassen? Letztes Jahr wurde in einem Artikel in Nature auch darauf hingewiesen, dass KI beim Abschluss eines Studiums effektiver ist Studienleistungen haben bereits die Fähigkeit nachgewiesen, Informationen zu recherchieren, zu integrieren und kritisch zu analysieren, was mit den Ausbildungszielen der Universität übereinstimmt.
Die Schlussfolgerungen der Studie sind sicherlich besorgniserregend. Die Fähigkeit von GPT-4 macht es für Schüler schwierig, Betrug mithilfe von KI zu erkennen, und es besteht eine sehr hohe Wahrscheinlichkeit, bessere Ergebnisse zu erzielen. Dies stellt nicht nur eine Herausforderung für die akademische Integrität dar, sondern veranlasst uns auch, über die zukünftige Ausrichtung der Bildung nachzudenken. Obwohl einige Internetnutzer scherzhaft fragten, ob diese Forschung auch von KI durchgeführt wurde, erklärte der Autor feierlich, dass der Forschungsinhalt vollständig von Menschen durchgeführt wurde.
Die Ergebnisse dieser Studie zwingen uns dazu, die Methoden und Mechanismen zur Bildungsbewertung zur Aufrechterhaltung der akademischen Integrität zu überdenken. Angesichts der rasanten Entwicklung der KI-Technologie wird die Frage, wie das kritische Denken und die Innovationsfähigkeit von Schülern gefördert werden können und wie die Fairness und Gerechtigkeit von Prüfungen sichergestellt werden kann, zu Themen werden, auf die sich der Bildungsbereich in Zukunft konzentrieren muss. Wir müssen aktiv neue Lehrmodelle und Bewertungsmethoden erforschen, um uns an die neuen Herausforderungen im Zeitalter der künstlichen Intelligenz anzupassen.