Bei der College-Aufnahmeprüfung 2024 nahmen neun große KI-Modelle an der beispiellosen Herausforderung teil, die College-Aufnahmeprüfung abzulegen, insbesondere an der äußerst schwierigen Henan-Prüfung. Dieser von den Medien organisierte Test zielt darauf ab, die tatsächlichen Fähigkeiten der KI im akademischen Bereich zu bewerten und wertvolle Daten für unser Verständnis der Unterschiede zwischen KI und menschlicher Intelligenz zu liefern. Die Ergebnisse dieses Tests sind auffällig. Die Ergebnisse einiger KI-Modelle übertrafen sogar die Ergebnisse der ersten Reihe, was breite Aufmerksamkeit und hitzige Diskussionen hervorrief und auch neue Überlegungen für die zukünftige Entwicklungsrichtung der KI-Technologie lieferte.
Unter den neun AIs, die am Test teilnahmen, übertrafen die Ergebnisse von vier AIs die erste Zeile der Aufnahmeprüfung für das Henan College. GPT-4o gewann den ersten Platz mit einer hohen Punktzahl von 562 Punkten und übertraf damit die erste Reihe um 41 Punkte, während Doubao von ByteDance mit 542,5 Punkten dicht dahinter folgte und zum besten inländischen Modell wurde.

In geisteswissenschaftlichen Fächern, insbesondere Chinesisch und Englisch, schneidet die KI gut ab, in naturwissenschaftlichen Fächern, insbesondere Mathematik, jedoch nicht so gut. Es ist ersichtlich, dass KI in Sprachfächern offensichtliche Vorteile gezeigt hat und ihre Fähigkeit, antike Poesie zu verstehen, beeindruckend ist.

Die Leistung der KI bei einfachen Argumentationsfragen ist akzeptabel, bei Fragen, die komplexe Ableitungen und Beweise erfordern, ist ihre Leistung jedoch schlecht, was zeigt, dass ihre logischen Fähigkeiten verbessert werden müssen. Im Gesamtfach Geisteswissenschaften schnitt das Fach Geographie am schlechtesten ab, während im Gesamtfach Naturwissenschaften das Fach Biologie relativ gut abgeschnitten hat. GPT-4o schnitt im politischen Fach mit einer hohen Punktzahl von 91,5 Punkten hervorragend ab.
Testmethoden und Bewertungsstandards
Testrunden: Um den Einfluss des Zufalls zu reduzieren, wurden alle Probanden zwei Runden lang getestet und die Durchschnittspunktzahl als Endpunktzahl herangezogen.
Eingabeformat: Formeln werden im Markdown/LaTeX-Format eingegeben. Bei Bildfragen werden entsprechend den Erkennungsfähigkeiten des Modells entsprechende Bilder und Texte eingegeben.
Testbetrieb: Ein professioneller KI-Datendienstleister führt einheitliche und standardisierte Test-Screenshots durch, um die Fairness des Tests sicherzustellen.
Bewertungsmethode: Bei menschlichen Kandidaten werden dieselben Bewertungsstandards angewendet, um eine faire Bewertung sicherzustellen.
Dieser Versuch der KI, an der Hochschulaufnahmeprüfung teilzunehmen, demonstriert nicht nur die Vorteile der KI in bestimmten Bereichen, sondern deckt auch ihre Mängel beim logischen Denken und bei mathematischen Beweisen auf. Ein KI-Kandidat zitierte in seinem Aufsatz: „Der Weg ist lang und lang, und ich werde auf und ab suchen.“ Dies ist nicht nur eine Darstellung der Entwicklung der KI, sondern auch eine anschauliche Beschreibung der kontinuierlichen Erforschung der KI durch den Menschen die unbekannte Welt. Durch diesen Test erhalten wir ein tieferes Verständnis des Intelligenzniveaus der KI und er liefert auch wertvolle Hinweise für die zukünftige Entwicklungsrichtung der KI.
Die Liste der Kandidaten umfasst bekannte KI-Produkte wie GPT-4o von OpenAI, Doubao von ByteDance und Wenxin 4.0 von Baidu. Ihre Leistung bei dieser College-Aufnahmeprüfung wird zweifellos einen tiefgreifenden Einfluss auf die Entwicklung der KI-Technologie haben.
Dieses Experiment zur KI-Hochschulaufnahmeprüfung liefert uns tiefgreifende Einblicke in den aktuellen Stand und die zukünftige Richtung der Entwicklung künstlicher Intelligenz und zeigt auch die Herausforderungen auf, denen wir bei der Suche nach allgemeiner künstlicher Intelligenz noch gegenüberstehen. Ich glaube, dass KI in Zukunft ihr Potenzial in mehr Bereichen unter Beweis stellen und der menschlichen Gesellschaft größere Fortschritte bringen wird.