Lors de l'examen d'entrée à l'université de 2024, neuf grands modèles d'IA ont participé au défi sans précédent consistant à passer l'examen d'entrée à l'université, en particulier l'examen extrêmement difficile du Henan. Ce test organisé par les médias vise à évaluer les capacités réelles de l’IA dans le domaine académique et à fournir des données précieuses pour notre compréhension des différences entre l’IA et l’intelligence humaine. Les résultats de ce test sont accrocheurs. Les résultats de certains modèles d'IA ont même dépassé les résultats de première ligne, ce qui a suscité une large attention et des discussions animées et a fourni une nouvelle réflexion sur l'orientation future du développement de la technologie de l'IA.
Parmi les neuf IA qui ont participé au test, les scores de quatre IA ont dépassé la première ligne de l'examen d'entrée au Henan College. GPT-4o a remporté la première place avec un score élevé de 562 points, dépassant la première ligne de 41 points, tandis que Doubao de ByteDance a suivi de près avec 542,5 points, devenant ainsi le meilleur parmi les modèles nationaux.

L’IA obtient de bons résultats dans les matières d’arts libéraux, en particulier les matières chinoises et anglaises, mais pas aussi bien dans les matières scientifiques, notamment les mathématiques. On peut constater que l’IA a montré des avantages évidents dans les matières linguistiques et que sa capacité à comprendre la poésie ancienne est impressionnante.

Les performances de l'IA sur des questions de raisonnement simples sont acceptables, mais ses performances sur des questions nécessitant une dérivation et une preuve complexes sont médiocres, ce qui montre que sa capacité logique doit être améliorée. Dans la discipline générale des arts libéraux, la matière de géographie a obtenu les pires résultats, tandis que dans la discipline générale des sciences, la matière de biologie a obtenu des résultats relativement bons. GPT-4o a réalisé des performances exceptionnelles dans le domaine politique avec un score élevé de 91,5 points.
Méthodes de test et normes de notation
Tours de tests : afin de réduire l'impact du caractère aléatoire, tous les sujets ont été testés pendant deux tours et le score moyen a été pris comme score final.
Format de saisie : les formules sont saisies au format Markdown/LaTeX. Pour les questions d'image, les images et le texte correspondants sont saisis en fonction des capacités de reconnaissance du modèle.
Opération de test : un fournisseur de services de données d'IA professionnel effectue des captures d'écran de test unifiées et standardisées pour garantir l'équité du test.
Méthode de notation : les mêmes normes de notation sont utilisées avec les candidats humains pour garantir l'équité de la notation.
Cette tentative d'IA de participer à l'examen d'entrée à l'université démontre non seulement les avantages de l'IA dans des domaines spécifiques, mais expose également ses lacunes en matière de raisonnement logique et de preuves mathématiques. Comme l'a cité un candidat à l'IA dans son essai : « Le chemin est long et long, et je vais chercher de haut en bas. » Il s'agit non seulement d'un portrait du développement de l'IA, mais aussi d'une description vivante de l'exploration continue de l'être humain. le monde inconnu. Grâce à ce test, nous avons une compréhension plus approfondie du niveau d'intelligence de l'IA et il fournit également une référence précieuse pour l'orientation future du développement de l'IA.
La liste des candidats comprend des produits d'IA bien connus tels que GPT-4o d'OpenAI, Doubao de ByteDance et Wenxin 4.0 de Baidu. Leurs performances à cet examen d'entrée à l'université auront sans aucun doute un impact profond sur le développement de la technologie de l'IA.
Cette expérience d'examen d'entrée à l'université d'IA nous fournit un aperçu approfondi de l'état actuel et de l'orientation future du développement de l'intelligence artificielle, et met également en évidence les défis auxquels nous sommes encore confrontés dans la poursuite de l'intelligence artificielle générale. Je crois qu'à l'avenir, l'IA montrera son potentiel dans davantage de domaines et apportera de plus grands progrès à la société humaine.