Après un événement de diffusion en direct de partage technologique de 12 jours, OpenAI a publié le modèle d'inférence de nouvelle génération o3, ainsi qu'une version simplifiée d'o3-mini optimisée pour des tâches spécifiques. o3 a fait des progrès révolutionnaires dans plusieurs tests de référence, ses performances dépassent considérablement le modèle de génération précédente o1 et se rapprochent même du niveau de l'intelligence générale artificielle (AGI) dans certains aspects. Cette version a attiré une large attention dans l'industrie et est censée avoir un impact profond sur les futures méthodes de programmation et les modèles de travail des programmeurs.
Après 12 jours de partage de technologie en direct, OpenAI a publié le dernier jour son modèle d'inférence de nouvelle génération o3, qui est une version améliorée du modèle d'inférence o1 publié plus tôt. La série de modèles o3 comprend deux versions : o3 et o3-mini, dont o3-mini est un modèle plus petit et rationalisé, adapté à des tâches spécifiques. OpenAI a déclaré que le modèle o3 peut se rapprocher de l'intelligence artificielle générale (AGI) dans certaines conditions, c'est-à-dire une intelligence artificielle capable d'accomplir n'importe quelle tâche que les humains peuvent accomplir.
Dans le test d'inférence logique graphique ARC-AGI, le modèle o3 a atteint des scores records, avec un score de 75,7 % dans le scénario de calcul faible, tandis que dans le test de calcul élevé, il a atteint 87,5 %, dépassant la référence qui marque l'atteinte des niveaux humains. Seuil 85%. En comparaison, le modèle o1 n’obtient qu’entre 25 % et 32 %, et o3 est presque trois fois plus performant que o1. Sur la plateforme de compétition de codage de renommée mondiale Codeforces, o3 a obtenu un score de 2 727, tandis que o1 n'a obtenu qu'un score de 1 891.

Fu Sheng, président de Cheetah Mobile ou Orion Star, a déclaré que la sortie d'OpenAI o3 annonce l'arrivée d'une ère où tout le monde est programmeur. Les utilisateurs n'ont pas besoin de maîtriser le langage Python ou C pour écrire des programmes. proposer des exigences et le grand modèle de prédiction peut aider à terminer le travail de programmation. Fu Sheng estime que la sortie d'o3 marque que la capacité de programmation des grands modèles de langage dépasse 99,9 % des programmeurs. Lors du concours de programmation de classe mondiale Codeforces, o3 a obtenu le meilleur résultat de la 175e place, tandis qu'o1 n'a battu que plus de 90 %. programmeurs, GPT-4o n'a vaincu que 11 % des programmeurs auparavant.
OpenAI prévoit de publier officiellement le modèle o3 fin janvier de l'année prochaine. Fu Sheng a souligné que même si les programmeurs ne disparaîtront pas complètement, leur travail se concentrera davantage sur la compréhension des besoins des utilisateurs et la construction d'une logique globale, et que le travail de conversion des besoins en code sera en grande partie complété par l'IA. Cette version annonce une application plus large de l’IA dans le domaine de la programmation et pourrait également changer la façon dont les programmeurs travaillent.
La sortie du modèle o3 marque un progrès significatif dans la technologie de l'intelligence artificielle, et ses puissantes capacités de raisonnement et de programmation auront un impact profond sur divers domaines. À l’avenir, avec le développement et l’amélioration continus de la technologie, nous pouvons nous attendre à ce que l’intelligence artificielle joue un rôle plus important dans davantage de domaines et apporte plus de commodité à la société humaine.