OpenAI sort GPT-4.5: Le modèle le plus puissant à ce jour dévoile pour améliorer le raisonnement et l'intelligence émotionnelle - Articles AI

Auteur：Eve Cole Date de mise à jour：2025-05-25 18:50:02

Le 27 février 2025, Openai a officiellement publié son dernier modèle de langue GPT-4.5, qui a été le premier à être ouvert aux utilisateurs de Chatgpt Pro en tant que version d'aperçu de recherche, avec des frais d'abonnement de 200 $ US par mois. Construit sur GPT-4O, ce modèle est largement considéré comme le modèle de langage le plus grand et le plus compétent à ce jour. GPT-4.5 a réalisé des améliorations significatives de sa capacité d'inférence, de l'intelligence émotionnelle, des fonctions pratiques telles que l'écriture et la programmation, marquant une autre percée majeure dans la technologie de l'intelligence artificielle. Openai a déclaré qu'au cours des prochaines semaines, le GPT-4.5 sera progressivement ouvert aux utilisateurs de plus, d'équipe, d'entreprise et d'Edu, élargissant encore sa portée d'application.

GPT-4.5 a montré des progrès remarquables dans de nombreux domaines. Selon la carte du système publiée par OpenAI, le modèle réduit considérablement le phénomène «illusion» (c'est-à-dire les informations d'erreur ou de fiction) par le biais de la formation de réglage fin (SFT) et de renforcement (RLHF) supervisé, et améliore la naturalité de l'intelligence émotionnelle et de l'interaction des utilisateurs. Par exemple, dans le test Personqa, le taux d'hallucination de GPT-4,5 n'était que de 19%, ce qui est bien inférieur aux 52% de GPT-4O. En termes d'expérience utilisateur, GPT-4.5 fonctionne bien dans l'écriture et la programmation des tâches, produisant plus précisément du contenu créatif et esthétique tout en comprenant les intentions des utilisateurs. L'utilisateur de X Simon Willison a déclaré après l'essai: "Il fonctionne mieux en termes de profondeur de connaissances et de génération de contenu (comme le dessin du pélican), et a une expérience interactive plus naturelle." De plus, le modèle prend en charge les téléchargements de fichiers et d'images et intègre l'outil Canvas de ChatGPT, mais ne prend actuellement pas en charge les fonctionnalités multimodales telles que le partage de voix, de vidéo ou d'écran.

OpenAI a révélé que les données de formation de GPT-4.5 proviennent de divers canaux, notamment des données publiques, des données de partenaire propriétaire et des ensembles de données personnalisés internes, qui sont strictement filtrés pour garantir la qualité et la protection de la confidentialité. En termes de sécurité, le modèle est équipé d'une API de modération et d'un classificateur pour empêcher efficacement la génération de contenu nocif. Dans les évaluations tierces, la recherche Apollo et le METR ont testé le risque de fraude et d'autonomie de GPT-4.5, et les résultats ont montré que son risque global était "moyen". En particulier dans les domaines de la chimie, de la biologie, des matières nucléaires radioactives (CBRN) et de la persuasion, les risques sont modérés, tandis que la cybersécurité et l'autonomie des modèles sont faibles. OpenAI a pris des mesures telles que la pré-formation pour filtrer les données CBRN et surveiller les abus potentiels pour assurer la sécurité.

Les commentaires du premier lot d'utilisateurs ont montré que GPT-4.5 était bien reçu en termes de connaissances et de créativité. X L'utilisateur @pckraftwerk a loué ses "capacités d'écriture et de codage considérablement améliorées, avec des phénomènes d'hallucination réduits". Cependant, le problème de vitesse a également attiré l'attention. Simon Willison a souligné que lorsqu'il est utilisé via l'API, GPT-4.5 est lent à répondre, ce qui peut affecter les scénarios d'application en temps réel. Il a également révélé que le modèle utilise 10 fois plus de ressources informatiques de formation que GPT-4, et l'amélioration des performances est un énorme investissement derrière. De plus, OpenAI a clairement indiqué que GPT-4.5 n'est pas conçu pour un raisonnement profond, et il est recommandé aux utilisateurs de choisir le modèle O1 ou O3-MinI lorsque un raisonnement complexe est nécessaire. Ce positionnement a également déclenché une discussion.

En tant que dernier chef-d'œuvre d'Openai, GPT-4.5 serait favorable à l'innovation de la productivité dans des domaines tels que l'écriture, la programmation et la résolution de problèmes. Ses performances multilingues sont également impressionnantes. Dans le test de référence MMLU, le taux de précision anglais a atteint 0,896, l'espagnol 0,8840 et l'arabe 0,8598, dépassant le GPT-4O dans tous les aspects. Les initiés de l'industrie prévoient qu'avec la promotion progressive de GPT-4.5, ses fonctions puissantes et sa haute sécurité consolideront davantage la position d'Openai dans le domaine de l'IA. À l'avenir, OpenAI prévoit d'optimiser le modèle en fonction des commentaires des utilisateurs et peut étendre des fonctions telles que la voix et la vidéo pour enrichir davantage ses scénarios d'application.

La publication de GPT-4.5 démontre non seulement les ambitions techniques d'OpenAI, mais met également en évidence son accent sur la sécurité et l'expérience utilisateur. Bien que le problème de vitesse reste à résoudre, ce modèle ouvre sans aucun doute un nouveau chapitre dans le développement de l'IA. Comme l'a dit Openai dans sa déclaration: "Nous espérons que GPT-4.5 apportera aux utilisateurs une expérience d'assistant plus intelligente et plus fiable."