Tencent Hunyuan, le modèle de réflexion approfondi en profondeur "T1" est officiellement publié - Article AI

Auteur：Eve Cole Date de mise à jour：2025-05-22 19:50:02

2025 Binance directe

Site Web officiel www.binance.com/ZH-CN :Entrez le site officiel ☜☜
Application: ☞☞Official App Download☜☜

Récemment, Tencent a officiellement lancé son modèle de réflexion profonde à développer auto-développé - la version officielle de Hunyuan T1. La publication de ce modèle marque une nouvelle étape dans la force technique de Tencent dans le domaine de l'intelligence artificielle, en particulier dans le raisonnement profond et la résolution de problèmes complexes.

Sur la base de l'apprentissage par renforcement à grande échelle, la version officielle de Hunyuan T1 a spécialement optimisé des problèmes scientifiques tels que les mathématiques, le raisonnement logique, la science et le code, réalisant ainsi une amélioration significative de la capacité de raisonnement. Sur les références communes, telles que MMLU-PRO, l'ensemble de données d'amélioration de l'évaluation du modèle de grande langue, Hunyuan T1 a obtenu d'excellents résultats de 87,2 points, juste derrière le modèle supérieur O1. Dans le même temps, dans les tests de référence publics des connaissances chinoises et en anglais telles que ceval, AIME, la logique zébrée et les mathématiques au niveau de la compétition et le raisonnement logique, Hunyuan T1 a également montré le niveau de modèle d'inférence principal de l'industrie.

Tencent est le plus fort! Le modèle de pensée profonde de Hunyuan est officiellement libéré: la prononciation rapide et peut répondre en quelques secondes

En plus des capacités de raisonnement de base, la version officielle de Hunyuan T1 montre également une très forte adaptabilité dans un certain nombre de tâches d'alignement, des tâches de suivi des instructions et des tâches d'utilisation des outils. Cela est dû à son adoption de l'architecture innovante de Hunyuan Turbo S et à son adoption du modèle de fusion hybride-mamba-transformateur. C'est la première fois dans l'industrie que l'architecture hybride Mamba est appliquée sans perte à des modèles d'inférence super-larges, réduisant efficacement la complexité de calcul des structures de transformateurs traditionnelles et réduisant l'empreinte mémoire de KV-Cache, réduisant ainsi considérablement les coûts de formation et d'inférence.

En outre, sur la base d'excellentes capacités de capture d'articles à long terme, Hunyuan T1 peut résoudre efficacement des problèmes de perte de contexte et de dépendance à longue distance dans le raisonnement d'articles à long terme. L'architecture hybride Mamba a été spécialement optimisée pour le traitement de la séquence longue. Grâce à des méthodes de calcul efficaces, il peut réduire considérablement la consommation de ressources tout en garantissant la capacité de capturer de longs informations de texte. Avec des paramètres d'activation similaires, Hunyuan T1 atteint la vitesse de décodage de 2 fois.

À l'heure actuelle, Tencent Hunyuan T1 a ouvert l'expérience et lancé des services d'API. Les utilisateurs peuvent profiter de la commodité et de l'efficacité apportées par ce puissant modèle d'inférence en fonction de leurs besoins au prix d'entrée de 1 yuan par million de jetons et du prix de production de 4 yuans par million de jetons. Le lancement de ce service fournira sans aucun doute aux développeurs et aux entreprises des solutions plus intelligentes et promouvra l'application généralisée de la technologie de l'intelligence artificielle.