Site Web officiel www.binance.com/ZH-CN :Entrez le site officiel ☜☜
Application: ☞☞Official App Download☜☜
Récemment, Tencent a officiellement publié la dernière version de la série Hunyuan Big Model - Hunyuan-T1. Ce modèle est basé sur la base à échelle moyenne Hunyuan. Après la formation de post-formation à grande échelle, il améliore considérablement sa capacité de raisonnement, en particulier dans la pensée profonde et la résolution de problèmes complexes. Depuis le lancement de Hunyuan T1-Preview en février de cette année, les utilisateurs ont connu un processus de réflexion plus rapide et plus profond, et le lancement de cette version officielle marque une nouvelle mise à niveau de cette série de produits.

L'équipe de recherche et développement de Hunyuan-T1 a adopté le dernier Turbos Dock, un modèle de MAMA de transformateur hybride-transformateur-Mamba de pointe de l'industrie. Les turbos montrent des avantages uniques lorsqu'ils traitent d'une longue inférence du texte, résolvant efficacement les problèmes de perte de contexte et de dépendance à longue distance. De plus, l'architecture Mamba a également été spécialement optimisée pour réduire considérablement la consommation de ressources informatiques tout en maintenant les capacités de capture des informations. Selon les données officielles, dans les mêmes conditions de déploiement, la vitesse de décodage de Hunyuan-T1 est deux fois plus rapide.

Au stade post-formation, l'équipe a investi 96,7% de la puissance de calcul pour la formation d'apprentissage par renforcement, en se concentrant sur l'amélioration des capacités de raisonnement et l'optimisation de l'alignement des préférences humaines. L'équipe a rassemblé un grand nombre de problèmes scientifiques mondiaux, couvrant des domaines tels que les mathématiques, le raisonnement logique, la science et le code, pour s'assurer que le modèle montre des performances exceptionnelles dans diverses tâches de raisonnement. La méthode d'apprentissage du cours est adoptée dans la formation pour augmenter progressivement la difficulté des données, afin que le modèle puisse mieux faire face aux tâches d'inférence complexes.
Expérience d'entrée: https://llm.hunyuan.tencent.com/?ref=producthunt#/chat/hy-t1