Le modèle de fusion "Daily New" lancé par Sensetime marque récemment une percée majeure du traitement multimodal de l'information dans le domaine de l'intelligence artificielle. Ce modèle fait non seulement des progrès significatifs dans le traitement de la fusion de divers types d'informations tels que le texte, les images, les vidéos, etc., mais réalise également un saut qualitatif dans des capacités de raisonnement profonde, apportant une nouvelle orientation de développement à l'industrie.
Selon le "Rapport annuel de 2024 sur l'évaluation chinoise de Benchmarkmark" publié par Superclue, une agence d'évaluation domestique faisant autorité, le "nouveau" quotidien "intégré de Sentetime" à égalité au classement domestique avec un score élevé de 68,3. Cette réalisation démontre pleinement sa position principale dans le domaine du grand modèle chinois. De plus, le modèle a également bien fonctionné dans l'évaluation multimodale de l'OpenCompass, avec un dépassement considérablement GPT-4O dans les scores, consolidant davantage sa compétitivité sur la scène internationale.

Le succès du modèle de fusion «quotidien» est dû à la percée substantielle de Sensetime dans le domaine de la formation modale de fusion indigène. Ce modèle peut atteindre l'intégration profonde de diverses informations telles que le texte, les images, les vidéos, etc., fournissant à l'industrie une nouvelle solution. Dans l'évaluation de Superclue, le modèle a bien fonctionné dans les arts libéraux et les sciences. Dans les champs multidisciplinaires.

Ce qui est unique dans le modèle de fusion «quotidien», c'est sa capacité à traiter simultanément plusieurs informations complexes. Que ce soit la reconnaissance du texte flou ou l'analyse rapide des graphiques de données, le modèle fournit un support d'inférence détaillé. Dans les scénarios d'application pratiques, ce modèle montre ses avantages uniques, en particulier dans les domaines de la conduite autonome, de l'interaction vidéo, de l'éducation au bureau, de la finance et de la fabrication industrielle, qui a apporté des changements révolutionnaires à ces industries.

Au cours du processus de développement des produits, SenseTime a utilisé une grande quantité de données graphiques entrelacées et a établi un pont interactif entre les modes grâce à une technologie de synthèse avancée, améliorant la compréhension du modèle des informations multimodales. De plus, SenseTime a également construit une riche tâche inter-modale, qui fournit une base solide pour la formation du "nouveau" nouveau "Fusion Big Model. Grâce à cette méthode de formation innovante, le modèle de modal Fusion de Sensetime peut répondre efficacement aux besoins des utilisateurs dans une variété de scénarios commerciaux, réalisant un cycle vertueux de mise en œuvre des applications et d'itération de modèle de base.
Points clés:
Le modèle de fusion "New Daily New" lancé par Sensetime a réalisé des améliorations significatives des capacités de traitement multimodal de l'information et des capacités de raisonnement approfondies, et a remporté la première place dans les deux listes d'évaluation faisant autorité.
Ce modèle a des performances exceptionnelles dans les arts libéraux et les sciences, le premier mondial en arts libéraux et le premier du pays en science, démontrant sa forte capacité dans les domaines multidisciplinaires.
Le modèle intégré «nouveau» quotidien convient à plusieurs domaines, tels que la conduite autonome, la finance, l'éducation en ligne, etc., montrant de fortes capacités de traitement multimodales, apportant des changements révolutionnaires à ces industries.