Site Web officiel www.binance.com/ZH-CN :Entrez le site officiel ☜☜
Application: ☞☞Official App Download☜☜
Kunlun Wanwei a récemment publié officiellement le premier modèle d'inférence multimodal industriel au monde Skywork R1V, appelé "R1V". Avec 3,8 milliards de paramètres, le modèle est proche du modèle de source fermée bien connu Deepseek-R1, et a bien fonctionné dans plusieurs repères, balayant une série de technologies actuelles de pointe (Sotas). Kunlun Wanwei a choisi l'open source R1V, visant à promouvoir le partage et les progrès technologiques et d'injecter une nouvelle vitalité dans la communauté mondiale de l'IA open source.

Connu pour ses capacités de raisonnement multimodales exceptionnelles, le R1V est capable de combiner de manière transparente du texte et des informations visuelles pour démontrer une intelligence puissante. Plus précisément, R1V compare directement des modèles de source fermée tels que Claude3.5Sonnet et GPT-4O dans des tâches visuelles de questions et réponses, et maintient les meilleures capacités de raisonnement de texte. Dans la référence MMMU, le R1V a établi un nouveau record pour des modèles de même taille avec un score élevé de 69, tout en obtenant une marque de 67,5 dans le test Mathvista, démontrant sa puissante capacité dans le raisonnement mathématique complexe et l'analyse logique.
Le succès de R1V est dû aux nombreuses technologies innovantes de l'équipe de recherche de Kunlun Wanwei. Parmi eux, il comprend l'apprentissage transfrère de transfert, qui transfère efficacement les capacités de raisonnement de texte des grands modèles aux modes visuels, réduisant considérablement le besoin de données d'inférence multimodales. De plus, la stratégie de formation hybride adoptée par R1V ajuste dynamiquement la durée des chaînes de réflexion à travers la combinaison de l'apprentissage des réglages et du renforcement de supervision itératif, améliorant ainsi l'efficacité de l'inférence. Il convient de mentionner que R1V introduit également un cadre de distillation de la chaîne de réflexion de longueur adaptative pour éviter de «trop réfléchir» dans le processus de raisonnement, ce qui améliore considérablement l'efficacité et la qualité du raisonnement.
Avec le lancement de R1V, Kunlun Wanwei est devenu non seulement la première société de modèle d'inférence multimodale open source au monde, mais a également pris une étape importante dans la promotion de la réalisation du rêve AGI (intelligence artificielle générale). Les poids, le code d'inférence et les rapports techniques du modèle sont tous publiés, et n'importe qui peut obtenir des ressources pertinentes via Github et étreignant la face.
Téléchargement du poids du modèle
Visage étreint:
https://huggingface.co/skywork/skywork-r1v-38b
Github:
https://github.com/skyworkai/skywork-r1v
Rapport technique détaillé
https://github.com/skyworkai/skywork-r1v/blob/main/skywork_r1v.pdf
Points clés:
Skywork R1V, le premier modèle d'inférence multimodal industriel industriel au monde, a été officiellement publié avec des paramètres pouvant atteindre 3,8 milliards.
R1V a bien fonctionné dans plusieurs repères, en particulier dans MMMU et Mathvista avec des scores élevés de 69 et 67,5 respectivement.
L'initiative open source de Kunlun Wanwei vise à promouvoir le partage technologique, à injecter la vitalité dans la communauté mondiale de l'open source de l'IA et à aider le rêve d'Agi se réaliser.