Kunlun Wanwei hat kürzlich offiziell das weltweit erste industrielle multimodale Inferenzmodell Skywork R1V veröffentlicht, das als "R1V" bezeichnet wird. Mit 3,8 Milliarden Parametern befindet sich das Modell nahe dem bekannten Closed-Source-Modell Deepseek-R1 und hat sich in mehreren Benchmarks gut abgebaut, wodurch eine Reihe aktueller hochmoderner Technologien (SOTAS) durchgeführt werden. Kunlun Wanwei entschied sich für Open Source R1V, um die technologische Austausch und den Fortschritt zu fördern und die globale KI -Open -Source -Community neue Vitalität zu verleihen.

Der R1V ist bekannt für seine herausragenden multimodalen Argumentationsfunktionen und kann Texte und visuelle Informationen nahtlos kombinieren, um leistungsstarke Intelligenz zu demonstrieren. Insbesondere R1V-Benchmarks geschlossene Modelle wie Claude3.5Sonnet und GPT-4O in visuellen Fragen-und-Antwort-Aufgaben beibehalten und die Funktionen von Top-Text-Argumentationsfunktionen beibehalten. In der MMMU -Benchmark stellte der R1V einen neuen Rekord für Modelle derselben Größe mit einem hohen Wert von 69 auf und erzielte im Mathvista -Test eine 67,5 -Marke, was seine leistungsstarke Fähigkeit in komplexem mathematischen Argumentation und logischer Analyse demonstrierte.
Der Erfolg von R1V ist auf die vielen innovativen Technologien des Kunlun Wanwei Research Teams zurückzuführen. Unter ihnen umfasst es das Lernen von Quermodal-Transfer, das die Funktionen der Textbekämpfung großer Modelle effektiv auf visuelle Modi überträgt und die Notwendigkeit multimodaler Inferenzdaten erheblich verringert. Darüber hinaus passt die von R1V angenommene hybride Trainingsstrategie die Länge der Denkketten dynamisch durch die Kombination aus iterativer Überwachung Feinabstimmung und Verstärkungslernen an, wodurch die Effizienz der Inferenz verbessert wird. Erwähnenswert ist erwähnenswert, dass R1V auch ein Den -Destillation -Rahmen für die Denkkette mit adaptiver Länge einführt, um das "Überdenken" im Argumentationsprozess zu vermeiden, was die Effizienz und Qualität des Denkens erheblich verbessert.
Mit dem Start von R1V ist Kunlun Wanwei nicht nur das weltweit erste multimodale Inferenzmodellunternehmen der Welt geworden, sondern auch einen wichtigen Schritt zur Förderung der Verwirklichung des AGI (General Artificial Intelligence) Traum. Die Gewichte, Inferenzcode und technische Berichte des Modells werden alle veröffentlicht, und jeder kann relevante Ressourcen über Github und Umarmung erhalten.
Modellgewicht herunterladen
Umarmend: Gesicht:
https://huggingface.co/skywork/skywork-r1v-38b
Github:
https://github.com/skyworkai/skywork-r1v
Detaillierter technischer Bericht
https://github.com/skyworkai/skywork-r1v/blob/main/skywork_r1v.pdf
Schlüsselpunkte:
Skywork R1V, das weltweit erste industrielle Open -Source -Modell für multimodales Inferenz, wurde offiziell mit Parametern von bis zu 3,8 Milliarden freigesetzt.
R1V zielte in mehreren Benchmarks gut ab, insbesondere in MMMU und Mathvista mit hohen Punktzahlen von 69 bzw. 67,5.
Die Open -Source -Initiative von Kunlun Wanwei zielt darauf ab, den technischen Austausch zu fördern, die globale AI Open Source -Community Vitalität zu verleihen und Agis Traum zu verwirklichen.