Situs web resmi www.binance.com/zh-cn :Masukkan situs web resmi ☜☜
Aplikasi: ☞☞ Unduh Aplikasi Resmi☜☜
Kunlun Wanwei baru -baru ini secara resmi merilis model inferensi multimodal industri pertama di dunia Skywork R1V, yang disebut sebagai "R1V". Dengan 3,8 miliar parameter, model ini dekat dengan model sumber tertutup yang terkenal Deepseek-R1, dan telah berkinerja baik dalam berbagai tolok ukur, menyapu serangkaian teknologi canggih saat ini (SOTA). Kunlun Wanwei memilih R1V open source, yang bertujuan untuk mempromosikan berbagi teknologi dan kemajuan dan menyuntikkan vitalitas baru ke dalam komunitas open source AI global.

Dikenal karena kemampuan penalaran multimodal yang luar biasa, R1V mampu menggabungkan informasi teks dan visual dengan mulus untuk menunjukkan kecerdasan yang kuat. Secara khusus, R1V secara langsung menandai model sumber tertutup seperti Claude3.5Sonnet dan GPT-4O dalam tugas tanya jawab visual, dan mempertahankan kemampuan penalaran teks teratas. Dalam tolok ukur MMMU, R1V menetapkan rekor baru untuk model dengan ukuran yang sama dengan skor tinggi 69, sementara juga mencapai tanda 67,5 dalam tes Mathvista, menunjukkan kemampuan kuatnya dalam penalaran matematika yang kompleks dan analisis logis.
Keberhasilan R1V adalah karena banyak teknologi inovatif tim peneliti Kunlun Wanwei. Di antara mereka, ini termasuk pembelajaran transfer lintas modal, yang secara efektif mentransfer kemampuan penalaran teks model besar ke mode visual, sangat mengurangi kebutuhan untuk data inferensi multimodal. Selain itu, strategi pelatihan hybrid yang diadopsi oleh R1V secara dinamis menyesuaikan lamanya rantai berpikir melalui kombinasi pembelajaran fine-tuning dan penguatan pengawasan iteratif, sehingga meningkatkan efisiensi inferensi. Perlu disebutkan bahwa R1V juga memperkenalkan kerangka distilasi rantai pemikiran panjang adaptif untuk menghindari "terlalu banyak berpikir" dalam proses penalaran, yang secara signifikan meningkatkan efisiensi dan kualitas penalaran.
Dengan peluncuran R1V, Kunlun Wanwei tidak hanya menjadi perusahaan model inferensi multimodal open source pertama di dunia, tetapi juga mengambil langkah penting dalam mempromosikan realisasi mimpi AGI (Kecerdasan Buatan Umum). Bobot, kode inferensi, dan laporan teknis dari model ini semua diterbitkan, dan siapa pun dapat memperoleh sumber daya yang relevan melalui GitHub dan memeluk wajah.
Model Weight Download
Wajah memeluk:
https://huggingface.co/skywork/skywork-r1v-38b
GitHub:
https://github.com/skyworkai/skywork-r1v
Laporan teknis terperinci
https://github.com/skyworkai/skywork-r1v/blob/main/skywork_r1v.pdf
Poin -Poin Kunci:
Skywork R1V, model inferensi multimodal open source industri pertama di dunia, secara resmi dirilis dengan parameter hingga 3,8 miliar.
R1V berkinerja baik dalam beberapa tolok ukur, terutama di MMMU dan Mathvista dengan skor tinggi masing -masing 69 dan 67,5.
Inisiatif open source Kunlun Wanwei bertujuan untuk mempromosikan berbagi teknologi, menyuntikkan vitalitas ke dalam komunitas open source AI global, dan membantu Impian Agi menjadi kenyataan.