Официальный веб-сайт www.binance.com/zh-cn :введите официальный веб-сайт ☜☜
Приложение: ☞☞official App Download☜☜
Кунлун Ванвей недавно официально выпустил первую в мире промышленную мультимодальную модель Skywork R1V, называемую «R1V». С 3,8 миллиардами параметров, модель близок к хорошо известной модели с закрытым исходным кодом DeepSeek-R1 и хорошо показала многочисленные показатели, промежуточную через серию современных современных технологий (SOTAS). Kunlun Wanwei выбрал R1V с открытым исходным кодом, стремясь содействовать обмену и прогрессу технологий, а также внедрить новую жизненную силу в глобальное сообщество с открытым исходным кодом AI.

R1V, известный своими выдающимися мультимодальными возможностями рассуждений, способен беспрепятственно объединять текст и визуальную информацию, чтобы продемонстрировать мощный интеллект. В частности, R1V непосредственно сравнивает модели с закрытым исходным кодом, такие как Claude3.5sonnet и GPT-4O, в визуальных задачах вопросов и ответов, и сохраняет возможности рассуждения о высших текстах. В тесте MMMU R1V установил новую запись для моделей того же размера с высоким баллом 69, а также достиг отметки 67,5 в тесте Mathvista, демонстрируя ее мощную способность в сложных математических рассуждениях и логическом анализе.
Успех R1V связан со многими инновационными технологиями исследовательской группы Kunlun Wanwei. Среди них он включает в себя межмодальное обучение переноса, которое эффективно передает возможности текстовых рассуждений крупных моделей в визуальные режимы, что значительно снижает необходимость в данных мультимодальных выводов. Кроме того, стратегия гибридной подготовки, принятая R1V, динамически корректирует продолжительность мышления цепочек посредством комбинации итерационного надзора с тонкой настройкой и обучением подкрепления, тем самым повышая эффективность вывода. Стоит упомянуть, что R1V также вводит структуру дистилляции мышления адаптивной длины, чтобы избежать «переосмысления» в процессе рассуждений, что значительно повышает эффективность и качество рассуждений.
С запуском R1V Kunlun Wanwei не только стал первой в мире мультимодальной модельной компанией с открытым исходным кодом, но также предприняла важный шаг в продвижении мечты AGI (общий искусственный интеллект). Веса, код вывода и технические отчеты модели опубликованы, и любой может получить соответствующие ресурсы через GitHub и обнимающееся лицо.
Скачать вес модели
Обнимающееся лицо:
https://huggingface.co/skywork/skywork-r1v-38b
GitHub:
https://github.com/skyworkai/skywork-r1v
Подробный технический отчет
https://github.com/skyworkai/skywork-r1v/blob/main/skywork_r1v.pdf
Ключевые моменты:
Skywork R1V, первая в мире промышленная мультимодальная модель с открытым исходным кодом, была официально выпущена с параметрами до 3,8 млрд.
R1V хорошо показал многочисленные показатели, особенно в MMMU и Mathvista с высокими показателями 69 и 67,5 соответственно.
Инициатива Kunlun Wanwei с открытым исходным кодом направлена на то, чтобы содействовать обмену технологиями, внедрение жизненной силы в глобальное сообщество с открытым исходным кодом ИИ и помочь мечте Аги.