Kunlun Wanwei는 최근 "R1V"라고하는 세계 최초의 산업 멀티 모달 추론 모델 Skywork R1V를 공식적으로 발표했습니다. 38 억 개의 매개 변수를 갖춘이 모델은 잘 알려진 폐쇄 소스 모델 DeepSeek-R1에 가깝고 여러 벤치 마크에서 잘 수행되어 일련의 현재 최첨단 기술 (SOTA)을 휩쓸고 있습니다. Kunlun Wanwei는 오픈 소스 R1V를 선택하여 기술 공유 및 진보를 촉진하고 글로벌 AI 오픈 소스 커뮤니티에 새로운 활력을 주입하는 것을 목표로했습니다.

뛰어난 멀티 모달 추론 기능으로 유명한 R1V는 텍스트와 시각 정보를 완벽하게 결합하여 강력한 지능을 보여줄 수 있습니다. 특히 R1V는 시각적 질문 및 답변 작업에서 Claude3.5sonnet 및 GPT-4O와 같은 폐쇄 소스 모델을 직접 벤치마킹하고 최고의 텍스트 추론 기능을 유지합니다. MMMU 벤치 마크에서 R1V는 69 점의 높은 점수를 가진 동일한 크기의 모델에 대한 새로운 레코드를 설정했으며 Mathvista 테스트에서 67.5 점을 달성하여 복잡한 수학적 추론 및 논리적 분석에서 강력한 능력을 보여주었습니다.
R1V의 성공은 Kunlun Wanwei 연구팀의 많은 혁신적인 기술 때문입니다. 그중에는 대형 모델의 텍스트 추론 기능을 시각 모드로 효과적으로 전송하여 멀티 모달 추론 데이터의 필요성을 크게 줄이는 교차 모달 전송 학습이 포함됩니다. 또한, R1V에 의해 채택 된 하이브리드 훈련 전략은 반복 감독 미세 조정 및 강화 학습의 조합을 통해 사고 체인의 길이를 동적으로 조정하여 추론 효율을 향상시킵니다. R1V는 또한 추론 프로세스에서 "과도한 생각"을 피하기 위해 적응성 길이 사고 체인 증류 프레임 워크를 도입하여 추론의 효율성과 품질을 크게 향상 시킨다는 것은 언급 할 가치가 있습니다.
R1V가 출시되면서 Kunlun Wanwei는 세계 최초의 오픈 소스 멀티 모달 추론 모델 회사가되었을뿐만 아니라 AGI (일반 인공 지능) 꿈의 실현을 촉진하는 데 중요한 단계를 밟았습니다. 모델의 가중치, 추론 코드 및 기술 보고서는 모두 게시되며 누구나 Github 및 Hugging Face를 통해 관련 리소스를 얻을 수 있습니다.
모델 웨이트 다운로드
포옹 얼굴 :
https://huggingface.co/skywork/skywork-r1v-38b
Github :
https://github.com/skyworkai/skywork-r1v
자세한 기술 보고서
https://github.com/skyworkai/skywork-r1v/blob/main/skywork_r1v.pdf
핵심 사항 :
세계 최초의 산업 오픈 소스 멀티 모달 추론 모델 인 Skywork R1V는 공식적으로 최대 38 억 개의 매개 변수로 출시되었습니다.
R1V는 여러 벤치 마크, 특히 MMMU 및 Mathvista에서 각각 69와 67.5의 높은 점수를 얻었습니다.
Kunlun Wanwei의 오픈 소스 이니셔티브는 기술 공유를 촉진하고, 글로벌 AI 오픈 소스 커뮤니티에 활력을 주입하며, Agi의 꿈이 이루어 지도록 도와줍니다.