2025 년 3 월 6 일, 인공 지능 분야는 주요 획기적인 획기적인 분야에서 공식적으로 출시되었습니다. ** QWEN2.5-32B-Instruct ** 모델을 기반으로 개발 된이 수학적 문제 해결 도구는 탁월한 성능, 낮은 교육 비용 및 높은 재현성으로 인해 산업 관심의 초점이 빠르게되었습니다. 개발 팀 XAI는 LIGHT-R1-32B는 기술 발전을 달성 할뿐만 아니라 학업 연구 및 실제 응용 분야를위한 새로운 가능성을 제공한다고 말했다.
Light-R1-32B의 핵심 장점은 강력한 수학적 문제 해결 능력에 있습니다. AIME24 ** 및 AIME25 **와 같은 국제 권위있는 수학 경쟁 테스트 에서이 모델은 ** DeepSeek-R1-Distill-QWEN-32B **와 같은 유사한 제품보다 훨씬 더 잘 수행되었습니다. 더욱 놀라운 것은이 성과가 "처음부터 시작"훈련 방법, 즉 초기 모델에서 현재 수준으로 점차 개선하여 복잡한 추론 작업의 잠재력을 완전히 보여줍니다.
인공 지능 분야에서 높은 훈련 비용은 항상 개발자에게 어려운 과제였습니다. 그러나 Light-R1-32B는이 한도를 차단하고 교육비는 $ 1,000에 불과하여 개발 임계 값을 크게 낮추는 것입니다. 또한 개발 팀은 모든 교육 데이터, 코드 및 프로세스를 공개하여 다른 연구자들에게 재생산 및 최적화의 기초를 제공하여 오픈 소스 정신의 가치를 완전히 반영했습니다.
Light-R1-32B의 성공은 혁신적인 교육 방법과 분리 할 수 없습니다. 개발 팀은 ** 코스 학습 전략을 채택했으며 ** 감독 된 미세 튜닝 (SFT) 및 ** 직접 환경 설정 최적화 (DPO)를 통해 모델 성능을 점차 개선했습니다. 훈련 과정에서 모델의 사고 능력 체인이 강화된다는 것을 언급 할 가치가 있습니다. 프롬프트 단어에 **를 추가함으로써
평가 결과의 공정성을 보장하기 위해 개발 팀은 데이터 준비 단계에서 엄격한 데이터 청소를 수행하여 데이터 오염을 유발할 수있는 샘플을 제거했습니다. 이 엄격한 태도는 모델의 신뢰성을 향상시킬뿐만 아니라 후속 연구를위한 신뢰할 수있는 기초를 제공합니다.
앞으로 Light-R1-32B의 방출은 수학적 문제를 해결하는 분야에 새로운 활력을 주입했으며 저렴한 인공 지능 개발을위한 벤치 마크를 설정했습니다. 학업 연구원이든 산업 실무자이든, 그들은이 모델을 재현하고 최적화함으로써 더 많은 가능성을 탐구 할 수 있습니다. Xai는 교육, 과학 연구 및 공학 분야에서 광범위한 응용을 촉진하기 위해 앞으로 Light-R1-32B를 계속 개선 할 것이라고 말했다.
Light-R1-32b는 저렴한 비용, 고성능 및 강력한 사고 체인으로 수학적 문제 해결 모델의 가치를 재정의합니다. 이름에서 알 수 있듯이 인공 지능과 수학의 조합에 대한 새로운 길을 밝히는 것은 빛의 광선과 같습니다.
자세한 내용은 https://github.com/qihoo360/light-r1을 방문하십시오