Tongyi Qianwen Team은 4 가지 크기의 모델을 포함하여 최신 코드 모델 QWEN2.5-CODER 시리즈를 개설했습니다. 이 움직임은 오픈 소스 코드 모델의 개발을 촉진하고 개발자에게 더 많은 선택을 제공하는 것을 목표로합니다. QWEN2.5-Coder-32B-Instruct 모델은 코드 생성, 수리 및 추론에서 훌륭하게 수행되었으며, 여러 벤치 마크에서 SOTA 레벨에 도달했으며, 특히 GPT-4O, 특히 Haskell 및 Racket과 같은 프로그래밍 언어와 비교할 수 있습니다. . 이 모델은 또한 내부 코드 선호도 평가 벤치 마크 코드 아레나에 의해 테스트되었으며, 이는 인적 선호도 정렬에서 그 이점을 입증합니다.

QWEN2.5-CODER는 40 개가 넘는 프로그래밍 언어를 지원하고 MCEVAL에서 65.9 점을 얻었으며 MDEVAL 벤치 마크에서 75.2 점을 얻었습니다. 사전 훈련 단계에서 고유 한 데이터 정리 및 비례는 탁월한 성능의 주요 요소 중 하나입니다. 0.5B/1.5B/7B/14B/32B 모델은 APACHE2.0에 의해 라이센스가 부여되며 3B 모델은 연구에 의해서만 라이센스가 부여됩니다. 팀은 다양한 크기 모델의 성능을 평가하여 코드 LLM에 대한 스케일링의 효과를 확인했습니다. QWEN2.5 코더의 오픈 소스는 의심 할 여지없이 프로그래밍 언어 모델 기술의 개발 및 적용을 촉진 할 것입니다.
이번에는 Qwen2.5-Coder 시리즈 오픈 소스는 개발자에게 강력하고 사용하기 쉬운 프로그래밍 모델 선택을 제공하여 오픈 소스 커뮤니티의 개발을 더욱 홍보합니다. 다양한 크기의 모델은 다른 요구를 충족하는 반면, 기본 및 교육 버전은 각각 모델 미세 조정 및 직접 응용 프로그램을 제공합니다. 모델 링크가 제공되며 개발자는이를 다운로드하여 사용하여 오픈 소스 커뮤니티에 기여할 수 있습니다.
QWEN2.5-Coder 모델 링크 : https://modelscope.cn/collections/qwen25-coder-9d375446e8f5814a