Tim Tongyi Qianwen telah membuka bersumber dari model kode kode terbaru QWEN2.5-Coder, termasuk empat ukuran model: 0,5b/3b/14b/32b, serta dua versi basis dan instruksi. Langkah ini bertujuan untuk mempromosikan pengembangan model kode sumber terbuka dan memberikan lebih banyak pilihan kepada pengembang. Model qwen2.5-coder-32b-instruct telah berkinerja sangat baik dalam pembuatan kode, perbaikan dan inferensi, dan telah mencapai tingkat SOTA dalam berbagai tolok ukur, yang sebanding dengan GPT-4O, terutama dalam bahasa pemrograman seperti Haskell dan Racket . Model ini juga telah diuji oleh evaluasi preferensi kode internal Arena Kode Kode, yang membuktikan keuntungannya dalam penyelarasan preferensi manusia.

Qwen2.5-Coder mendukung lebih dari 40 bahasa pemrograman dan skor 65,9 poin pada McEval dan skor 75,2 pada mdeval benchmark, peringkat pertama. Pembersihan data yang unik dan proporsional dalam tahap pra-pelatihan adalah salah satu faktor kunci untuk kinerjanya yang sangat baik. Model 0,5b/1.5b/7b/14b/32b dilisensikan oleh APACHE2.0, dan model 3B dilisensikan hanya dengan penelitian. Tim memverifikasi efektivitas penskalaan pada kode LLMS dengan mengevaluasi kinerja model ukuran yang berbeda. Sumber terbuka QWEN2.5-Coder tidak diragukan lagi akan mempromosikan pengembangan dan penerapan teknologi model bahasa pemrograman.
Open source seri QWEN2.5-Coder kali ini memberi pengembang pilihan model pemrograman yang kuat dan mudah digunakan, lebih lanjut mempromosikan pengembangan komunitas open source. Model dengan ukuran yang berbeda memenuhi kebutuhan yang berbeda, sedangkan versi dasar dan instruksi masing-masing melayani model penyempurnaan dan aplikasi langsung. Tautan model disediakan, dan pengembang dipersilakan untuk mengunduh dan menggunakannya dan berkontribusi pada komunitas open source.
QWEN2.5-Coder Tautan Model: https://modelscope.cn/collections/qwen25-coder-9d375446e8f5814a