Dengan seberapa cepat hal -hal bergerak di ruang Devai, steno bagi komunitas pengembang yang membangun perangkat lunak dengan bantuan model bahasa besar (LLM), dapat menjadi tantangan untuk mengetahui model mana yang digunakan.
Kami memulai repositori ini berdasarkan pengalaman kami sebagai bagian dari komunitas berkelanjutan. Jangan ragu untuk menyarankan perbaikan dan membantu kami memperbarui dengan membuka permintaan tarik!
Ada banyak LLM. Kami telah memutuskan untuk fokus pada orang -orang yang kami lihat digunakan orang sekarang:

Anda dapat menemukan CSV yang mencakup semua model dan informasi tentang mereka di sini.
Pilihan pertama yang biasanya Anda buat adalah apakah Anda akan menggunakan open-source atau model komersial :
Jika Anda memutuskan untuk menggunakan LLM open-source , keputusan Anda berikutnya adalah apakah akan mengatur model pada mesin lokal Anda atau pada penyedia model yang di-host:
Kami mempertahankan panduan tentang cara menggunakan kode open-source LLM untuk tim Anda di sini.
Jika Anda memutuskan untuk menggunakan LLM komersial , Anda biasanya akan mendapatkan kunci API dan bermain dengan beberapa dari mereka untuk perbandingan. Baik kualitas saran dan biaya untuk digunakan dapat menjadi kriteria penting.
Ini adalah daftar LLMS open-source yang digunakan pengembang saat pengkodean, secara kasar dipesan dari yang paling populer hingga paling populer, pada Oktober 2023.
Kode Llama adalah LLM yang dilatih oleh meta untuk menghasilkan dan mendiskusikan kode. Ini dibangun di atas Llama 2. Meskipun di bawah WizardCoder dan Phind-Codellama di papan peringkat model Big Code, itu adalah model dasar untuk mereka berdua. Ini juga hadir dalam berbagai ukuran: 7b, 13b, dan 34b, yang membuatnya populer untuk digunakan pada mesin lokal serta dengan penyedia yang di -host. Pada titik ini, ini adalah model dasar sumber terbuka paling terkenal untuk pengkodean dan memimpin upaya open-source untuk membuat pengkodean LLM yang mampu.
Creator: Meta
Date released: August 24th, 2023
License: Llama 2 Community
Base model: Llama 2
Parameters: 7B, 13B, 34B
WizardCoder adalah LLM yang dibangun di atas kode Llama oleh tim Wizardlm. Metode Evol-Instruct diadaptasi untuk tugas pengkodean untuk membuat dataset pelatihan, yang digunakan untuk menyempurnakan kode Llama. Muncul dalam ukuran yang sama dengan kode llama: 7b, 13b, dan 34b. Akibatnya, ini adalah LLM instruksi open-source yang paling populer sejauh ini.
Creator: WizardLM
Date released: August 26th, 2023
License: Llama 2 Community
Base model: Code Llama
Parameters: 7B, 13B, 34B
Phind-Codellama adalah LLM yang dibangun di atas Code Llama oleh Phind. Dataset eksklusif ~ 80K masalah pemrograman berkualitas tinggi dan solusi digunakan untuk menyempurnakan kode Llama. Model yang disesuaikan itu kemudian disempurnakan lebih lanjut pada 1,5b token tambahan. Saat ini memimpin di papan peringkat model Big Code. Namun, ini hanya tersedia sebagai model parameter 34B, sehingga membutuhkan lebih banyak memori yang tersedia untuk digunakan.
Creator: Phind
Date released: August 28th, 2023
License: Llama 2 Community
Base model: Code Llama
Parameters: 34B
Mistral adalah parameter 7b LLM yang dilatih oleh Mistal AI. Ini adalah model yang paling baru dirilis dalam daftar ini, setelah turun pada akhir September. Mistal AI mengatakan bahwa itu “mendekati Codellama 7B kinerja pada kode, sambil tetap pandai dalam tugas -tugas bahasa Inggris”. Meskipun hanya tersedia dalam satu ukuran kecil, orang -orang cukup bersemangat tentang hal itu dalam beberapa minggu pertama setelah rilis. LLM yang disesuaikan pertama yang menggunakannya sebagai basis mereka sekarang mulai muncul, dan kita cenderung melihat lebih banyak ke depan.
Creator: Mistral AI
Date released: September 27th, 2023
License: Apache 2.0
Base model: Mistral
Parameters: 7B
Starcoder adalah parameter 15B LLM yang dilatih oleh BigCode, yang lebih cepat terjadi ketika dirilis pada bulan Mei. Itu dilatih pada 80+ bahasa pemrograman dari tumpukan (v1.2) dengan permintaan opt-out dikecualikan. Ini bukan model instruksi dan perintah seperti "Tulis fungsi yang menghitung root kuadrat" tidak berfungsi dengan baik. Namun, dengan menggunakan prompt asisten teknologi Anda dapat membuatnya lebih membantu.
Creator: BigCode
Date released: May 4th, 2023
License: OpenRAIL-M
Base model: StarCoder
Parameters: 15B
Deepseek Coder adalah LLM yang dilatih oleh Deepseek AI pada 2 triliun token. Dengan dataset yang terdiri dari lebih dari 80 bahasa pemrograman, ini adalah model terbaru dalam daftar ini dan telah dilaporkan mendapat skor yang cukup tinggi pada berbagai tolok ukur terkait pengkodean.
Creator: DeepSeek AI
Date released: November 3rd, 2023
License: DeepSeek License Agreement
Base model: DeepSeek Coder
Parameters: 1.3B, 6.7B, 33B
Llama 2 adalah LLM yang dilatih oleh meta pada 2 triliun token. Ini adalah LLM open source yang paling populer secara keseluruhan, sehingga beberapa pengembang menggunakannya, meskipun tidak sebagus banyak model di atas dalam membuat pengeditan kode. Ini juga penting karena Code Llama, LLM paling populer untuk pengkodean, dibangun di atasnya, yang pada gilirannya merupakan dasar bagi WizardCoder dan Phind-Codellama.
Creator: Meta
Date released: July 18th, 2023
License: Llama 2 Community
Base model: Llama 2
Parameters: 7B, 13B, 70B
Ini adalah daftar LLM komersial yang digunakan pengembang saat pengkodean, secara kasar dipesan dari yang paling populer hingga paling populer, pada Oktober 2023.
GPT-4 dari openai umumnya dianggap sebagai LLM terbaik untuk digunakan saat pengkodean. Sangat membantu saat menghasilkan dan mendiskusikan kode. Namun, itu mengharuskan Anda untuk mengirim kode Anda ke Openai melalui API mereka dan bisa sangat mahal. Namun demikian, ini adalah LLM paling populer untuk pengkodean secara keseluruhan dan sebagian besar pengembang menggunakannya saat pengkodean pada saat ini. Semua pengguna API OpenAI yang melakukan pembayaran sukses $ 1 atau lebih sebelum 6 Juli 2023 diberikan akses ke GPT-4, dan mereka berencana untuk membuka akses ke semua pengembang segera.
GPT-4 Turbo dari openai lebih murah dan lebih cepat dari GPT-4. Ini memiliki batas pengetahuan April 2023 dan memiliki jendela konteks 128k. Saat ini dalam pratinjau, pada November 2023, tetapi siapa pun dengan akun API OpenAI dan akses GPT-4 yang ada dapat menggunakannya.
GPT-3.5 Turbo dari openai lebih murah dan lebih cepat dari GPT-4; Namun, sarannya hampir tidak bermanfaat. Ini juga mengharuskan Anda untuk mengirim kode Anda ke OpenAi melalui API mereka. Ini adalah LLM paling populer kedua untuk pengkodean secara keseluruhan sejauh ini. Semua pengembang dapat menggunakannya sekarang setelah mendaftar untuk akun Openai.
Claude 2 adalah LLM yang dilatih oleh antropik, yang telah sangat meningkatkan keterampilan pengkodean dibandingkan dengan versi pertama Claude. Ini terutama unggul, relatif terhadap LLM lain, ketika Anda memberikan banyak konteks. Ini mengharuskan Anda untuk mengirim kode Anda ke antropik melalui API mereka. Anda harus mendaftar untuk mendapatkan akses ke Claude 2 pada saat ini.
Palm 2 adalah LLM yang dilatih oleh Google. Untuk mencobanya, Anda harus mengirim kode Anda ke Google melalui Palm API setelah mendapatkan kunci API melalui MakerSuite, yang keduanya saat ini dalam pratinjau publik.
Jika Anda melihat model hilang atau ingin berbagi pendapat, kami menyambut Anda untuk membuka PR atau masalah! Kami berharap dapat mempertahankan indeks yang digerakkan oleh komunitas dan terkini dari model bahasa yang paling membantu untuk pengkodean.
Jika Anda menyukai posting blog ini dan ingin membaca lebih lanjut tentang Devai - komunitas orang -orang yang membangun perangkat lunak dengan bantuan LLMS - di masa depan, bergabunglah dengan buletin bulanan kami di sini.