what llm to use unduhan - what llm to use pengunduhan kode sumber

what llm to use

Kode sumber lainnya

1.0.0

Unduh

LLM apa yang akan digunakan? Perspektif dari Ruang Devai

Dengan seberapa cepat hal -hal bergerak di ruang Devai, steno bagi komunitas pengembang yang membangun perangkat lunak dengan bantuan model bahasa besar (LLM), dapat menjadi tantangan untuk mengetahui model mana yang digunakan.

Kami memulai repositori ini berdasarkan pengalaman kami sebagai bagian dari komunitas berkelanjutan. Jangan ragu untuk menyarankan perbaikan dan membantu kami memperbarui dengan membuka permintaan tarik!

LLMS apa yang ada?

Ada banyak LLM. Kami telah memutuskan untuk fokus pada orang -orang yang kami lihat digunakan orang sekarang:

Grafik llms

Anda dapat menemukan CSV yang mencakup semua model dan informasi tentang mereka di sini.

LLMS apa yang digunakan saat pengkodean?

Bagaimana orang memutuskan?

Pilihan pertama yang biasanya Anda buat adalah apakah Anda akan menggunakan open-source atau model komersial :

Anda biasanya memilih LLM open-source ketika Anda ingin menyimpan kode Anda di dalam lingkungan, memiliki memori yang cukup tersedia, ingin menjaga biaya Anda rendah, atau ingin dapat mengelola dan mengoptimalkan semuanya dari ujung ke ujung.
Anda biasanya memilih LLM komersial saat Anda menginginkan model terbaik, lebih suka pengaturan yang mudah dan andal, tidak memiliki banyak memori yang tersedia, jangan pedulikan kode Anda meninggalkan lingkungan Anda, atau tidak terhalang oleh masalah biaya.

Jika Anda memutuskan untuk menggunakan LLM open-source , keputusan Anda berikutnya adalah apakah akan mengatur model pada mesin lokal Anda atau pada penyedia model yang di-host:

Anda biasanya memilih untuk menggunakan LLM open-source di mesin lokal Anda ketika Anda memiliki memori yang cukup tersedia, ingin penggunaan gratis, atau ingin dapat menggunakan model tanpa memerlukan koneksi internet.
Anda biasanya memilih untuk menggunakan LLM open-source pada penyedia yang di-host ketika Anda menginginkan model open-source terbaik, tidak memiliki banyak memori yang tersedia di mesin lokal Anda, atau ingin model melayani banyak orang.

Kami mempertahankan panduan tentang cara menggunakan kode open-source LLM untuk tim Anda di sini.

Jika Anda memutuskan untuk menggunakan LLM komersial , Anda biasanya akan mendapatkan kunci API dan bermain dengan beberapa dari mereka untuk perbandingan. Baik kualitas saran dan biaya untuk digunakan dapat menjadi kriteria penting.

Open source

Ini adalah daftar LLMS open-source yang digunakan pengembang saat pengkodean, secara kasar dipesan dari yang paling populer hingga paling populer, pada Oktober 2023.

1. Kode Llama

Kode Llama adalah LLM yang dilatih oleh meta untuk menghasilkan dan mendiskusikan kode. Ini dibangun di atas Llama 2. Meskipun di bawah WizardCoder dan Phind-Codellama di papan peringkat model Big Code, itu adalah model dasar untuk mereka berdua. Ini juga hadir dalam berbagai ukuran: 7b, 13b, dan 34b, yang membuatnya populer untuk digunakan pada mesin lokal serta dengan penyedia yang di -host. Pada titik ini, ini adalah model dasar sumber terbuka paling terkenal untuk pengkodean dan memimpin upaya open-source untuk membuat pengkodean LLM yang mampu.

Detail

 Creator: Meta
Date released: August 24th, 2023
License: Llama 2 Community
Base model: Llama 2
Parameters: 7B, 13B, 34B

2. WizardCoder

WizardCoder adalah LLM yang dibangun di atas kode Llama oleh tim Wizardlm. Metode Evol-Instruct diadaptasi untuk tugas pengkodean untuk membuat dataset pelatihan, yang digunakan untuk menyempurnakan kode Llama. Muncul dalam ukuran yang sama dengan kode llama: 7b, 13b, dan 34b. Akibatnya, ini adalah LLM instruksi open-source yang paling populer sejauh ini.

Detail

 Creator: WizardLM
Date released: August 26th, 2023
License: Llama 2 Community
Base model: Code Llama
Parameters: 7B, 13B, 34B

3. Phind-Codellama

Phind-Codellama adalah LLM yang dibangun di atas Code Llama oleh Phind. Dataset eksklusif ~ 80K masalah pemrograman berkualitas tinggi dan solusi digunakan untuk menyempurnakan kode Llama. Model yang disesuaikan itu kemudian disempurnakan lebih lanjut pada 1,5b token tambahan. Saat ini memimpin di papan peringkat model Big Code. Namun, ini hanya tersedia sebagai model parameter 34B, sehingga membutuhkan lebih banyak memori yang tersedia untuk digunakan.

Detail

 Creator: Phind
Date released: August 28th, 2023
License: Llama 2 Community
Base model: Code Llama
Parameters: 34B

4. Mistral

Mistral adalah parameter 7b LLM yang dilatih oleh Mistal AI. Ini adalah model yang paling baru dirilis dalam daftar ini, setelah turun pada akhir September. Mistal AI mengatakan bahwa itu “mendekati Codellama 7B kinerja pada kode, sambil tetap pandai dalam tugas -tugas bahasa Inggris”. Meskipun hanya tersedia dalam satu ukuran kecil, orang -orang cukup bersemangat tentang hal itu dalam beberapa minggu pertama setelah rilis. LLM yang disesuaikan pertama yang menggunakannya sebagai basis mereka sekarang mulai muncul, dan kita cenderung melihat lebih banyak ke depan.

Detail

 Creator: Mistral AI
Date released: September 27th, 2023
License: Apache 2.0
Base model: Mistral
Parameters: 7B

5. Starcoder

Starcoder adalah parameter 15B LLM yang dilatih oleh BigCode, yang lebih cepat terjadi ketika dirilis pada bulan Mei. Itu dilatih pada 80+ bahasa pemrograman dari tumpukan (v1.2) dengan permintaan opt-out dikecualikan. Ini bukan model instruksi dan perintah seperti "Tulis fungsi yang menghitung root kuadrat" tidak berfungsi dengan baik. Namun, dengan menggunakan prompt asisten teknologi Anda dapat membuatnya lebih membantu.

Detail

 Creator: BigCode
Date released: May 4th, 2023
License: OpenRAIL-M
Base model: StarCoder
Parameters: 15B

6. Deepseek Coder

Deepseek Coder adalah LLM yang dilatih oleh Deepseek AI pada 2 triliun token. Dengan dataset yang terdiri dari lebih dari 80 bahasa pemrograman, ini adalah model terbaru dalam daftar ini dan telah dilaporkan mendapat skor yang cukup tinggi pada berbagai tolok ukur terkait pengkodean.

Detail

 Creator: DeepSeek AI
Date released: November 3rd, 2023
License: DeepSeek License Agreement
Base model: DeepSeek Coder
Parameters: 1.3B, 6.7B, 33B

7. llama2

Llama 2 adalah LLM yang dilatih oleh meta pada 2 triliun token. Ini adalah LLM open source yang paling populer secara keseluruhan, sehingga beberapa pengembang menggunakannya, meskipun tidak sebagus banyak model di atas dalam membuat pengeditan kode. Ini juga penting karena Code Llama, LLM paling populer untuk pengkodean, dibangun di atasnya, yang pada gilirannya merupakan dasar bagi WizardCoder dan Phind-Codellama.

Detail

 Creator: Meta
Date released: July 18th, 2023
License: Llama 2 Community
Base model: Llama 2
Parameters: 7B, 13B, 70B

Komersial

Ini adalah daftar LLM komersial yang digunakan pengembang saat pengkodean, secara kasar dipesan dari yang paling populer hingga paling populer, pada Oktober 2023.

1. GPT-4

GPT-4 dari openai umumnya dianggap sebagai LLM terbaik untuk digunakan saat pengkodean. Sangat membantu saat menghasilkan dan mendiskusikan kode. Namun, itu mengharuskan Anda untuk mengirim kode Anda ke Openai melalui API mereka dan bisa sangat mahal. Namun demikian, ini adalah LLM paling populer untuk pengkodean secara keseluruhan dan sebagian besar pengembang menggunakannya saat pengkodean pada saat ini. Semua pengguna API OpenAI yang melakukan pembayaran sukses $ 1 atau lebih sebelum 6 Juli 2023 diberikan akses ke GPT-4, dan mereka berencana untuk membuka akses ke semua pengembang segera.

2. GPT-4 Turbo

GPT-4 Turbo dari openai lebih murah dan lebih cepat dari GPT-4. Ini memiliki batas pengetahuan April 2023 dan memiliki jendela konteks 128k. Saat ini dalam pratinjau, pada November 2023, tetapi siapa pun dengan akun API OpenAI dan akses GPT-4 yang ada dapat menggunakannya.

3. GPT-3.5 Turbo

GPT-3.5 Turbo dari openai lebih murah dan lebih cepat dari GPT-4; Namun, sarannya hampir tidak bermanfaat. Ini juga mengharuskan Anda untuk mengirim kode Anda ke OpenAi melalui API mereka. Ini adalah LLM paling populer kedua untuk pengkodean secara keseluruhan sejauh ini. Semua pengembang dapat menggunakannya sekarang setelah mendaftar untuk akun Openai.

4. Claude 2

Claude 2 adalah LLM yang dilatih oleh antropik, yang telah sangat meningkatkan keterampilan pengkodean dibandingkan dengan versi pertama Claude. Ini terutama unggul, relatif terhadap LLM lain, ketika Anda memberikan banyak konteks. Ini mengharuskan Anda untuk mengirim kode Anda ke antropik melalui API mereka. Anda harus mendaftar untuk mendapatkan akses ke Claude 2 pada saat ini.

5. Palm 2

Palm 2 adalah LLM yang dilatih oleh Google. Untuk mencobanya, Anda harus mengirim kode Anda ke Google melalui Palm API setelah mendapatkan kunci API melalui MakerSuite, yang keduanya saat ini dalam pratinjau publik.

Berkontribusi

Jika Anda melihat model hilang atau ingin berbagi pendapat, kami menyambut Anda untuk membuka PR atau masalah! Kami berharap dapat mempertahankan indeks yang digerakkan oleh komunitas dan terkini dari model bahasa yang paling membantu untuk pengkodean.

Jika Anda menyukai posting blog ini dan ingin membaca lebih lanjut tentang Devai - komunitas orang -orang yang membangun perangkat lunak dengan bantuan LLMS - di masa depan, bergabunglah dengan buletin bulanan kami di sini.

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-02-25
ukuran 1.59MB
Berasal dari Github

Aplikasi Terkait

TensorRT LLM

2024-11-10
APA PERMAINAN MOBIL

2023-05-28
jadi aplikasi apa

2023-05-23
Apa Golfnya?

2022-08-26
Apa Labirinnya

2022-08-02
Apa Dubnya!

2022-08-02

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Kode sumber lainnya

1.0.0
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Kode sumber lainnya

1.0.0

Informasi Terkait Semua