free llm api resources
1.0.0
Ini mencantumkan berbagai layanan yang menyediakan akses atau kredit gratis terhadap penggunaan LLM berbasis API.
Catatan
Tolong jangan menyalahgunakan layanan ini, kalau tidak kita mungkin kehilangan mereka.
Peringatan
Daftar ini secara eksplisit mengecualikan layanan apa pun yang tidak sah (misalnya Reverse Engineers dan chatbot yang ada)
| Penyedia | Batas/catatan penyedia | Nama model | Batas model |
|---|---|---|---|
| Groq | Distil Whisper besar v3 | 7.200 Audio-Detik/Menit 2.000 permintaan/hari | |
| Gemma 2 9b Instruksi | 14.400 permintaan/hari 15.000 token/menit | ||
| Gemma 7b Instruksi | 14.400 permintaan/hari 15.000 token/menit | ||
| LLAVA 1.5 7B | 14.400 permintaan/hari 30.000 token/menit | ||
| Llama 3 70b | 14.400 permintaan/hari 6.000 token/menit | ||
| Llama 3 70b - alat groq menggunakan pratinjau | 14.400 permintaan/hari 15.000 token/menit | ||
| Llama 3 8b | 14.400 permintaan/hari 30.000 token/menit | ||
| Llama 3 8b - alat groq menggunakan pratinjau | 14.400 permintaan/hari 15.000 token/menit | ||
| Llama 3.1 70b | 14.400 permintaan/hari 6.000 token/menit | ||
| Llama 3.1 8b | 14.400 permintaan/hari 20.000 token/menit | ||
| Llama 3.2 11b Visi | 7.000 permintaan/hari 7.000 token/menit | ||
| Llama 3.2 1b | 7.000 permintaan/hari 7.000 token/menit | ||
| Llama 3.2 3b | 7.000 permintaan/hari 7.000 token/menit | ||
| Llama 3.2 90b Visi | 3.500 permintaan/hari 7.000 token/menit | ||
| Penjaga Llama 3 8B | 14.400 permintaan/hari 15.000 token/menit | ||
| Mixtral 8x7b | 14.400 permintaan/hari 5.000 token/menit | ||
| Berbisik v3 besar | 7.200 Audio-Detik/Menit 2.000 permintaan/hari | ||
| Berbisik v3 turbo besar | 7.200 Audio-Detik/Menit 2.000 permintaan/hari | ||
| OpenRouter | 20 permintaan/menit 200 permintaan/hari | Gemma 2 9b Instruksi | |
| Hermes 3 llama 3.1 405b | |||
| Cairan LFM 40B | |||
| Llama 3 8b instruksikan | |||
| Llama 3.1 405b menginstruksikan | |||
| Llama 3.1 70b menginstruksikan | |||
| Llama 3.1 8b Instruksi | |||
| Llama 3.2 11b Visi Instruksi | |||
| Llama 3.2 1b instruksikan | |||
| Llama 3.2 3b menginstruksikan | |||
| Llama 3.2 90B Visi Instruksi | |||
| Mistral 7B Instruksi | |||
| Mythomax L2 13B | |||
| OpenChat 7B | |||
| PHI-3 Medium 128K Instruksi | |||
| PHI-3 Mini 128K Instruksi | |||
| Qwen 2 7b menginstruksikan | |||
| Toppy M 7b | |||
| Zephyr 7B Beta | |||
| Google AI Studio | Data digunakan untuk pelatihan (ketika digunakan di luar Inggris/CH/EEA/EU). | Gemini 1.5 Flash | 1.000.000 token/menit 1.500 permintaan/hari 15 permintaan/menit |
| Gemini 1.5 Flash (Eksperimental) | 1.000.000 token/menit 1.500 permintaan/hari 5 permintaan/menit | ||
| Gemini 1.5 Flash-8b | 1.000.000 token/menit 1.500 permintaan/hari 15 permintaan/menit | ||
| Gemini 1.5 Flash-8B (Eksperimental) | 1.000.000 token/menit 1.500 permintaan/hari 15 permintaan/menit | ||
| Gemini 1.5 Pro | 32.000 token/menit 50 permintaan/hari 2 permintaan/menit | ||
| Gemini 1.5 Pro (Eksperimental) | 1.000.000 token/menit 50 permintaan/hari 2 permintaan/menit | ||
| Gemini 1.0 Pro | 32.000 token/menit 1.500 permintaan/hari 15 permintaan/menit | ||
| Text-Embedding-004 | 150 permintaan batch/menit 1.500 permintaan/menit 100 konten/batch | ||
| embedding-001 | |||
| Lambda Labs (pratinjau gratis) | Membutuhkan verifikasi kartu kredit. | Hermes 3 405b | |
| Hermes 3 70b | |||
| Hermes 3 8b | |||
| Cairan LFM 40B | |||
| Llama 3.1 405b Instruksikan (FP8) | |||
| Llama 3.1 70b Instruksikan (FP8) | |||
| Llama 3.1 8b Instruksi | |||
| Llama 3.1 Nemotron 70B Instruksikan | |||
| Llama 3.2 3b menginstruksikan | |||
| QWEN2.5 Coder 32B Instruksi | |||
| Mistral (La Platforme) | Tingkat gratis (Paket Eksperimen) memerlukan memilih untuk pelatihan data, memerlukan verifikasi nomor telepon. | Model Mistral Terbuka dan Kepemilikan | 1 permintaan/kedua 500.000 token/menit 1.000.000.000 token/bulan |
| Mistral (Codestral) | Saat ini bebas untuk digunakan, berbasis berlangganan bulanan, memerlukan verifikasi nomor telepon. | Kodestral | 30 permintaan/menit 2.000 permintaan/hari |
| Huggingface Inferenceless Inference | Terbatas pada model yang lebih kecil dari 10GB. Beberapa model populer didukung bahkan jika mereka melebihi 10GB. | Berbagai model terbuka | 1.000 permintaan/hari (dengan akun) |
| Sambanova Cloud | Llama 3.1 405b | 10 permintaan/menit | |
| Llama 3.2 90b | 1 permintaan/menit | ||
| Llama 3.1 70b | 20 permintaan/menit | ||
| Llama 3.2 11b | 10 permintaan/menit | ||
| Llama 3.1 8b | 30 permintaan/menit | ||
| Llama 3.2 3b | 30 permintaan/menit | ||
| Llama 3.2 1b | 30 permintaan/menit | ||
| Cerebras | Daftar tunggu Tingkat bebas terbatas pada konteks 8K | Llama 3.1 8b | 30 permintaan/menit 60.000 token/menit 900 permintaan/jam 1.000.000 token/jam 14.400 permintaan/hari 1.000.000 token/hari |
| Llama 3.1 70b | 30 permintaan/menit 60.000 token/menit 900 permintaan/jam 1.000.000 token/jam 14.400 permintaan/hari 1.000.000 token/hari | ||
| Model GitHub | Daftar tunggu Tingkat batas tergantung pada tingkat berlangganan kopilot | AI21-Jamba-instruct | |
| Perintah cohere r | |||
| Perintah cohere r+ | |||
| Cohere embed v3 bahasa Inggris | |||
| Kohere embed v3 multibahasa | |||
| Meta-llama-3-70b-instruct | |||
| Meta-llama-3-8b-instruct | |||
| Meta-llama-3.1-405b-instruct | |||
| Meta-llama-3.1-70b-instruct | |||
| Meta-llama-3.1-8b-instruct | |||
| Mistral besar | |||
| Mistral Large (2407) | |||
| Mistral Nemo | |||
| Mistral Small | |||
| OpenAI GPT-4O | |||
| OpenAI GPT-4O Mini | |||
| Embedding teks openai 3 (besar) | |||
| Embedding teks openai 3 (kecil) | |||
| PHI-3-Medium Instruct (128K) | |||
| PHI-3-Medium Instruct (4K) | |||
| PHI-3-MINI Instruksikan (128K) | |||
| PHI-3-MINI INSTRUKSI (4K) | |||
| PHI-3-Small Instruct (128K) | |||
| PHI-3-Small Instruct (8K) | |||
| PHI-3.5-Mini Instruksikan (128k) | |||
| Titik akhir OVH AI (beta gratis) | Codellama 13b Instruksi | 12 permintaan/menit | |
| Codestral Mamba 7B V0.1 | 12 permintaan/menit | ||
| Llama 2 13b obrolan | 12 permintaan/menit | ||
| Llama 3 70b menginstruksikan | 12 permintaan/menit | ||
| Llama 3 8b instruksikan | 12 permintaan/menit | ||
| Llama 3.1 70b menginstruksikan | 12 permintaan/menit | ||
| Mathstral 7B V0.1 | 12 permintaan/menit | ||
| Mistral 7B Instruksi | 12 permintaan/menit | ||
| Mistral Nemo 2407 | 12 permintaan/menit | ||
| Instruksi Mixtral 8x22b | 12 permintaan/menit | ||
| Instruksi Mixtral 8x7b | 12 permintaan/menit | ||
| Pekerja Cloudflare AI | 10.000 token/hari | Deepseek Coder 6.7b Base (AWQ) | |
| Deepseek Coder 6.7B Instruksikan (AWQ) | |||
| Deepseek Matematika 7B Instruksi | |||
| Discolm Jerman 7B V1 (AWQ) | |||
| Instruksi Falcom 7B | |||
| Gemma 2B Instruksikan (Lora) | |||
| Gemma 7b Instruksi | |||
| Gemma 7b Instruksikan (Lora) | |||
| Hermes 2 Pro Mistral 7B | |||
| Llama 2 13B Chat (AWQ) | |||
| Llama 2 7B Chat (FP16) | |||
| Llama 2 7B Chat (Int8) | |||
| Llama 2 7B Chat (Lora) | |||
| Llama 3 8b instruksikan | |||
| Llama 3 8b instruksikan | |||
| Llama 3 8b Instruksikan (AWQ) | |||
| Llama 3.1 8b Instruksi | |||
| Llama 3.1 8b Instruksikan (AWQ) | |||
| Llama 3.1 8b Instruksikan (FP8) | |||
| Llama 3.2 11b Visi Instruksi | |||
| Llama 3.2 1b instruksikan | |||
| Llama 3.2 3b menginstruksikan | |||
| LLAMAGAARD 7B (AWQ) | |||
| Mistral 7B Instruksikan V0.1 | |||
| Mistral 7B Instruktur V0.1 (AWQ) | |||
| Mistral 7B Instruksikan V0.2 | |||
| Mistral 7B Instruktur V0.2 (LORA) | |||
| Neural Chat 7B v3.1 (AWQ) | |||
| OpenChat 3.5 0106 | |||
| OpenHermes 2.5 Mistral 7B (AWQ) | |||
| Phi-2 | |||
| Qwen 1.5 0,5b obrolan | |||
| Qwen 1.5 1.8b obrolan | |||
| Qwen 1.5 14b obrolan (AWQ) | |||
| Qwen 1.5 7b obrolan (AWQ) | |||
| SQLCODER 7B 2 | |||
| Starling LM 7B Beta | |||
| Tinyllama 1.1b Chat v1.0 | |||
| Una Cybertron 7B V2 (BF16) | |||
| Zephyr 7B Beta (AWQ) | |||
| Bersama | Llama 3.2 11b Visi Instruksi | Gratis untuk 2024 | |
| Berpadu | 20 permintaan/mnt 1.000 permintaan/bulan | Command-r | Batas bersama |
| Command-R+ | |||
| Google Cloud Vertex AI | Verifikasi pembayaran yang sangat ketat untuk Google Cloud. | Llama 3.1 70b menginstruksikan | LLAMA 3.1 Layanan API Gratis selama pratinjau. 60 permintaan/menit |
| Llama 3.1 8b Instruksi | LLAMA 3.1 Layanan API Gratis selama pratinjau. 60 permintaan/menit | ||
| Llama 3.2 90B Visi Instruksi | Llama 3.2 Layanan API Gratis selama pratinjau. 30 permintaan/menit | ||
| Gemini Flash Experimental | Model Gemini Eksperimental. 10 permintaan/menit | ||
| Gemini Pro Experimental | |||
| Glhf.chat (beta gratis) | Email untuk API Access | Setiap model pada wajah memeluk yang dapat dijalankan di VLLM dan cocok dengan node A100 (~ 640GB VRAM), termasuk LLAMA 3.1 405B di FP8 |
| Penyedia | Kredit | Persyaratan | Model |
|---|---|---|---|
| Bersama | $ 5 | Berbagai model terbuka | |
| Kembang api | $ 1 | Berbagai model terbuka | |
| Menyatukan | $ 10 (+$ 40 untuk bersentuhan) | Rute ke penyedia lain, berbagai model terbuka dan model eksklusif (OpenAi, Gemini, Antropik, Mistral, Kebingungan, dll) | |
| Deepinfra | $ 1,80 | Berbagai model terbuka | |
| Nvidia nim | 1.000 panggilan API selama 1 bulan | Berbagai model terbuka | |
| AI21 | $ 10 selama 3 bulan | Jamba/Jurrasic-2 | |
| NLP Cloud | $ 15 | Verifikasi Nomor Telepon | Berbagai model terbuka |
| Memperlakukan dgn kasar | $ 10 selama 3 bulan | Solar Pro/Mini | |
| Baseten | $ 30 | Setiap model yang didukung - bayar dengan waktu komputasi | |
| xai | $ 25/bulan hingga akhir 2024 | Grok | |
| Hiperbolis | $ 10 | Deepseek v2.5 | |
| Hermes 3 llama 3.1 70b | |||
| Llama 3 70b menginstruksikan | |||
| Llama 3.1 405b Base | |||
| Llama 3.1 405b Base (FP8) | |||
| Llama 3.1 405b menginstruksikan | |||
| Llama 3.1 70b menginstruksikan | |||
| Llama 3.1 8b Instruksi | |||
| Llama 3.2 3b menginstruksikan | |||
| Pixtral 12b (2409) | |||
| QWEN QWQ 32B Pratinjau | |||
| QWEN2-VL 72B Instruksi | |||
| Qwen2-vl 7b instruksi | |||
| QWEN2.5 72B Instruksi | |||
| QWEN2.5 Coder 32B Instruksi |