free llm api resources
1.0.0
Dies listet verschiedene Dienste auf, die freien Zugriff oder Credits zur API-basierten LLM-Nutzung bieten.
Notiz
Bitte missbrauchen diese Dienste nicht, sonst könnten wir sie verlieren.
Warnung
Diese Liste schließt explizit alle nicht legitimen Dienste aus (z. B. umgekehrte Ingenieure eines vorhandenen Chatbots).
| Anbieter | Anbieterlimits/Notizen | Modellname | Modellgrenzen |
|---|---|---|---|
| Groq | Distil Whisper großes V3 | 7.200 Audiosekunden/Minute 2.000 Anfragen/Tag | |
| Gemma 2 9b unterrichten | 14.400 Anfragen/Tag 15.000 Token/Minute | ||
| Gemma 7b -Anweisung | 14.400 Anfragen/Tag 15.000 Token/Minute | ||
| Llava 1.5 7b | 14.400 Anfragen/Tag 30.000 Token/Minute | ||
| Lama 3 70b | 14.400 Anfragen/Tag 6.000 Token/Minute | ||
| LAMA 3 70B - GROQ -Tool verwenden Vorschau | 14.400 Anfragen/Tag 15.000 Token/Minute | ||
| Lama 3 8b | 14.400 Anfragen/Tag 30.000 Token/Minute | ||
| LAMA 3 8B - GROQ -Tool verwenden Vorschau | 14.400 Anfragen/Tag 15.000 Token/Minute | ||
| Lama 3.1 70b | 14.400 Anfragen/Tag 6.000 Token/Minute | ||
| Lama 3.1 8b | 14.400 Anfragen/Tag 20.000 Token/Minute | ||
| Lama 3.2 11b Vision | 7.000 Anfragen/Tag 7.000 Token/Minute | ||
| Lama 3.2 1b | 7.000 Anfragen/Tag 7.000 Token/Minute | ||
| Lama 3.2 3b | 7.000 Anfragen/Tag 7.000 Token/Minute | ||
| Lama 3.2 90b Vision | 3.500 Anfragen/Tag 7.000 Token/Minute | ||
| Lama Guard 3 8b | 14.400 Anfragen/Tag 15.000 Token/Minute | ||
| Mixtral 8x7b | 14.400 Anfragen/Tag 5.000 Token/Minute | ||
| Flüster groß v3 | 7.200 Audiosekunden/Minute 2.000 Anfragen/Tag | ||
| Flüster großer v3 Turbo | 7.200 Audiosekunden/Minute 2.000 Anfragen/Tag | ||
| OpenRouter | 20 Anfragen/Minute 200 Anfragen/Tag | Gemma 2 9b unterrichten | |
| Hermes 3 Lama 3.1 405b | |||
| Flüssiges LFM 40b | |||
| Lama 3 8b anweisen | |||
| LAMA 3.1 405B Anweisung | |||
| LAMA 3.1 70B Anweisung | |||
| Lama 3.1 8B Anweisung | |||
| Lama 3.2 11b Vision Anweisungen | |||
| Lama 3.2 1B Anweisung | |||
| Lama 3.2 3b anweisen | |||
| Lama 3.2 90b Vision Anweisung | |||
| Mistral 7B -Anweisung | |||
| Mythomax L2 13b | |||
| OpenChat 7b | |||
| PHI-3-Medium 128k anweisen | |||
| PHI-3-Mini 128k anweisen | |||
| Qwen 2 7b anweisen | |||
| Toppy M 7b | |||
| Zephyr 7b Beta | |||
| Google AI Studio | Daten werden für das Training verwendet (wenn sie außerhalb des Vereinigten Königreichs/CH/EWR/EU verwendet werden). | Gemini 1.5 Blitz | 1.000.000 Token/Minute 1.500 Anfragen/Tag 15 Anfragen/Minute |
| Gemini 1.5 Flash (experimentell) | 1.000.000 Token/Minute 1.500 Anfragen/Tag 5 Anfragen/Minute | ||
| Gemini 1.5 Flash-8b | 1.000.000 Token/Minute 1.500 Anfragen/Tag 15 Anfragen/Minute | ||
| Gemini 1.5 Flash-8b (experimentell) | 1.000.000 Token/Minute 1.500 Anfragen/Tag 15 Anfragen/Minute | ||
| Gemini 1.5 Pro | 32.000 Token/Minute 50 Anfragen/Tag 2 Anfragen/Minute | ||
| Gemini 1.5 Pro (experimentell) | 1.000.000 Token/Minute 50 Anfragen/Tag 2 Anfragen/Minute | ||
| Gemini 1.0 Pro | 32.000 Token/Minute 1.500 Anfragen/Tag 15 Anfragen/Minute | ||
| Text-Embedding-004 | 150 Batch -Anfragen/Minute 1.500 Anfragen/Minute 100 Inhalt/Charge | ||
| Einbettung-001 | |||
| Lambda Labs (kostenlose Vorschau) | Erfordert Kreditkartenüberprüfung. | Hermes 3 405b | |
| Hermes 3 70b | |||
| Hermes 3 8b | |||
| Flüssiges LFM 40b | |||
| LAMA 3.1 405B Anweisung (FP8) | |||
| LAMA 3.1 70B Anweisung (FP8) | |||
| Lama 3.1 8B Anweisung | |||
| Lama 3.1 Nemotron 70B Unterricht | |||
| Lama 3.2 3b anweisen | |||
| QWEN2.5 Codierer 32B Anweisungen | |||
| Mistral (La Plateforme) | Für die kostenlose Stufe (Experimentplan) muss sich die Überprüfung der Telefonnummern zur Telefonnummer einsetzen. | Offene und proprietäre Mistralmodelle | 1 Anfrage/Sekunde 500.000 Token/Minute 1.000.000.000 Token/Monat |
| Mistral (Codestral) | Derzeit kostenlos zu verwenden, monatlich abonnementbasiert, erfordert eine Überprüfung der Telefonnummer. | Codestral | 30 Anfragen/Minute 2.000 Anfragen/Tag |
| Serienloser Umarmungserlebnis | Begrenzt auf Modelle, die kleiner als 10 GB sind. Einige beliebte Modelle werden auch dann unterstützt, wenn sie 10 GB überschreiten. | Verschiedene offene Modelle | 1.000 Anfragen/Tag (mit einem Konto) |
| Sambanova Cloud | Lama 3.1 405b | 10 Anfragen/Minute | |
| Lama 3.2 90b | 1 Anfrage/Minute | ||
| Lama 3.1 70b | 20 Anfragen/Minute | ||
| Lama 3.2 11b | 10 Anfragen/Minute | ||
| Lama 3.1 8b | 30 Anfragen/Minute | ||
| Lama 3.2 3b | 30 Anfragen/Minute | ||
| Lama 3.2 1b | 30 Anfragen/Minute | ||
| Cerebras | Warteliste Freie Stufe, die auf 8K -Kontext beschränkt ist | Lama 3.1 8b | 30 Anfragen/Minute 60.000 Token/Minute 900 Anfragen/Stunde 1.000.000 Token/Stunde 14.400 Anfragen/Tag 1.000.000 Token/Tag |
| Lama 3.1 70b | 30 Anfragen/Minute 60.000 Token/Minute 900 Anfragen/Stunde 1.000.000 Token/Stunde 14.400 Anfragen/Tag 1.000.000 Token/Tag | ||
| Github -Modelle | Warteliste Ratenlimits abhängig von der Abonnementstufe Copilot | AI21-JAMBA-ISTRUCT | |
| Cohere Command r | |||
| Cohere -Befehl r+ | |||
| Cohere -Embett V3 Englisch | |||
| Cohere -Embed V3 Mehrsprachiger | |||
| Meta-llama-3-70b-struktur | |||
| Meta-llama-3-8b-instruct | |||
| Meta-llama-3.1-405b-instruct | |||
| Meta-llama-3.1-70b-struktur | |||
| Meta-llama-3.1-8b-struktur | |||
| Mistral Large | |||
| Mistral Large (2407) | |||
| Mistral Nemo | |||
| Mistral Small | |||
| OpenAI GPT-4O | |||
| OpenAI GPT-4O Mini | |||
| Openai Text einbettet 3 (groß) | |||
| Openai Text einbettet 3 (klein) | |||
| PHI-3-MEDIUM-Anweisungen (128K) | |||
| PHI-3-MEDIUM-Anweisung (4K) | |||
| PHi-3-mini-Anweisungen (128K) | |||
| Phi-3-Mini-Anweisungen (4K) | |||
| PHI-3-Small-Anweisungen (128K) | |||
| PHI-3-Small-Anweisungen (8K) | |||
| PHi-3,5-mini-Anweisungen (128K) | |||
| OVH AI -Endpunkte (freie Beta) | CODELLAMA 13B BESTURT | 12 Anfragen/Minute | |
| Codestral Mamba 7b v0.1 | 12 Anfragen/Minute | ||
| Lama 2 13b Chat | 12 Anfragen/Minute | ||
| LAMA 3 70B Anweisungen | 12 Anfragen/Minute | ||
| Lama 3 8b anweisen | 12 Anfragen/Minute | ||
| LAMA 3.1 70B Anweisung | 12 Anfragen/Minute | ||
| Mathstral 7b v0.1 | 12 Anfragen/Minute | ||
| Mistral 7B -Anweisung | 12 Anfragen/Minute | ||
| Mistral Nemo 2407 | 12 Anfragen/Minute | ||
| MIMTRAL 8X22B BESTURT | 12 Anfragen/Minute | ||
| MIXTRAL 8X7B BESTURT | 12 Anfragen/Minute | ||
| Cloudflare Workers AI | 10.000 Token/Tag | Deepseek Codierer 6.7b Base (AWQ) | |
| Deepseek Codierer 6.7b Anweisung (AWQ) | |||
| Deepseek Math 7b unterrichtet | |||
| Verfärbter Deutsch 7B V1 (AWQ) | |||
| Falcom 7b -Anweisung | |||
| Gemma 2b -Anweisungen (Lora) | |||
| Gemma 7b -Anweisung | |||
| Gemma 7b -Anweisungen (Lora) | |||
| Hermes 2 Pro Mistral 7b | |||
| Lama 2 13b Chat (AWQ) | |||
| Lama 2 7b Chat (FP16) | |||
| Lama 2 7b Chat (int8) | |||
| Lama 2 7b Chat (Lora) | |||
| Lama 3 8b anweisen | |||
| Lama 3 8b anweisen | |||
| LAMA 3 8B Anweisung (AWQ) | |||
| Lama 3.1 8B Anweisung | |||
| LAMA 3.1 8B Anweisung (AWQ) | |||
| LAMA 3.1 8B Anweisung (FP8) | |||
| Lama 3.2 11b Vision Anweisungen | |||
| Lama 3.2 1B Anweisung | |||
| Lama 3.2 3b anweisen | |||
| Llamaguard 7b (awq) | |||
| Mistral 7b unterrichtet v0.1 | |||
| Mistral 7b unterrichtet v0.1 (AWQ) | |||
| Mistral 7b unterrichtet v0.2 | |||
| Mistral 7b unterrichtet v0.2 (Lora) | |||
| Neural Chat 7b v3.1 (AWQ) | |||
| OpenChat 3.5 0106 | |||
| Openhermes 2.5 Mistral 7B (AWQ) | |||
| Phi-2 | |||
| Qwen 1,5 0,5B Chat | |||
| Qwen 1.5 1.8b Chat | |||
| Qwen 1.5 14b Chat (AWQ) | |||
| QWEN 1.5 7B CHAT (AWQ) | |||
| SQLCODER 7B 2 | |||
| Starling LM 7B Beta | |||
| Tinyllama 1.1b Chat v1.0 | |||
| UNA Cybertron 7b V2 (BF16) | |||
| Zephyr 7b Beta (AWQ) | |||
| Zusammen | Lama 3.2 11b Vision Anweisungen | Kostenlos für 2024 | |
| Zusammenhängen | 20 Anfragen/min 1.000 Anfragen/Monat | Kommando-R | Gemeinsame Grenze |
| Kommando-R+ | |||
| Google Cloud -Scheitelpunkt AI | Sehr strenge Zahlungsüberprüfung für Google Cloud. | LAMA 3.1 70B Anweisung | LAMA 3.1 API -Service kostenlos während der Vorschau. 60 Anfragen/Minute |
| Lama 3.1 8B Anweisung | LAMA 3.1 API -Service kostenlos während der Vorschau. 60 Anfragen/Minute | ||
| Lama 3.2 90b Vision Anweisung | LAMA 3.2 API -Service kostenlos während der Vorschau. 30 Anfragen/Minute | ||
| Gemini Flash Experimental | Experimentelles Gemini -Modell. 10 Anfragen/Minute | ||
| Gemini Pro Experimental | |||
| GLHF.Chat (kostenlose Beta) | E -Mail für den API -Zugriff | Jedes Modell für umarmtes Gesicht, das auf VLLM läuft und auf einen A100 -Knoten (~ 640 GB VRAM) passt, einschließlich Lama 3.1 405B bei FP8 |
| Anbieter | Credits | Anforderungen | Modelle |
|---|---|---|---|
| Zusammen | $ 5 | Verschiedene offene Modelle | |
| Feuerwerk | $ 1 | Verschiedene offene Modelle | |
| Vereinheitlichen | $ 10 (+40 USD für den Kontakt) | Routen zu anderen Anbietern, verschiedenen offenen Modellen und proprietären Modellen (OpenAI, Gemini, Anthropic, Mistral, Verwirrung usw.) | |
| Deepinfra | $ 1,80 | Verschiedene offene Modelle | |
| Nvidia nim | 1.000 API fordert 1 Monat | Verschiedene offene Modelle | |
| AI21 | 10 Dollar für 3 Monate | Jamba/Jurrac-2 | |
| NLP Cloud | $ 15 | Telefonnummer -Überprüfung | Verschiedene offene Modelle |
| Upstage | 10 Dollar für 3 Monate | Solar Pro/Mini | |
| Basis | $ 30 | Jedes unterstütztes Modell - Zahlen Sie nach Berechnung Zeit | |
| xai | $ 25/Monat bis Ende 2024 | Gruben | |
| Hyperbolisch | $ 10 | Deepseek v2.5 | |
| Hermes 3 Lama 3.1 70b | |||
| LAMA 3 70B Anweisungen | |||
| Lama 3.1 405b Basis | |||
| Lama 3.1 405b Basis (FP8) | |||
| LAMA 3.1 405B Anweisung | |||
| LAMA 3.1 70B Anweisung | |||
| Lama 3.1 8B Anweisung | |||
| Lama 3.2 3b anweisen | |||
| Pixtral 12b (2409) | |||
| QWEN QWQ 32B Vorschau | |||
| QWEN2-VL 72B-Anweisung | |||
| QWEN2-VL 7B-Anweisung | |||
| Qwen2.5 72B Anweisung | |||
| QWEN2.5 Codierer 32B Anweisungen |