free llm api resources
1.0.0
Cela répertorie divers services qui fournissent un accès gratuit ou des crédits à l'utilisation de LLM basée sur l'API.
Note
Veuillez ne pas abuser de ces services, sinon nous pourrions les perdre.
Avertissement
Cette liste exclut explicitement tous les services qui ne sont pas légitimes (par exemple, les ingénieurs inverses un chatbot existant)
| Fournisseur | Limites / notes du fournisseur | Nom du modèle | Limites du modèle |
|---|---|---|---|
| Grêle | Distil chuchoter grand v3 | 7 200 audio-secondes / minute 2 000 demandes / jour | |
| GEMMA 2 9B | 14 400 demandes / jour 15 000 jetons / minute | ||
| GEMMA 7B | 14 400 demandes / jour 15 000 jetons / minute | ||
| Llava 1.5 7b | 14 400 demandes / jour 30 000 jetons / minute | ||
| Lama 3 70b | 14 400 demandes / jour 6 000 jetons / minute | ||
| LLAMA 3 70B - outil de grooq Utiliser l'aperçu | 14 400 demandes / jour 15 000 jetons / minute | ||
| Lama 3 8b | 14 400 demandes / jour 30 000 jetons / minute | ||
| LLAMA 3 8B - outil de grooq Utiliser l'aperçu | 14 400 demandes / jour 15 000 jetons / minute | ||
| Lama 3.1 70b | 14 400 demandes / jour 6 000 jetons / minute | ||
| Lama 3.1 8b | 14 400 demandes / jour 20 000 jetons / minute | ||
| Llama 3.2 11b Vision | 7 000 demandes / jour 7 000 jetons / minute | ||
| Lama 3.2 1b | 7 000 demandes / jour 7 000 jetons / minute | ||
| Lama 3.2 3b | 7 000 demandes / jour 7 000 jetons / minute | ||
| LLAMA 3.2 90b Vision | 3 500 demandes / jour 7 000 jetons / minute | ||
| Llama Guard 3 8b | 14 400 demandes / jour 15 000 jetons / minute | ||
| Mixtral 8x7b | 14 400 demandes / jour 5 000 jetons / minute | ||
| Chuchotement grand v3 | 7 200 audio-secondes / minute 2 000 demandes / jour | ||
| Chuchoter grand v3 turbo | 7 200 audio-secondes / minute 2 000 demandes / jour | ||
| Ouverte | 20 demandes / minute 200 demandes / jour | GEMMA 2 9B | |
| Hermes 3 Llama 3.1 405b | |||
| Liquide LFM 40B | |||
| LLAMA 3 8B | |||
| LLAMA 3.1 405B | |||
| LLAMA 3.1 70b Instruct | |||
| LLAMA 3.1 8B | |||
| LLAMA 3.2 11b Vision Instruct | |||
| LLAMA 3.2 1B Instruct | |||
| LLAMA 3.2 3B Instruct | |||
| LLAMA 3.2 90b Vision Instruct | |||
| Mistral 7b Instruct | |||
| Mythomax l2 13b | |||
| Openchat 7b | |||
| PHI-3 Medium 128k Instruct | |||
| PHI-3 Mini 128k Instruct | |||
| Qwen 2 7b Instruct | |||
| Toppy m 7b | |||
| Zephyr 7b Beta | |||
| Google AI Studio | Les données sont utilisées pour la formation (lorsqu'elles sont utilisées en dehors du Royaume-Uni / CH / EEA / EU). | Gémeaux 1.5 Flash | 1 000 000 jetons / minute 1 500 demandes / jour 15 demandes / minute |
| Gemini 1.5 Flash (expérimental) | 1 000 000 jetons / minute 1 500 demandes / jour 5 demandes / minute | ||
| Gémeaux 1.5 Flash-8b | 1 000 000 jetons / minute 1 500 demandes / jour 15 demandes / minute | ||
| Gemini 1.5 Flash-8b (expérimental) | 1 000 000 jetons / minute 1 500 demandes / jour 15 demandes / minute | ||
| Gémeaux 1.5 Pro | 32 000 jetons / minute 50 demandes / jour 2 demandes / minute | ||
| Gemini 1.5 Pro (expérimental) | 1 000 000 jetons / minute 50 demandes / jour 2 demandes / minute | ||
| Gemini 1.0 Pro | 32 000 jetons / minute 1 500 demandes / jour 15 demandes / minute | ||
| Texte-Embedding-004 | 150 demandes de lots / minute 1 500 demandes / minute 100 contenu / lot | ||
| intégrer-001 | |||
| Lambda Labs (aperçu gratuit) | Nécessite une vérification des cartes de crédit. | Hermès 3 405b | |
| Hermès 3 70b | |||
| Hermès 3 8b | |||
| Liquide LFM 40B | |||
| LLAMA 3.1 405B Instruct (FP8) | |||
| LLAMA 3.1 70B Instruct (FP8) | |||
| LLAMA 3.1 8B | |||
| LLAMA 3.1 Nemotron 70b Instruct | |||
| LLAMA 3.2 3B Instruct | |||
| Qwen2.5 Codeur 32b Instruct | |||
| Mistral (La Plateforme) | Le niveau gratuit (plan d'expérience) nécessite d'opter dans la formation des données, nécessite une vérification du numéro de téléphone. | Modèles de Mistral ouverts et propriétaires | 1 demande / seconde 500 000 jetons / minute 1 000 000 000 jetons / mois |
| Mistral (codestral) | Actuellement gratuit, basé sur un abonnement mensuel, nécessite une vérification du numéro de téléphone. | Codestral | 30 demandes / minute 2 000 demandes / jour |
| Inférence sans serveur HUGGINGFACT | Limité à des modèles inférieurs à 10 Go. Certains modèles populaires sont pris en charge même s'ils dépassent 10 Go. | Divers modèles ouverts | 1 000 demandes / jour (avec un compte) |
| Nuage de sambanova | Lama 3.1 405b | 10 demandes / minute | |
| Lama 3.2 90b | 1 demande / minute | ||
| Lama 3.1 70b | 20 demandes / minute | ||
| Lama 3.2 11b | 10 demandes / minute | ||
| Lama 3.1 8b | 30 demandes / minute | ||
| Lama 3.2 3b | 30 demandes / minute | ||
| Lama 3.2 1b | 30 demandes / minute | ||
| Cérébras | Liste d'attente Tier libre limité au contexte 8K | Lama 3.1 8b | 30 demandes / minute 60 000 jetons / minute 900 demandes / heure 1 000 000 jetons / heure 14 400 demandes / jour 1 000 000 jetons / jour |
| Lama 3.1 70b | 30 demandes / minute 60 000 jetons / minute 900 demandes / heure 1 000 000 jetons / heure 14 400 demandes / jour 1 000 000 jetons / jour | ||
| Modèles GitHub | Liste d'attente Limites de taux en fonction du niveau d'abonnement Copilot | AI21-JAMBA-INSTRUCT | |
| Commande cohére r | |||
| Commande cohere r + | |||
| Cohere Embed v3 English | |||
| Cohére intégrer v3 multilingue | |||
| Méta-llama-3-70b-instruit | |||
| Méta-llama-3-8b-instruit | |||
| Meta-Llama-3.1-405B-Istruct | |||
| Meta-Llama-3.1-70B-Instruct | |||
| Méta-llama-3.1-8b-instruct | |||
| Mistral | |||
| Mistral grand (2407) | |||
| Mistral Nemo | |||
| Mistral Small | |||
| Openai GPT-4O | |||
| Openai GPT-4O Mini | |||
| Texte Openai Embeding 3 (grand) | |||
| Texte Openai Intégration 3 (Small) | |||
| PHI-3-Medium Instruct (128K) | |||
| PHI-3-Medium Instruct (4K) | |||
| PHI-3-MINI INSTRUCT (128K) | |||
| PHI-3-MINI INSTRUCT (4K) | |||
| PHI-3-Small Instruct (128k) | |||
| PHI-3-Small Instruct (8K) | |||
| PHI-3,5-moins instruct (128k) | |||
| OVH AI Points de terminaison (bêta libre) | Codellama 13B | 12 demandes / minute | |
| Codestral mamba 7b v0.1 | 12 demandes / minute | ||
| LLAMA 2 13B CHAT | 12 demandes / minute | ||
| LLAMA 3 70B | 12 demandes / minute | ||
| LLAMA 3 8B | 12 demandes / minute | ||
| LLAMA 3.1 70b Instruct | 12 demandes / minute | ||
| Mathstral 7b v0.1 | 12 demandes / minute | ||
| Mistral 7b Instruct | 12 demandes / minute | ||
| Mistral Nemo 2407 | 12 demandes / minute | ||
| Mixtral 8x22b Instruct | 12 demandes / minute | ||
| Mixtral 8x7b Instruct | 12 demandes / minute | ||
| Cloudflare Workers AI | 10 000 jetons / jour | Deepseek Coder 6.7b Base (AWQ) | |
| Deepseek Coder 6.7b Instruct (AWQ) | |||
| Deepseek math 7b instruct | |||
| Discolm allemand 7b v1 (AWQ) | |||
| FALCOM 7B | |||
| GEMMA 2B INSTRUCT (LORA) | |||
| GEMMA 7B | |||
| Gemma 7b Instruct (LORA) | |||
| Hermes 2 Pro Mistral 7b | |||
| LLAMA 2 13B CHAT (AWQ) | |||
| LLAMA 2 7B CHAT (FP16) | |||
| LLAMA 2 7B CHAT (INT8) | |||
| LLAMA 2 7B CHAT (LORA) | |||
| LLAMA 3 8B | |||
| LLAMA 3 8B | |||
| LLAMA 3 8B Instruct (AWQ) | |||
| LLAMA 3.1 8B | |||
| LLAMA 3.1 8B Instruct (AWQ) | |||
| LLAMA 3.1 8B Instruct (FP8) | |||
| LLAMA 3.2 11b Vision Instruct | |||
| LLAMA 3.2 1B Instruct | |||
| LLAMA 3.2 3B Instruct | |||
| Llamaguard 7b (AWQ) | |||
| Mistral 7B instruct v0.1 | |||
| Mistral 7B instruct v0.1 (AWQ) | |||
| Mistral 7B instruct v0.2 | |||
| Mistral 7B instruct v0.2 (LORA) | |||
| Chat neuronal 7b v3.1 (AWQ) | |||
| OpenChat 3.5 0106 | |||
| OpenHermes 2.5 Mistral 7B (AWQ) | |||
| Phi-2 | |||
| Qwen 1.5 0.5b Chat | |||
| Qwen 1.5 1.8b Chat | |||
| Qwen 1.5 14b Chat (AWQ) | |||
| Qwen 1.5 7b Chat (AWQ) | |||
| Sqlcoder 7b 2 | |||
| Starling LM 7B Beta | |||
| Tinyllama 1.1b Chat v1.0 | |||
| Una Cybertron 7b V2 (BF16) | |||
| Zephyr 7b Beta (AWQ) | |||
| Ensemble | LLAMA 3.2 11b Vision Instruct | GRATUIT pour 2024 | |
| Adhérer | 20 demandes / min 1 000 demandes / mois | Command-R | Limite partagée |
| Command-r + | |||
| Google Cloud Vertex AI | Vérification de paiement très stricte pour Google Cloud. | LLAMA 3.1 70b Instruct | Service API LLAMA 3.1 gratuit pendant l'aperçu. 60 demandes / minute |
| LLAMA 3.1 8B | Service API LLAMA 3.1 gratuit pendant l'aperçu. 60 demandes / minute | ||
| LLAMA 3.2 90b Vision Instruct | Service API LLAMA 3.2 gratuit pendant l'aperçu. 30 demandes / minute | ||
| Gemini Flash expérimental | Modèle expérimental des Gémeaux. 10 demandes / minute | ||
| Gemini Pro expérimental | |||
| glhf.chat (bêta libre) | Email pour l'accès à l'API | Tout modèle sur le visage étreint relant sur VLLM et s'adapte sur un nœud A100 (~ 640 Go VRAM), y compris Llama 3.1 405b à FP8 |
| Fournisseur | Crédits | Exigences | Modèles |
|---|---|---|---|
| Ensemble | 5 $ | Divers modèles ouverts | |
| Feux d'artifice | 1 $ | Divers modèles ouverts | |
| Unifier | 10 $ (+ 40 $ pour entrer en contact) | Les voies vers d'autres fournisseurs, divers modèles ouverts et modèles propriétaires (Openai, Gemini, anthropique, Mistral, Perplexité, etc.) | |
| Deepinfra | 1,80 $ | Divers modèles ouverts | |
| Nvidia nim | 1 000 appels API pendant 1 mois | Divers modèles ouverts | |
| AI21 | 10 $ pour 3 mois | Jamba / Jurrasic-2 | |
| Nuage NLP | 15 $ | Vérification du numéro de téléphone | Divers modèles ouverts |
| En haut | 10 $ pour 3 mois | Solar Pro / Mini | |
| Bassier | 30 $ | Tout modèle pris en charge - payer par temps de calcul | |
| xai | 25 $ / mois jusqu'à la fin de 2024 | Goer | |
| Hyperbolique | 10 $ | Deepseek v2.5 | |
| Hermes 3 Llama 3.1 70b | |||
| LLAMA 3 70B | |||
| Llama 3.1 405b Base | |||
| LLAMA 3.1 405b Base (FP8) | |||
| LLAMA 3.1 405B | |||
| LLAMA 3.1 70b Instruct | |||
| LLAMA 3.1 8B | |||
| LLAMA 3.2 3B Instruct | |||
| Pixtral 12b (2409) | |||
| QWEN QWQ 32B | |||
| Instruct Qwen2-vl 72b | |||
| Qwen2-vl 7b Instruct | |||
| Qwen2.5 72b Instruct | |||
| Qwen2.5 Codeur 32b Instruct |