free llm api resources
1.0.0
Esto enumera varios servicios que proporcionan acceso gratuito o créditos para el uso de LLM basado en API.
Nota
No abuse de estos servicios, de lo contrario podríamos perderlos.
Advertencia
Esta lista excluye explícitamente cualquier servicio que no sea legítimo (por ejemplo, ingenieros inversos en un chatbot existente)
| Proveedor | Límites/notas del proveedor | Nombre del modelo | Límites de modelo |
|---|---|---|---|
| Hacer surgimiento | Distil Whisper grande V3 | 7,200 Audio-Segundos/minuto 2,000 solicitudes/día | |
| Gemma 2 9B instructa | 14,400 solicitudes/día 15,000 tokens/minuto | ||
| Gemma 7b instructo | 14,400 solicitudes/día 15,000 tokens/minuto | ||
| Llava 1.5 7b | 14,400 solicitudes/día 30,000 tokens/minuto | ||
| Llama 3 70b | 14,400 solicitudes/día 6,000 fichas/minuto | ||
| Llama 3 70B - Vista previa de uso de herramientas Groq | 14,400 solicitudes/día 15,000 tokens/minuto | ||
| Llama 3 8B | 14,400 solicitudes/día 30,000 tokens/minuto | ||
| Llama 3 8B - Vista previa de uso de la herramienta Groq | 14,400 solicitudes/día 15,000 tokens/minuto | ||
| Llama 3.1 70b | 14,400 solicitudes/día 6,000 fichas/minuto | ||
| Llama 3.1 8B | 14,400 solicitudes/día 20,000 tokens/minuto | ||
| Llama 3.2 11b Visión | 7,000 solicitudes/día 7,000 fichas/minuto | ||
| Llama 3.2 1B | 7,000 solicitudes/día 7,000 fichas/minuto | ||
| Llama 3.2 3B | 7,000 solicitudes/día 7,000 fichas/minuto | ||
| LLAMA 3.2 90B VISIÓN | 3.500 solicitudes/día 7,000 fichas/minuto | ||
| Guardia de llamas 3 8B | 14,400 solicitudes/día 15,000 tokens/minuto | ||
| Mixtral 8x7b | 14,400 solicitudes/día 5,000 tokens/minuto | ||
| Susurros grandes v3 | 7,200 Audio-Segundos/minuto 2,000 solicitudes/día | ||
| Susurros grandes v3 turbo | 7,200 Audio-Segundos/minuto 2,000 solicitudes/día | ||
| OpenRouter | 20 solicitudes/minuto 200 solicitudes/día | Gemma 2 9B instructa | |
| Hermes 3 Llama 3.1 405b | |||
| Líquido LFM 40B | |||
| LLAMA 3 8B INSTRUCT | |||
| LLAMA 3.1 405B INSTRUCT | |||
| LLAMA 3.1 70B INSTRUCT | |||
| LLAMA 3.1 8B INSTRUCT | |||
| LLAMA 3.2 11B INSTRUCTO DE VISIÓN | |||
| Llama 3.2 1b instruir | |||
| Llama 3.2 3B instruir | |||
| LLAMA 3.2 90B VISION INSTRUCT | |||
| Instructo de 7b mistral | |||
| Mythomax l2 13b | |||
| OpenChat 7b | |||
| Phi-3 Medium 128K instruir | |||
| Phi-3 mini 128k instrucciones | |||
| Qwen 2 7b instruir | |||
| Toppy m 7b | |||
| Zephyr 7b beta | |||
| Google AI Studio | Los datos se utilizan para el entrenamiento (cuando se usan fuera del Reino Unido/CH/EEA/UE). | Géminis 1.5 flash | 1,000,000 de tokens/minuto 1.500 solicitudes/día 15 solicitudes/minuto |
| Géminis 1.5 Flash (experimental) | 1,000,000 de tokens/minuto 1.500 solicitudes/día 5 solicitudes/minuto | ||
| Géminis 1.5 Flash-8B | 1,000,000 de tokens/minuto 1.500 solicitudes/día 15 solicitudes/minuto | ||
| Géminis 1.5 Flash-8B (experimental) | 1,000,000 de tokens/minuto 1.500 solicitudes/día 15 solicitudes/minuto | ||
| Géminis 1.5 Pro | 32,000 tokens/minuto 50 solicitudes/día 2 solicitudes/minuto | ||
| Géminis 1.5 Pro (experimental) | 1,000,000 de tokens/minuto 50 solicitudes/día 2 solicitudes/minuto | ||
| Géminis 1.0 Pro | 32,000 tokens/minuto 1.500 solicitudes/día 15 solicitudes/minuto | ||
| texto incrustado-004 | 150 solicitudes de lotes/minuto 1.500 solicitudes/minuto 100 contenido/lote | ||
| incrustación-001 | |||
| Lambda Labs (vista previa gratuita) | Requiere verificación de la tarjeta de crédito. | Hermes 3 405b | |
| Hermes 3 70b | |||
| Hermes 3 8B | |||
| Líquido LFM 40B | |||
| LLAMA 3.1 405B INSTRUCT (FP8) | |||
| LLAMA 3.1 70B INSTRUCT (FP8) | |||
| LLAMA 3.1 8B INSTRUCT | |||
| Llama 3.1 Nemotron 70B instruct | |||
| Llama 3.2 3B instruir | |||
| QWEN2.5 Coder 32B instruct | |||
| Mistral (La PlateForme) | El nivel libre (plan de experimento) requiere optar por la capacitación en datos, requiere verificación del número de teléfono. | Modelos Mistrales abiertos y patentados | 1 solicitud/segundo 500,000 tokens/minuto 1,000,000,000 de tokens/mes |
| Mistral (Codestral) | Actualmente de uso gratuito, basado en suscripción mensual, requiere verificación del número de teléfono. | Codestral | 30 solicitudes/minuto 2,000 solicitudes/día |
| Huggingface Inferencia sin servidor | Limitado a modelos menores de 10 GB. Algunos modelos populares son compatibles incluso si superan los 10 GB. | Varios modelos abiertos | 1,000 solicitudes/día (con una cuenta) |
| Nube de sambanova | Llama 3.1 405b | 10 solicitudes/minuto | |
| Llama 3.2 90b | 1 solicitud/minuto | ||
| Llama 3.1 70b | 20 solicitudes/minuto | ||
| Llama 3.2 11b | 10 solicitudes/minuto | ||
| Llama 3.1 8B | 30 solicitudes/minuto | ||
| Llama 3.2 3B | 30 solicitudes/minuto | ||
| Llama 3.2 1B | 30 solicitudes/minuto | ||
| Cerebras | Lista de espera Nivel libre restringido al contexto de 8k | Llama 3.1 8B | 30 solicitudes/minuto 60,000 tokens/minuto 900 solicitudes/hora 1,000,000 de tokens/hora 14,400 solicitudes/día 1,000,000 de tokens/día |
| Llama 3.1 70b | 30 solicitudes/minuto 60,000 tokens/minuto 900 solicitudes/hora 1,000,000 de tokens/hora 14,400 solicitudes/día 1,000,000 de tokens/día | ||
| Modelos de Github | Lista de espera Límites de tasa que dependen del nivel de suscripción de copilot | AI21-Jamba-Instructo | |
| Cohere Command R | |||
| Cohere Command R+ | |||
| Cohere incrustar v3 inglés | |||
| Cohere incrustar V3 multilingüe | |||
| Meta-llama-3-70B-Instructo | |||
| Meta-llama-3-8B-Instructo | |||
| Meta-llama-3.1-405b-Instructo | |||
| Meta-llama-3.1-70B-Instructo | |||
| Meta-llama-3.1-8b-instructo | |||
| Mistral grande | |||
| Mistral grande (2407) | |||
| Nemo mistral | |||
| Mistral pequeño | |||
| OPERAI GPT-4O | |||
| OPERAI GPT-4O MINI | |||
| Texto de Operai Incrustación 3 (grande) | |||
| Texto de Operai Incrustación 3 (pequeña) | |||
| Phi-3-medio instructo (128k) | |||
| Phi-3-medio instructo (4k) | |||
| Phi-3-Mini instructo (128k) | |||
| Phi-3-Mini instructo (4k) | |||
| Phi-3-Small Instruir (128k) | |||
| Phi-3-Small Instruir (8k) | |||
| Phi-3.5-Mini instructo (128k) | |||
| Ovh AI Endpoints (beta gratis) | Codellama 13b instructo | 12 solicitudes/minuto | |
| Codestral Mamba 7B V0.1 | 12 solicitudes/minuto | ||
| Llama 2 13b chat | 12 solicitudes/minuto | ||
| LLAMA 3 70B INSTRUCT | 12 solicitudes/minuto | ||
| LLAMA 3 8B INSTRUCT | 12 solicitudes/minuto | ||
| LLAMA 3.1 70B INSTRUCT | 12 solicitudes/minuto | ||
| Mathstral 7b V0.1 | 12 solicitudes/minuto | ||
| Instructo de 7b mistral | 12 solicitudes/minuto | ||
| Mistral Nemo 2407 | 12 solicitudes/minuto | ||
| Instructo de mixtral 8x22b | 12 solicitudes/minuto | ||
| MIXTRAL 8X7B INSTRUCT | 12 solicitudes/minuto | ||
| Trabajadores de Cloudflare AI | 10,000 tokens/día | Deepseek Coder 6.7b Base (AWQ) | |
| Deepseek Coder 6.7B Instruct (AWQ) | |||
| Deepseek Math 7b instructo | |||
| Discolm German 7b V1 (AWQ) | |||
| FALCOM 7B INSTRUCT | |||
| Gemma 2B Instructo (Lora) | |||
| Gemma 7b instructo | |||
| Gemma 7b instructa (Lora) | |||
| Hermes 2 Pro Mistral 7b | |||
| Llama 2 13B Chat (AWQ) | |||
| Llama 2 7B Chat (FP16) | |||
| Llama 2 7b chat (int8) | |||
| Llama 2 7B Chat (Lora) | |||
| LLAMA 3 8B INSTRUCT | |||
| LLAMA 3 8B INSTRUCT | |||
| LLAMA 3 8B Instruir (AWQ) | |||
| LLAMA 3.1 8B INSTRUCT | |||
| LLAMA 3.1 8B INSTRUCT (AWQ) | |||
| LLAMA 3.1 8B INSTRUCT (FP8) | |||
| LLAMA 3.2 11B INSTRUCTO DE VISIÓN | |||
| Llama 3.2 1b instruir | |||
| Llama 3.2 3B instruir | |||
| Llamaguard 7b (AWQ) | |||
| Mistral 7b instruye v0.1 | |||
| Mistral 7B instruye V0.1 (AWQ) | |||
| Mistral 7b instruye v0.2 | |||
| Mistral 7B instruye V0.2 (Lora) | |||
| Chat neural 7b v3.1 (awq) | |||
| OpenChat 3.5 0106 | |||
| OpenHermes 2.5 Mistral 7b (AWQ) | |||
| Phi-2 | |||
| Qwen 1.5 0.5b chat | |||
| Qwen 1.5 1.8b chat | |||
| QWEN 1.5 14B CHAT (AWQ) | |||
| Qwen 1.5 7b Chat (AWQ) | |||
| Sqlcoder 7b 2 | |||
| Starling LM 7B beta | |||
| Tinyllama 1.1b chat v1.0 | |||
| UNA CYBERTRON 7B V2 (BF16) | |||
| Zephyr 7B Beta (AWQ) | |||
| Juntos | LLAMA 3.2 11B INSTRUCTO DE VISIÓN | Gratis para 2024 | |
| Adherirse | 20 solicitudes/min 1,000 solicitudes/mes | Comando-R | Límite compartido |
| Comando-R+ | |||
| Google Cloud Vertex AI | Verificación de pago muy estricta para Google Cloud. | LLAMA 3.1 70B INSTRUCT | Llama 3.1 Servicio API GRATIS durante la vista previa. 60 solicitudes/minuto |
| LLAMA 3.1 8B INSTRUCT | Llama 3.1 Servicio API GRATIS durante la vista previa. 60 solicitudes/minuto | ||
| LLAMA 3.2 90B VISION INSTRUCT | LLAMA 3.2 Servicio API gratis durante la vista previa. 30 solicitudes/minuto | ||
| Géminis Flash Experimental | Modelo experimental de Géminis. 10 solicitudes/minuto | ||
| Gemini Pro Experimental | |||
| glhf.chat (beta gratis) | Correo electrónico para el acceso a la API | Cualquier modelo en la cara abrazada ejecutable en VLLM y se ajusta en un nodo A100 (~ 640GB VRAM), incluido LLAMA 3.1 405B en FP8 |
| Proveedor | Créditos | Requisitos | Modelos |
|---|---|---|---|
| Juntos | $ 5 | Varios modelos abiertos | |
| Fuegos artificiales | $ 1 | Varios modelos abiertos | |
| Unificar | $ 10 (+$ 40 para entrar en contacto) | Rutas a otros proveedores, varios modelos abiertos y modelos patentados (OpenAi, Géminis, antrópico, Mistral, Perpleidad, etc.) | |
| Profundo | $ 1.80 | Varios modelos abiertos | |
| Nvidia nim | 1,000 API llamadas para 1 mes | Varios modelos abiertos | |
| AI21 | $ 10 por 3 meses | Jamba/Jurrasic-2 | |
| Nube de PNL | $ 15 | Verificación del número de teléfono | Varios modelos abiertos |
| Altanero | $ 10 por 3 meses | Solar Pro/Mini | |
| Base | $ 30 | Cualquier modelo compatible - Pague por tiempo de cómputo | |
| xai | $ 25/mes hasta el final de 2024 | Acumular | |
| Hiperbólico | $ 10 | Deepseek v2.5 | |
| Hermes 3 Llama 3.1 70b | |||
| LLAMA 3 70B INSTRUCT | |||
| LLAMA 3.1 405B Base | |||
| Llama 3.1 Base 405B (FP8) | |||
| LLAMA 3.1 405B INSTRUCT | |||
| LLAMA 3.1 70B INSTRUCT | |||
| LLAMA 3.1 8B INSTRUCT | |||
| Llama 3.2 3B instruir | |||
| Pixtral 12B (2409) | |||
| QWEN QWQ 32B Vista previa | |||
| QWEN2-VL 72B instructo | |||
| Qwen2-vl 7b instructo | |||
| Qwen2.5 72b instrucciones | |||
| QWEN2.5 Coder 32B instruct |