Descarga free llm api resources - Descargar el código fuente free llm api resources

free llm api resources

Otro código fuente

1.0.0

Descargar

Recursos de API LLM gratis

Esto enumera varios servicios que proporcionan acceso gratuito o créditos para el uso de LLM basado en API.

Nota

No abuse de estos servicios, de lo contrario podríamos perderlos.

Advertencia

Esta lista excluye explícitamente cualquier servicio que no sea legítimo (por ejemplo, ingenieros inversos en un chatbot existente)

Proveedores gratuitos

Proveedor	Límites/notas del proveedor	Nombre del modelo	Límites de modelo
Hacer surgimiento		Distil Whisper grande V3	7,200 Audio-Segundos/minuto 2,000 solicitudes/día
		Gemma 2 9B instructa	14,400 solicitudes/día 15,000 tokens/minuto
		Gemma 7b instructo	14,400 solicitudes/día 15,000 tokens/minuto
		Llava 1.5 7b	14,400 solicitudes/día 30,000 tokens/minuto
		Llama 3 70b	14,400 solicitudes/día 6,000 fichas/minuto
		Llama 3 70B - Vista previa de uso de herramientas Groq	14,400 solicitudes/día 15,000 tokens/minuto
		Llama 3 8B	14,400 solicitudes/día 30,000 tokens/minuto
		Llama 3 8B - Vista previa de uso de la herramienta Groq	14,400 solicitudes/día 15,000 tokens/minuto
		Llama 3.1 70b	14,400 solicitudes/día 6,000 fichas/minuto
		Llama 3.1 8B	14,400 solicitudes/día 20,000 tokens/minuto
		Llama 3.2 11b Visión	7,000 solicitudes/día 7,000 fichas/minuto
		Llama 3.2 1B	7,000 solicitudes/día 7,000 fichas/minuto
		Llama 3.2 3B	7,000 solicitudes/día 7,000 fichas/minuto
		LLAMA 3.2 90B VISIÓN	3.500 solicitudes/día 7,000 fichas/minuto
		Guardia de llamas 3 8B	14,400 solicitudes/día 15,000 tokens/minuto
		Mixtral 8x7b	14,400 solicitudes/día 5,000 tokens/minuto
		Susurros grandes v3	7,200 Audio-Segundos/minuto 2,000 solicitudes/día
		Susurros grandes v3 turbo	7,200 Audio-Segundos/minuto 2,000 solicitudes/día
OpenRouter	20 solicitudes/minuto 200 solicitudes/día	Gemma 2 9B instructa
		Hermes 3 Llama 3.1 405b
		Líquido LFM 40B
		LLAMA 3 8B INSTRUCT
		LLAMA 3.1 405B INSTRUCT
		LLAMA 3.1 70B INSTRUCT
		LLAMA 3.1 8B INSTRUCT
		LLAMA 3.2 11B INSTRUCTO DE VISIÓN
		Llama 3.2 1b instruir
		Llama 3.2 3B instruir
		LLAMA 3.2 90B VISION INSTRUCT
		Instructo de 7b mistral
		Mythomax l2 13b
		OpenChat 7b
		Phi-3 Medium 128K instruir
		Phi-3 mini 128k instrucciones
		Qwen 2 7b instruir
		Toppy m 7b
		Zephyr 7b beta
Google AI Studio	Los datos se utilizan para el entrenamiento (cuando se usan fuera del Reino Unido/CH/EEA/UE).	Géminis 1.5 flash	1,000,000 de tokens/minuto 1.500 solicitudes/día 15 solicitudes/minuto
		Géminis 1.5 Flash (experimental)	1,000,000 de tokens/minuto 1.500 solicitudes/día 5 solicitudes/minuto
		Géminis 1.5 Flash-8B	1,000,000 de tokens/minuto 1.500 solicitudes/día 15 solicitudes/minuto
		Géminis 1.5 Flash-8B (experimental)	1,000,000 de tokens/minuto 1.500 solicitudes/día 15 solicitudes/minuto
		Géminis 1.5 Pro	32,000 tokens/minuto 50 solicitudes/día 2 solicitudes/minuto
		Géminis 1.5 Pro (experimental)	1,000,000 de tokens/minuto 50 solicitudes/día 2 solicitudes/minuto
		Géminis 1.0 Pro	32,000 tokens/minuto 1.500 solicitudes/día 15 solicitudes/minuto
		texto incrustado-004	150 solicitudes de lotes/minuto 1.500 solicitudes/minuto 100 contenido/lote
		incrustación-001
Lambda Labs (vista previa gratuita)	Requiere verificación de la tarjeta de crédito.	Hermes 3 405b
		Hermes 3 70b
		Hermes 3 8B
		Líquido LFM 40B
		LLAMA 3.1 405B INSTRUCT (FP8)
		LLAMA 3.1 70B INSTRUCT (FP8)
		LLAMA 3.1 8B INSTRUCT
		Llama 3.1 Nemotron 70B instruct
		Llama 3.2 3B instruir
		QWEN2.5 Coder 32B instruct
Mistral (La PlateForme)	El nivel libre (plan de experimento) requiere optar por la capacitación en datos, requiere verificación del número de teléfono.	Modelos Mistrales abiertos y patentados	1 solicitud/segundo 500,000 tokens/minuto 1,000,000,000 de tokens/mes
Mistral (Codestral)	Actualmente de uso gratuito, basado en suscripción mensual, requiere verificación del número de teléfono.	Codestral	30 solicitudes/minuto 2,000 solicitudes/día
Huggingface Inferencia sin servidor	Limitado a modelos menores de 10 GB. Algunos modelos populares son compatibles incluso si superan los 10 GB.	Varios modelos abiertos	1,000 solicitudes/día (con una cuenta)
Nube de sambanova		Llama 3.1 405b	10 solicitudes/minuto
		Llama 3.2 90b	1 solicitud/minuto
		Llama 3.1 70b	20 solicitudes/minuto
		Llama 3.2 11b	10 solicitudes/minuto
		Llama 3.1 8B	30 solicitudes/minuto
		Llama 3.2 3B	30 solicitudes/minuto
		Llama 3.2 1B	30 solicitudes/minuto
Cerebras	Lista de espera Nivel libre restringido al contexto de 8k	Llama 3.1 8B	30 solicitudes/minuto 60,000 tokens/minuto 900 solicitudes/hora 1,000,000 de tokens/hora 14,400 solicitudes/día 1,000,000 de tokens/día
Cerebras	Lista de espera Nivel libre restringido al contexto de 8k	Llama 3.1 70b	30 solicitudes/minuto 60,000 tokens/minuto 900 solicitudes/hora 1,000,000 de tokens/hora 14,400 solicitudes/día 1,000,000 de tokens/día
Modelos de Github	Lista de espera Límites de tasa que dependen del nivel de suscripción de copilot	AI21-Jamba-Instructo
		Cohere Command R
		Cohere Command R+
		Cohere incrustar v3 inglés
		Cohere incrustar V3 multilingüe
		Meta-llama-3-70B-Instructo
		Meta-llama-3-8B-Instructo
		Meta-llama-3.1-405b-Instructo
		Meta-llama-3.1-70B-Instructo
		Meta-llama-3.1-8b-instructo
		Mistral grande
		Mistral grande (2407)
		Nemo mistral
		Mistral pequeño
		OPERAI GPT-4O
		OPERAI GPT-4O MINI
		Texto de Operai Incrustación 3 (grande)
		Texto de Operai Incrustación 3 (pequeña)
		Phi-3-medio instructo (128k)
		Phi-3-medio instructo (4k)
		Phi-3-Mini instructo (128k)
		Phi-3-Mini instructo (4k)
		Phi-3-Small Instruir (128k)
		Phi-3-Small Instruir (8k)
		Phi-3.5-Mini instructo (128k)
Ovh AI Endpoints (beta gratis)		Codellama 13b instructo	12 solicitudes/minuto
		Codestral Mamba 7B V0.1	12 solicitudes/minuto
		Llama 2 13b chat	12 solicitudes/minuto
		LLAMA 3 70B INSTRUCT	12 solicitudes/minuto
		LLAMA 3 8B INSTRUCT	12 solicitudes/minuto
		LLAMA 3.1 70B INSTRUCT	12 solicitudes/minuto
		Mathstral 7b V0.1	12 solicitudes/minuto
		Instructo de 7b mistral	12 solicitudes/minuto
		Mistral Nemo 2407	12 solicitudes/minuto
		Instructo de mixtral 8x22b	12 solicitudes/minuto
		MIXTRAL 8X7B INSTRUCT	12 solicitudes/minuto
Trabajadores de Cloudflare AI	10,000 tokens/día	Deepseek Coder 6.7b Base (AWQ)
		Deepseek Coder 6.7B Instruct (AWQ)
		Deepseek Math 7b instructo
		Discolm German 7b V1 (AWQ)
		FALCOM 7B INSTRUCT
		Gemma 2B Instructo (Lora)
		Gemma 7b instructo
		Gemma 7b instructa (Lora)
		Hermes 2 Pro Mistral 7b
		Llama 2 13B Chat (AWQ)
		Llama 2 7B Chat (FP16)
		Llama 2 7b chat (int8)
		Llama 2 7B Chat (Lora)
		LLAMA 3 8B INSTRUCT
		LLAMA 3 8B INSTRUCT
		LLAMA 3 8B Instruir (AWQ)
		LLAMA 3.1 8B INSTRUCT
		LLAMA 3.1 8B INSTRUCT (AWQ)
		LLAMA 3.1 8B INSTRUCT (FP8)
		LLAMA 3.2 11B INSTRUCTO DE VISIÓN
		Llama 3.2 1b instruir
		Llama 3.2 3B instruir
		Llamaguard 7b (AWQ)
		Mistral 7b instruye v0.1
		Mistral 7B instruye V0.1 (AWQ)
		Mistral 7b instruye v0.2
		Mistral 7B instruye V0.2 (Lora)
		Chat neural 7b v3.1 (awq)
		OpenChat 3.5 0106
		OpenHermes 2.5 Mistral 7b (AWQ)
		Phi-2
		Qwen 1.5 0.5b chat
		Qwen 1.5 1.8b chat
		QWEN 1.5 14B CHAT (AWQ)
		Qwen 1.5 7b Chat (AWQ)
		Sqlcoder 7b 2
		Starling LM 7B beta
		Tinyllama 1.1b chat v1.0
		UNA CYBERTRON 7B V2 (BF16)
		Zephyr 7B Beta (AWQ)
Juntos		LLAMA 3.2 11B INSTRUCTO DE VISIÓN	Gratis para 2024
Adherirse	20 solicitudes/min 1,000 solicitudes/mes	Comando-R	Límite compartido
Adherirse	20 solicitudes/min 1,000 solicitudes/mes	Comando-R+	Límite compartido
Google Cloud Vertex AI	Verificación de pago muy estricta para Google Cloud.	LLAMA 3.1 70B INSTRUCT	Llama 3.1 Servicio API GRATIS durante la vista previa. 60 solicitudes/minuto
		LLAMA 3.1 8B INSTRUCT	Llama 3.1 Servicio API GRATIS durante la vista previa. 60 solicitudes/minuto
		LLAMA 3.2 90B VISION INSTRUCT	LLAMA 3.2 Servicio API gratis durante la vista previa. 30 solicitudes/minuto
		Géminis Flash Experimental	Modelo experimental de Géminis. 10 solicitudes/minuto
		Gemini Pro Experimental	Modelo experimental de Géminis. 10 solicitudes/minuto
glhf.chat (beta gratis)	Correo electrónico para el acceso a la API	Cualquier modelo en la cara abrazada ejecutable en VLLM y se ajusta en un nodo A100 (~ 640GB VRAM), incluido LLAMA 3.1 405B en FP8

Proveedores con créditos de prueba

Proveedor	Créditos	Requisitos	Modelos
Juntos	$ 5		Varios modelos abiertos
Fuegos artificiales	$ 1		Varios modelos abiertos
Unificar	$ 10 (+$ 40 para entrar en contacto)		Rutas a otros proveedores, varios modelos abiertos y modelos patentados (OpenAi, Géminis, antrópico, Mistral, Perpleidad, etc.)
Profundo	$ 1.80		Varios modelos abiertos
Nvidia nim	1,000 API llamadas para 1 mes		Varios modelos abiertos
AI21	$ 10 por 3 meses		Jamba/Jurrasic-2
Nube de PNL	$ 15	Verificación del número de teléfono	Varios modelos abiertos
Altanero	$ 10 por 3 meses		Solar Pro/Mini
Base	$ 30		Cualquier modelo compatible - Pague por tiempo de cómputo
xai	$ 25/mes hasta el final de 2024		Acumular
Hiperbólico	$ 10		Deepseek v2.5
			Hermes 3 Llama 3.1 70b
			LLAMA 3 70B INSTRUCT
			LLAMA 3.1 405B Base
			Llama 3.1 Base 405B (FP8)
			LLAMA 3.1 405B INSTRUCT
			LLAMA 3.1 70B INSTRUCT
			LLAMA 3.1 8B INSTRUCT
			Llama 3.2 3B instruir
			Pixtral 12B (2409)
			QWEN QWQ 32B Vista previa
			QWEN2-VL 72B instructo
			Qwen2-vl 7b instructo
			Qwen2.5 72b instrucciones
			QWEN2.5 Coder 32B instruct

Expandir

Información adicional

Versión 1.0.0
Tipo Otro código fuente
Fecha de actualización 2025-02-26
tamaño 42.18KB
Proviene de Github

Aplicaciones relacionadas

TensorRT LLM

2024-11-10
Descargas MP3 gratuitas

2024-11-09
EMIT Data Resources

2024-11-09
Free Snap Tap

2024-11-06
BSP Player Gratis

2009-06-04
EsencialPIM Gratis

2009-06-02

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Otro código fuente

1.0.0
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Otro código fuente

1.0.0

Información relacionada Todo