free llm api resources herunterladen - free llm api resources herunterladen

free llm api resources

Anderer Quellcode

1.0.0

Herunterladen

Kostenlose LLM -API -Ressourcen

Dies listet verschiedene Dienste auf, die freien Zugriff oder Credits zur API-basierten LLM-Nutzung bieten.

Notiz

Bitte missbrauchen diese Dienste nicht, sonst könnten wir sie verlieren.

Warnung

Diese Liste schließt explizit alle nicht legitimen Dienste aus (z. B. umgekehrte Ingenieure eines vorhandenen Chatbots).

Freie Anbieter

Anbieter	Anbieterlimits/Notizen	Modellname	Modellgrenzen
Groq		Distil Whisper großes V3	7.200 Audiosekunden/Minute 2.000 Anfragen/Tag
		Gemma 2 9b unterrichten	14.400 Anfragen/Tag 15.000 Token/Minute
		Gemma 7b -Anweisung	14.400 Anfragen/Tag 15.000 Token/Minute
		Llava 1.5 7b	14.400 Anfragen/Tag 30.000 Token/Minute
		Lama 3 70b	14.400 Anfragen/Tag 6.000 Token/Minute
		LAMA 3 70B - GROQ -Tool verwenden Vorschau	14.400 Anfragen/Tag 15.000 Token/Minute
		Lama 3 8b	14.400 Anfragen/Tag 30.000 Token/Minute
		LAMA 3 8B - GROQ -Tool verwenden Vorschau	14.400 Anfragen/Tag 15.000 Token/Minute
		Lama 3.1 70b	14.400 Anfragen/Tag 6.000 Token/Minute
		Lama 3.1 8b	14.400 Anfragen/Tag 20.000 Token/Minute
		Lama 3.2 11b Vision	7.000 Anfragen/Tag 7.000 Token/Minute
		Lama 3.2 1b	7.000 Anfragen/Tag 7.000 Token/Minute
		Lama 3.2 3b	7.000 Anfragen/Tag 7.000 Token/Minute
		Lama 3.2 90b Vision	3.500 Anfragen/Tag 7.000 Token/Minute
		Lama Guard 3 8b	14.400 Anfragen/Tag 15.000 Token/Minute
		Mixtral 8x7b	14.400 Anfragen/Tag 5.000 Token/Minute
		Flüster groß v3	7.200 Audiosekunden/Minute 2.000 Anfragen/Tag
		Flüster großer v3 Turbo	7.200 Audiosekunden/Minute 2.000 Anfragen/Tag
OpenRouter	20 Anfragen/Minute 200 Anfragen/Tag	Gemma 2 9b unterrichten
		Hermes 3 Lama 3.1 405b
		Flüssiges LFM 40b
		Lama 3 8b anweisen
		LAMA 3.1 405B Anweisung
		LAMA 3.1 70B Anweisung
		Lama 3.1 8B Anweisung
		Lama 3.2 11b Vision Anweisungen
		Lama 3.2 1B Anweisung
		Lama 3.2 3b anweisen
		Lama 3.2 90b Vision Anweisung
		Mistral 7B -Anweisung
		Mythomax L2 13b
		OpenChat 7b
		PHI-3-Medium 128k anweisen
		PHI-3-Mini 128k anweisen
		Qwen 2 7b anweisen
		Toppy M 7b
		Zephyr 7b Beta
Google AI Studio	Daten werden für das Training verwendet (wenn sie außerhalb des Vereinigten Königreichs/CH/EWR/EU verwendet werden).	Gemini 1.5 Blitz	1.000.000 Token/Minute 1.500 Anfragen/Tag 15 Anfragen/Minute
		Gemini 1.5 Flash (experimentell)	1.000.000 Token/Minute 1.500 Anfragen/Tag 5 Anfragen/Minute
		Gemini 1.5 Flash-8b	1.000.000 Token/Minute 1.500 Anfragen/Tag 15 Anfragen/Minute
		Gemini 1.5 Flash-8b (experimentell)	1.000.000 Token/Minute 1.500 Anfragen/Tag 15 Anfragen/Minute
		Gemini 1.5 Pro	32.000 Token/Minute 50 Anfragen/Tag 2 Anfragen/Minute
		Gemini 1.5 Pro (experimentell)	1.000.000 Token/Minute 50 Anfragen/Tag 2 Anfragen/Minute
		Gemini 1.0 Pro	32.000 Token/Minute 1.500 Anfragen/Tag 15 Anfragen/Minute
		Text-Embedding-004	150 Batch -Anfragen/Minute 1.500 Anfragen/Minute 100 Inhalt/Charge
		Einbettung-001
Lambda Labs (kostenlose Vorschau)	Erfordert Kreditkartenüberprüfung.	Hermes 3 405b
		Hermes 3 70b
		Hermes 3 8b
		Flüssiges LFM 40b
		LAMA 3.1 405B Anweisung (FP8)
		LAMA 3.1 70B Anweisung (FP8)
		Lama 3.1 8B Anweisung
		Lama 3.1 Nemotron 70B Unterricht
		Lama 3.2 3b anweisen
		QWEN2.5 Codierer 32B Anweisungen
Mistral (La Plateforme)	Für die kostenlose Stufe (Experimentplan) muss sich die Überprüfung der Telefonnummern zur Telefonnummer einsetzen.	Offene und proprietäre Mistralmodelle	1 Anfrage/Sekunde 500.000 Token/Minute 1.000.000.000 Token/Monat
Mistral (Codestral)	Derzeit kostenlos zu verwenden, monatlich abonnementbasiert, erfordert eine Überprüfung der Telefonnummer.	Codestral	30 Anfragen/Minute 2.000 Anfragen/Tag
Serienloser Umarmungserlebnis	Begrenzt auf Modelle, die kleiner als 10 GB sind. Einige beliebte Modelle werden auch dann unterstützt, wenn sie 10 GB überschreiten.	Verschiedene offene Modelle	1.000 Anfragen/Tag (mit einem Konto)
Sambanova Cloud		Lama 3.1 405b	10 Anfragen/Minute
		Lama 3.2 90b	1 Anfrage/Minute
		Lama 3.1 70b	20 Anfragen/Minute
		Lama 3.2 11b	10 Anfragen/Minute
		Lama 3.1 8b	30 Anfragen/Minute
		Lama 3.2 3b	30 Anfragen/Minute
		Lama 3.2 1b	30 Anfragen/Minute
Cerebras	Warteliste Freie Stufe, die auf 8K -Kontext beschränkt ist	Lama 3.1 8b	30 Anfragen/Minute 60.000 Token/Minute 900 Anfragen/Stunde 1.000.000 Token/Stunde 14.400 Anfragen/Tag 1.000.000 Token/Tag
Cerebras	Warteliste Freie Stufe, die auf 8K -Kontext beschränkt ist	Lama 3.1 70b	30 Anfragen/Minute 60.000 Token/Minute 900 Anfragen/Stunde 1.000.000 Token/Stunde 14.400 Anfragen/Tag 1.000.000 Token/Tag
Github -Modelle	Warteliste Ratenlimits abhängig von der Abonnementstufe Copilot	AI21-JAMBA-ISTRUCT
		Cohere Command r
		Cohere -Befehl r+
		Cohere -Embett V3 Englisch
		Cohere -Embed V3 Mehrsprachiger
		Meta-llama-3-70b-struktur
		Meta-llama-3-8b-instruct
		Meta-llama-3.1-405b-instruct
		Meta-llama-3.1-70b-struktur
		Meta-llama-3.1-8b-struktur
		Mistral Large
		Mistral Large (2407)
		Mistral Nemo
		Mistral Small
		OpenAI GPT-4O
		OpenAI GPT-4O Mini
		Openai Text einbettet 3 (groß)
		Openai Text einbettet 3 (klein)
		PHI-3-MEDIUM-Anweisungen (128K)
		PHI-3-MEDIUM-Anweisung (4K)
		PHi-3-mini-Anweisungen (128K)
		Phi-3-Mini-Anweisungen (4K)
		PHI-3-Small-Anweisungen (128K)
		PHI-3-Small-Anweisungen (8K)
		PHi-3,5-mini-Anweisungen (128K)
OVH AI -Endpunkte (freie Beta)		CODELLAMA 13B BESTURT	12 Anfragen/Minute
		Codestral Mamba 7b v0.1	12 Anfragen/Minute
		Lama 2 13b Chat	12 Anfragen/Minute
		LAMA 3 70B Anweisungen	12 Anfragen/Minute
		Lama 3 8b anweisen	12 Anfragen/Minute
		LAMA 3.1 70B Anweisung	12 Anfragen/Minute
		Mathstral 7b v0.1	12 Anfragen/Minute
		Mistral 7B -Anweisung	12 Anfragen/Minute
		Mistral Nemo 2407	12 Anfragen/Minute
		MIMTRAL 8X22B BESTURT	12 Anfragen/Minute
		MIXTRAL 8X7B BESTURT	12 Anfragen/Minute
Cloudflare Workers AI	10.000 Token/Tag	Deepseek Codierer 6.7b Base (AWQ)
		Deepseek Codierer 6.7b Anweisung (AWQ)
		Deepseek Math 7b unterrichtet
		Verfärbter Deutsch 7B V1 (AWQ)
		Falcom 7b -Anweisung
		Gemma 2b -Anweisungen (Lora)
		Gemma 7b -Anweisung
		Gemma 7b -Anweisungen (Lora)
		Hermes 2 Pro Mistral 7b
		Lama 2 13b Chat (AWQ)
		Lama 2 7b Chat (FP16)
		Lama 2 7b Chat (int8)
		Lama 2 7b Chat (Lora)
		Lama 3 8b anweisen
		Lama 3 8b anweisen
		LAMA 3 8B Anweisung (AWQ)
		Lama 3.1 8B Anweisung
		LAMA 3.1 8B Anweisung (AWQ)
		LAMA 3.1 8B Anweisung (FP8)
		Lama 3.2 11b Vision Anweisungen
		Lama 3.2 1B Anweisung
		Lama 3.2 3b anweisen
		Llamaguard 7b (awq)
		Mistral 7b unterrichtet v0.1
		Mistral 7b unterrichtet v0.1 (AWQ)
		Mistral 7b unterrichtet v0.2
		Mistral 7b unterrichtet v0.2 (Lora)
		Neural Chat 7b v3.1 (AWQ)
		OpenChat 3.5 0106
		Openhermes 2.5 Mistral 7B (AWQ)
		Phi-2
		Qwen 1,5 0,5B Chat
		Qwen 1.5 1.8b Chat
		Qwen 1.5 14b Chat (AWQ)
		QWEN 1.5 7B CHAT (AWQ)
		SQLCODER 7B 2
		Starling LM 7B Beta
		Tinyllama 1.1b Chat v1.0
		UNA Cybertron 7b V2 (BF16)
		Zephyr 7b Beta (AWQ)
Zusammen		Lama 3.2 11b Vision Anweisungen	Kostenlos für 2024
Zusammenhängen	20 Anfragen/min 1.000 Anfragen/Monat	Kommando-R	Gemeinsame Grenze
Zusammenhängen	20 Anfragen/min 1.000 Anfragen/Monat	Kommando-R+	Gemeinsame Grenze
Google Cloud -Scheitelpunkt AI	Sehr strenge Zahlungsüberprüfung für Google Cloud.	LAMA 3.1 70B Anweisung	LAMA 3.1 API -Service kostenlos während der Vorschau. 60 Anfragen/Minute
		Lama 3.1 8B Anweisung	LAMA 3.1 API -Service kostenlos während der Vorschau. 60 Anfragen/Minute
		Lama 3.2 90b Vision Anweisung	LAMA 3.2 API -Service kostenlos während der Vorschau. 30 Anfragen/Minute
		Gemini Flash Experimental	Experimentelles Gemini -Modell. 10 Anfragen/Minute
		Gemini Pro Experimental	Experimentelles Gemini -Modell. 10 Anfragen/Minute
GLHF.Chat (kostenlose Beta)	E -Mail für den API -Zugriff	Jedes Modell für umarmtes Gesicht, das auf VLLM läuft und auf einen A100 -Knoten (~ 640 GB VRAM) passt, einschließlich Lama 3.1 405B bei FP8

Anbieter mit Testkrediten

Anbieter	Credits	Anforderungen	Modelle
Zusammen	$ 5		Verschiedene offene Modelle
Feuerwerk	$ 1		Verschiedene offene Modelle
Vereinheitlichen	$ 10 (+40 USD für den Kontakt)		Routen zu anderen Anbietern, verschiedenen offenen Modellen und proprietären Modellen (OpenAI, Gemini, Anthropic, Mistral, Verwirrung usw.)
Deepinfra	$ 1,80		Verschiedene offene Modelle
Nvidia nim	1.000 API fordert 1 Monat		Verschiedene offene Modelle
AI21	10 Dollar für 3 Monate		Jamba/Jurrac-2
NLP Cloud	$ 15	Telefonnummer -Überprüfung	Verschiedene offene Modelle
Upstage	10 Dollar für 3 Monate		Solar Pro/Mini
Basis	$ 30		Jedes unterstütztes Modell - Zahlen Sie nach Berechnung Zeit
xai	$ 25/Monat bis Ende 2024		Gruben
Hyperbolisch	$ 10		Deepseek v2.5
			Hermes 3 Lama 3.1 70b
			LAMA 3 70B Anweisungen
			Lama 3.1 405b Basis
			Lama 3.1 405b Basis (FP8)
			LAMA 3.1 405B Anweisung
			LAMA 3.1 70B Anweisung
			Lama 3.1 8B Anweisung
			Lama 3.2 3b anweisen
			Pixtral 12b (2409)
			QWEN QWQ 32B Vorschau
			QWEN2-VL 72B-Anweisung
			QWEN2-VL 7B-Anweisung
			Qwen2.5 72B Anweisung
			QWEN2.5 Codierer 32B Anweisungen