free llm api resources
1.0.0
これには、APIベースのLLM使用に対する無料アクセスまたはクレジットを提供するさまざまなサービスがリストされています。
注記
これらのサービスを悪用しないでください。そうでなければ、私たちはそれらを失うかもしれません。
警告
このリストは、正当ではないサービスを明示的に除外します(例:既存のチャットボットをリバースエンジニアリング)
| プロバイダー | プロバイダーの制限/ノート | モデル名 | モデル制限 |
|---|---|---|---|
| groq | ささやき大きなV3を蒸留します | 7,200オーディオ秒/分 1日2,000リクエスト | |
| Gemma 2 9b指示 | 1日/1日のリクエスト 15,000トークン/分 | ||
| Gemma 7b指示 | 1日/1日のリクエスト 15,000トークン/分 | ||
| llava 1.5 7b | 1日/1日のリクエスト 30,000トークン/分 | ||
| llama 3 70b | 1日/1日のリクエスト 6,000トークン/分 | ||
| llama 3 70b -groqツールのプレビューを使用します | 1日/1日のリクエスト 15,000トークン/分 | ||
| llama 3 8b | 1日/1日のリクエスト 30,000トークン/分 | ||
| llama 3 8b -groqツールのプレビューを使用します | 1日/1日のリクエスト 15,000トークン/分 | ||
| llama 3.1 70b | 1日/1日のリクエスト 6,000トークン/分 | ||
| llama 3.1 8b | 1日/1日のリクエスト 20,000トークン/分 | ||
| llama 3.2 11bビジョン | 1日あたり7,000リクエスト 7,000トークン/分 | ||
| llama 3.2 1b | 1日あたり7,000リクエスト 7,000トークン/分 | ||
| llama 3.2 3b | 1日あたり7,000リクエスト 7,000トークン/分 | ||
| llama 3.2 90bビジョン | 3,500リクエスト/日 7,000トークン/分 | ||
| ラマガード3 8b | 1日/1日のリクエスト 15,000トークン/分 | ||
| Mixtral 8x7b | 1日/1日のリクエスト 5,000トークン/分 | ||
| 大きなV3をささやきます | 7,200オーディオ秒/分 1日2,000リクエスト | ||
| 大きなV3ターボをささやきます | 7,200オーディオ秒/分 1日2,000リクエスト | ||
| OpenRouter | 20リクエスト/分 200のリクエスト/日 | Gemma 2 9b指示 | |
| エルメス3ラマ3.1 405b | |||
| 液体LFM 40b | |||
| llama 3 8b指示 | |||
| llama 3.1 405b指示 | |||
| llama 3.1 70b指示 | |||
| llama 3.1 8b指示 | |||
| llama 3.2 11bビジョン指示 | |||
| llama 3.2 1b指示 | |||
| llama 3.2 3b指示 | |||
| llama 3.2 90bビジョン指示 | |||
| ミストラル7b指示 | |||
| Mythomax L2 13b | |||
| OpenChat 7b | |||
| PHI-3培地128K指示 | |||
| PHI-3 MINI 128K指示 | |||
| Qwen 2 7b指示 | |||
| トッピーM 7b | |||
| Zephyr 7bベータ | |||
| Google AI Studio | データはトレーニングに使用されます(英国/CH/EEA/EU以外で使用する場合)。 | ジェミニ1.5フラッシュ | 1,000,000トークン/分 1日1,500のリクエスト 15リクエスト/分 |
| ジェミニ1.5フラッシュ(実験的) | 1,000,000トークン/分 1日1,500のリクエスト 5つのリクエスト/分 | ||
| ジェミニ1.5フラッシュ-8B | 1,000,000トークン/分 1日1,500のリクエスト 15リクエスト/分 | ||
| Gemini 1.5 Flash-8B(実験) | 1,000,000トークン/分 1日1,500のリクエスト 15リクエスト/分 | ||
| Gemini 1.5 Pro | 32,000トークン/分 50リクエスト/日 2つのリクエスト/分 | ||
| Gemini 1.5 Pro(実験的) | 1,000,000トークン/分 50リクエスト/日 2つのリクエスト/分 | ||
| Gemini 1.0 Pro | 32,000トークン/分 1日1,500のリクエスト 15リクエスト/分 | ||
| Text-embedding-004 | 150バッチリクエスト/分 1,500リクエスト/分 100コンテンツ/バッチ | ||
| 埋め込み-001 | |||
| ラムダラボ(無料プレビュー) | クレジットカードの確認が必要です。 | エルメス3 405b | |
| エルメス3 70b | |||
| エルメス3 8b | |||
| 液体LFM 40b | |||
| llama 3.1 405b指示(fp8) | |||
| llama 3.1 70b指示(fp8) | |||
| llama 3.1 8b指示 | |||
| Llama 3.1 Nemotron 70b指示 | |||
| llama 3.2 3b指示 | |||
| QWEN2.5コーダー32B指示 | |||
| ミストラル(ラプレートフォーム) | 無料ティア(実験計画)では、データトレーニングを選択する必要があり、電話番号の確認が必要です。 | オープンで独自のミストラルモデル | 1リクエスト/秒 500,000トークン/分 1,000,000,000トークン/月 |
| ミストラル(コードストラル) | 現在、毎月のサブスクリプションベースであるため、電話番号の確認が必要です。 | コードストラル | 30リクエスト/分 1日2,000リクエスト |
| サーバーレスの推論を抱きしめます | 10GB未満のモデルに限定されています。 一部の一般的なモデルは、10GBを超えてもサポートされています。 | さまざまなオープンモデル | 1日/日(アカウント付き)リクエスト |
| Sambanova Cloud | llama 3.1 405b | 10個のリクエスト/分 | |
| llama 3.2 90b | 1リクエスト/分 | ||
| llama 3.1 70b | 20リクエスト/分 | ||
| llama 3.2 11b | 10個のリクエスト/分 | ||
| llama 3.1 8b | 30リクエスト/分 | ||
| llama 3.2 3b | 30リクエスト/分 | ||
| llama 3.2 1b | 30リクエスト/分 | ||
| セレブラス | waitlist 8Kコンテキストに制限されたフリーティア | llama 3.1 8b | 30リクエスト/分 60,000トークン/分 900リクエスト/時間 1,000,000トークン/時間 1日/1日のリクエスト 1,000,000トークン/日 |
| llama 3.1 70b | 30リクエスト/分 60,000トークン/分 900リクエスト/時間 1,000,000トークン/時間 1日/1日のリクエスト 1,000,000トークン/日 | ||
| GitHubモデル | waitlist Copilotサブスクリプション層に依存するレート制限 | AI21-JAMBA-Instruct | |
| コリーコマンドr | |||
| Cohere Command R+ | |||
| 埋め込まれたV3英語を埋め込みます | |||
| 埋め込まれたv3多言語 | |||
| メタラマ-3-70b-instruct | |||
| メタラマ-3-8B-Instruct | |||
| メタラマ-3.1-405B-Instruct | |||
| メタラマ-3.1-70b-instruct | |||
| メタラマ-3.1-8b-instruct | |||
| ミストラル大 | |||
| ミストラルラージ(2407) | |||
| ミストラルネモ | |||
| ミストラルスモール | |||
| Openai GPT-4O | |||
| Openai GPT-4O MINI | |||
| openaiテキスト埋め込み3(大) | |||
| openaiテキスト埋め込み3(小) | |||
| phi-3-medium instruction(128k) | |||
| Phi-3-medium instruction(4k) | |||
| phi-3-mini指示(128k) | |||
| phi-3-mini指示(4k) | |||
| phi-3-Small指示(128K) | |||
| phi-3-Small指示(8K) | |||
| Phi-3.5-mini指示(128k) | |||
| OVH AIエンドポイント(無料ベータ) | Codellama 13b指示 | 12のリクエスト/分 | |
| Codestral Mamba 7b V0.1 | 12のリクエスト/分 | ||
| llama 2 13bチャット | 12のリクエスト/分 | ||
| llama 3 70b指示 | 12のリクエスト/分 | ||
| llama 3 8b指示 | 12のリクエスト/分 | ||
| llama 3.1 70b指示 | 12のリクエスト/分 | ||
| Mathstral 7b V0.1 | 12のリクエスト/分 | ||
| ミストラル7b指示 | 12のリクエスト/分 | ||
| ミストラルNEMO 2407 | 12のリクエスト/分 | ||
| Mixtral 8x22b指示 | 12のリクエスト/分 | ||
| Mixtral 8x7b指示 | 12のリクエスト/分 | ||
| CloudFlareワーカーAI | 10,000トークン/日 | Deepseek Coder 6.7bベース(AWQ) | |
| Deepseek Coder 6.7b指示(AWQ) | |||
| deepseek数学7b指示 | |||
| 滑走液ドイツ人7b v1(awq) | |||
| Falcom 7b指示 | |||
| Gemma 2b instruct(lora) | |||
| Gemma 7b指示 | |||
| Gemma 7b instruct(lora) | |||
| Hermes 2 Pro Mistral 7b | |||
| llama 2 13bチャット(AWQ) | |||
| llama 2 7bチャット(fp16) | |||
| llama 2 7bチャット(int8) | |||
| llama 2 7bチャット(lora) | |||
| llama 3 8b指示 | |||
| llama 3 8b指示 | |||
| llama 3 8b instruct(awq) | |||
| llama 3.1 8b指示 | |||
| llama 3.1 8b instruct(awq) | |||
| llama 3.1 8b指示(fp8) | |||
| llama 3.2 11bビジョン指示 | |||
| llama 3.2 1b指示 | |||
| llama 3.2 3b指示 | |||
| Llamaguard 7b(AWQ) | |||
| Mistral 7b指示v0.1 | |||
| ミストラル7b指示v0.1(awq) | |||
| Mistral 7b指示v0.2 | |||
| ミストラル7b指示v0.2(lora) | |||
| ニューラルチャット7b v3.1(AWQ) | |||
| OpenChat 3.5 0106 | |||
| OpenHermes 2.5 Mistral 7B(AWQ) | |||
| PHI-2 | |||
| Qwen 1.5 0.5bチャット | |||
| Qwen 1.5 1.8bチャット | |||
| Qwen 1.5 14bチャット(AWQ) | |||
| Qwen 1.5 7bチャット(AWQ) | |||
| SQLCoder 7B 2 | |||
| スターリングLM 7Bベータ | |||
| Tinyllama 1.1bチャットv1.0 | |||
| UNA CYBERTRON 7B V2(BF16) | |||
| Zephyr 7Bベータ(AWQ) | |||
| 一緒に | llama 3.2 11bビジョン指示 | 2024年は無料 | |
| 協力します | 20のリクエスト/分 1,000か月/月 | command-r | 共有制限 |
| command-r+ | |||
| Google Cloud Vertex AI | Googleクラウドの非常に厳しい支払い確認。 | llama 3.1 70b指示 | Llama 3.1 APIサービスはプレビュー中に無料。 60リクエスト/分 |
| llama 3.1 8b指示 | Llama 3.1 APIサービスはプレビュー中に無料。 60リクエスト/分 | ||
| llama 3.2 90bビジョン指示 | Llama 3.2 APIサービスはプレビュー中に無料。 30リクエスト/分 | ||
| ジェミニフラッシュ実験 | 実験的なジェミニモデル。 10個のリクエスト/分 | ||
| Gemini Pro Experimental | |||
| glhf.chat(無料ベータ) | APIアクセスのメール | vllmで実行可能なハグ顔面の任意のモデルは、fp8のllama 3.1 405bを含むA100ノード(〜640GB VRAM)に適合します |
| プロバイダー | クレジット | 要件 | モデル |
|---|---|---|---|
| 一緒に | 5ドル | さまざまなオープンモデル | |
| 花火 | $ 1 | さまざまなオープンモデル | |
| 統一 | $ 10(+$ 40に接触するため) | 他のプロバイダーへのルート、さまざまなオープンモデル、独自モデル(Openai、Gemini、人類、ミストラル、困惑など) | |
| deepinfra | $ 1.80 | さまざまなオープンモデル | |
| nvidia nim | 1,000個のAPIが1か月間呼び出します | さまざまなオープンモデル | |
| AI21 | 3か月間10ドル | Jamba/Jurrasic-2 | |
| NLPクラウド | 15ドル | 電話番号の確認 | さまざまなオープンモデル |
| 舞台上 | 3か月間10ドル | Solar Pro/Mini | |
| Baseten | 30ドル | サポートされているモデル - 計算時間による支払い | |
| xai | 2024年末まで月額25ドル | グロック | |
| 双曲線 | 10ドル | Deepseek v2.5 | |
| エルメス3 llama 3.1 70b | |||
| llama 3 70b指示 | |||
| llama 3.1 405bベース | |||
| llama 3.1 405bベース(FP8) | |||
| llama 3.1 405b指示 | |||
| llama 3.1 70b指示 | |||
| llama 3.1 8b指示 | |||
| llama 3.2 3b指示 | |||
| Pixtral 12b(2409) | |||
| QWEN QWQ 32Bプレビュー | |||
| QWEN2-VL 72B指示 | |||
| QWEN2-VL 7B指示 | |||
| QWEN2.5 72B指示 | |||
| QWEN2.5コーダー32B指示 |