free llm api resources
1.0.0
這列出了各種服務,可為基於API的LLM使用提供免費訪問或積分。
筆記
請不要濫用這些服務,否則我們可能會失去它們。
警告
此列表明確排除了任何不合法的服務(例如,逆向工程師現有聊天機器人)
| 提供者 | 提供商限制/註釋 | 模型名稱 | 模型限制 |
|---|---|---|---|
| 谷 | Distil Whisper大V3 | 7,200秒/分鐘 每天2,000個請求 | |
| Gemma 2 9b指示 | 每天14,400個請求 15,000個令牌/分鐘 | ||
| Gemma 7b指令 | 每天14,400個請求 15,000個令牌/分鐘 | ||
| llava 1.5 7b | 每天14,400個請求 30,000個令牌/分鐘 | ||
| 駱駝3 70B | 每天14,400個請求 6,000令牌/分鐘 | ||
| Llama 3 70b -GROQ工具使用預覽 | 每天14,400個請求 15,000個令牌/分鐘 | ||
| 駱駝3 8b | 每天14,400個請求 30,000個令牌/分鐘 | ||
| Llama 3 8b -GROQ工具使用預覽 | 每天14,400個請求 15,000個令牌/分鐘 | ||
| 駱駝3.1 70b | 每天14,400個請求 6,000令牌/分鐘 | ||
| 美洲駝3.1 8b | 每天14,400個請求 20,000令牌/分鐘 | ||
| Llama 3.2 11B視覺 | 每天7,000個請求 7,000令牌/分鐘 | ||
| 美洲駝3.2 1b | 每天7,000個請求 7,000令牌/分鐘 | ||
| 駱駝3.2 3b | 每天7,000個請求 7,000令牌/分鐘 | ||
| Llama 3.2 90B視覺 | 每天3,500個請求 7,000令牌/分鐘 | ||
| Llama Guard 3 8b | 每天14,400個請求 15,000個令牌/分鐘 | ||
| 混合8x7b | 每天14,400個請求 5,000個令牌/分鐘 | ||
| 耳語大V3 | 7,200秒/分鐘 每天2,000個請求 | ||
| 耳語大V3渦輪增壓 | 7,200秒/分鐘 每天2,000個請求 | ||
| OpenRouter | 20個請求/分鐘 每天200個請求 | Gemma 2 9b指示 | |
| 愛馬仕3 Llama 3.1 405b | |||
| 液體LFM 40B | |||
| Llama 3 8b指示 | |||
| Llama 3.1 405b指示 | |||
| Llama 3.1 70B指示 | |||
| Llama 3.1 8B指示 | |||
| Llama 3.2 11B視覺指示 | |||
| Llama 3.2 1B指示 | |||
| Llama 3.2 3B指示 | |||
| 駱駝3.2 90B視覺指示 | |||
| Mistral 7b指示 | |||
| Mythomax L2 13B | |||
| OpenChat 7b | |||
| PHI-3中128K指令 | |||
| PHI-3 MINI 128K指令 | |||
| QWEN 2 7B指示 | |||
| TOPPY M 7B | |||
| Zephyr 7b Beta | |||
| Google AI Studio | 數據用於培訓(在英國/CH/EEA/EU以外使用時)。 | 雙子座1.5閃存 | 1,000,000令牌/分鐘 每天1,500個請求 15個請求/分鐘 |
| 雙子座1.5閃存(實驗) | 1,000,000令牌/分鐘 每天1,500個請求 5個請求/分鐘 | ||
| 雙子座1.5 Flash-8b | 1,000,000令牌/分鐘 每天1,500個請求 15個請求/分鐘 | ||
| 雙子座1.5 Flash-8b(實驗) | 1,000,000令牌/分鐘 每天1,500個請求 15個請求/分鐘 | ||
| 雙子座1.5 Pro | 32,000令牌/分鐘 50個請求/天 2個請求/分鐘 | ||
| 雙子座1.5 Pro(實驗) | 1,000,000令牌/分鐘 50個請求/天 2個請求/分鐘 | ||
| 雙子座1.0 Pro | 32,000令牌/分鐘 每天1,500個請求 15個請求/分鐘 | ||
| 文字插入-004 | 150批次請求/分鐘 1,500個請求/分鐘 100個內容/批次 | ||
| 嵌入001 | |||
| Lambda Labs(免費預覽) | 需要信用卡驗證。 | 愛馬仕3 405B | |
| 愛馬仕3 70B | |||
| 愛馬仕3 8b | |||
| 液體LFM 40B | |||
| Llama 3.1 405b指示(FP8) | |||
| Llama 3.1 70b指示(FP8) | |||
| Llama 3.1 8B指示 | |||
| Llama 3.1 Nemotron 70B指示 | |||
| Llama 3.2 3B指示 | |||
| QWEN2.5編碼器32B指示 | |||
| Mistral(La Plateforme) | 自由層(實驗計劃)需要選擇數據培訓,需要電話號碼驗證。 | 開放且專有的Mistral模型 | 1請求/第二 500,000令牌/分鐘 每月1,000,000個令牌 |
| Mistral(Codestral) | 目前免費使用的是基於每月訂閱的,需要電話號碼驗證。 | Codestral | 30個請求/分鐘 每天2,000個請求 |
| 擁抱面無服務器推理 | 僅限於小於10GB的型號。 即使超過10GB,一些受歡迎的模型也得到了支持。 | 各種開放型號 | 每天1,000個請求(帶有帳戶) |
| Sambanova雲 | 駱駝3.1 405b | 10個請求/分鐘 | |
| 美洲駝3.2 90b | 1請求/分鐘 | ||
| 駱駝3.1 70b | 20個請求/分鐘 | ||
| 美洲駝3.2 11b | 10個請求/分鐘 | ||
| 美洲駝3.1 8b | 30個請求/分鐘 | ||
| 駱駝3.2 3b | 30個請求/分鐘 | ||
| 美洲駝3.2 1b | 30個請求/分鐘 | ||
| 腦 | 候補名單 自由層僅限於8K上下文 | 美洲駝3.1 8b | 30個請求/分鐘 60,000令牌/分鐘 900/小時的請求 1,000,000個令牌/小時 每天14,400個請求 每天1,000,000個令牌 |
| 駱駝3.1 70b | 30個請求/分鐘 60,000令牌/分鐘 900/小時的請求 1,000,000個令牌/小時 每天14,400個請求 每天1,000,000個令牌 | ||
| GitHub模型 | 候補名單 速率限制取決於副本訂閱層 | AI21-JAMBA教學 | |
| cohere命令r | |||
| cohere命令r+ | |||
| cohere嵌入V3英語 | |||
| 共嵌入V3多語言 | |||
| meta-llama-3-70B教學 | |||
| meta-llama-3-8b教學 | |||
| meta-llama-3.1-405b-thrinct | |||
| meta-llama-3.1-70B教學 | |||
| meta-llama-3.1-8B教學 | |||
| Mistral大 | |||
| Mistral大(2407) | |||
| Mistral Nemo | |||
| 小小的 | |||
| Openai GPT-4O | |||
| Openai GPT-4O Mini | |||
| Openai文本嵌入3(大) | |||
| Openai文本嵌入3(小) | |||
| PHI-3中心指導(128K) | |||
| PHI-3中心指導(4K) | |||
| PHI-3-MINI指示(128K) | |||
| PHI-3-MINI指示(4K) | |||
| Phi-3-small指示(128K) | |||
| Phi-3-small指示(8K) | |||
| PHI-3.5-MINI指示(128K) | |||
| OVH AI端點(免費beta) | Codellama 13B指令 | 12個請求/分鐘 | |
| Codestral Mamba 7B V0.1 | 12個請求/分鐘 | ||
| 駱駝2 13B聊天 | 12個請求/分鐘 | ||
| Llama 3 70b指示 | 12個請求/分鐘 | ||
| Llama 3 8b指示 | 12個請求/分鐘 | ||
| Llama 3.1 70B指示 | 12個請求/分鐘 | ||
| Mathstral 7b V0.1 | 12個請求/分鐘 | ||
| Mistral 7b指示 | 12個請求/分鐘 | ||
| Mistral Nemo 2407 | 12個請求/分鐘 | ||
| 混音8x22b指令 | 12個請求/分鐘 | ||
| 混音8x7b指令 | 12個請求/分鐘 | ||
| Cloudflare工人AI | 10,000個令牌/天 | DeepSeek編碼器6.7b基礎(AWQ) | |
| DeepSeek編碼器6.7b指示(AWQ) | |||
| DeepSeek數學7B指示 | |||
| Discolm German 7b V1(AWQ) | |||
| FALCOM 7B指示 | |||
| Gemma 2B指示(Lora) | |||
| Gemma 7b指令 | |||
| Gemma 7b指示(Lora) | |||
| 愛馬仕2 Pro Mistral 7b | |||
| Llama 2 13b聊天(AWQ) | |||
| Llama 2 7b聊天(FP16) | |||
| Llama 2 7b聊天(INT8) | |||
| Llama 2 7b聊天(Lora) | |||
| Llama 3 8b指示 | |||
| Llama 3 8b指示 | |||
| Llama 3 8b指示(AWQ) | |||
| Llama 3.1 8B指示 | |||
| Llama 3.1 8b指示(AWQ) | |||
| Llama 3.1 8b指示(FP8) | |||
| Llama 3.2 11B視覺指示 | |||
| Llama 3.2 1B指示 | |||
| Llama 3.2 3B指示 | |||
| Llamaguard 7b(AWQ) | |||
| MISTRAL 7B指示V0.1 | |||
| MISTRAL 7B指示V0.1(AWQ) | |||
| MISTRAL 7B指示V0.2 | |||
| MISTRAL 7B指示V0.2(Lora) | |||
| 神經聊天7b v3.1(AWQ) | |||
| OpenChat 3.5 0106 | |||
| OpenHermes 2.5 Mistral 7b(AWQ) | |||
| PHI-2 | |||
| QWEN 1.5 0.5B聊天 | |||
| QWEN 1.5 1.8B聊天 | |||
| QWEN 1.5 14B聊天(AWQ) | |||
| QWEN 1.5 7b聊天(AWQ) | |||
| SQLCODER 7B 2 | |||
| Starling LM 7B Beta | |||
| Tinyllama 1.1B聊天v1.0 | |||
| UNA Cybertron 7b V2(BF16) | |||
| Zephyr 7b Beta(AWQ) | |||
| 一起 | Llama 3.2 11B視覺指示 | 2024年免費 | |
| 共同 | 20個請求/分鐘 每月1,000個請求 | 命令r | 共享限制 |
| 命令r+ | |||
| Google Cloud Vertex AI | Google Cloud的付款驗證非常嚴格。 | Llama 3.1 70B指示 | Llama 3.1 API服務在預覽期間免費。 60個請求/分鐘 |
| Llama 3.1 8B指示 | Llama 3.1 API服務在預覽期間免費。 60個請求/分鐘 | ||
| 駱駝3.2 90B視覺指示 | Llama 3.2 API服務在預覽期間免費。 30個請求/分鐘 | ||
| 雙子座閃光燈實驗 | 實驗雙子座模型。 10個請求/分鐘 | ||
| 雙子座實驗 | |||
| glhf.chat(免費beta) | 電子郵件for API訪問 | 任何關於在VLLM上運行的型號的模型,並適合A100節點(〜640GB VRAM),包括Llama 3.1 405B在FP8時 |
| 提供者 | 學分 | 要求 | 型號 |
|---|---|---|---|
| 一起 | $ 5 | 各種開放型號 | |
| 煙火 | $ 1 | 各種開放型號 | |
| 統一 | $ 10(+40美元的聯繫) | 通往其他提供商的路線,各種開放模型和專有模型(OpenAI,Gemini,人類,Mistral,Clelplexity等) | |
| Deepinfra | $ 1.80 | 各種開放型號 | |
| NVIDIA NIM | 1,000個API電話1個月 | 各種開放型號 | |
| AI21 | 3個月$ 10 | jamba/jurrasic-2 | |
| NLP雲 | $ 15 | 電話號碼驗證 | 各種開放型號 |
| 上升 | 3個月$ 10 | 太陽能專業/迷你 | |
| 貝特尼 | $ 30 | 任何支持的模型 - 按計算時間付款 | |
| xai | $ 25/月,直到2024年底 | 格羅克 | |
| 雙曲線 | $ 10 | DeepSeek v2.5 | |
| 愛馬仕3駱駝3.1 70b | |||
| Llama 3 70b指示 | |||
| Llama 3.1 405B基地 | |||
| Llama 3.1 405b基地(FP8) | |||
| Llama 3.1 405b指示 | |||
| Llama 3.1 70B指示 | |||
| Llama 3.1 8B指示 | |||
| Llama 3.2 3B指示 | |||
| Pixtral 12b(2409) | |||
| QWEN QWQ 32B預覽 | |||
| QWEN2-VL 72B指令 | |||
| QWEN2-VL 7B指令 | |||
| QWEN2.5 72B指令 | |||
| QWEN2.5編碼器32B指示 |