free llm api resources
1.0.0
这列出了各种服务,可为基于API的LLM使用提供免费访问或积分。
笔记
请不要滥用这些服务,否则我们可能会失去它们。
警告
此列表明确排除了任何不合法的服务(例如,逆向工程师现有聊天机器人)
| 提供者 | 提供商限制/注释 | 模型名称 | 模型限制 |
|---|---|---|---|
| 谷 | Distil Whisper大V3 | 7,200秒/分钟 每天2,000个请求 | |
| Gemma 2 9b指示 | 每天14,400个请求 15,000个令牌/分钟 | ||
| Gemma 7b指令 | 每天14,400个请求 15,000个令牌/分钟 | ||
| llava 1.5 7b | 每天14,400个请求 30,000个令牌/分钟 | ||
| 骆驼3 70B | 每天14,400个请求 6,000令牌/分钟 | ||
| Llama 3 70b -GROQ工具使用预览 | 每天14,400个请求 15,000个令牌/分钟 | ||
| 骆驼3 8b | 每天14,400个请求 30,000个令牌/分钟 | ||
| Llama 3 8b -GROQ工具使用预览 | 每天14,400个请求 15,000个令牌/分钟 | ||
| 骆驼3.1 70b | 每天14,400个请求 6,000令牌/分钟 | ||
| 美洲驼3.1 8b | 每天14,400个请求 20,000令牌/分钟 | ||
| Llama 3.2 11B视觉 | 每天7,000个请求 7,000令牌/分钟 | ||
| 美洲驼3.2 1b | 每天7,000个请求 7,000令牌/分钟 | ||
| 骆驼3.2 3b | 每天7,000个请求 7,000令牌/分钟 | ||
| Llama 3.2 90B视觉 | 每天3,500个请求 7,000令牌/分钟 | ||
| Llama Guard 3 8b | 每天14,400个请求 15,000个令牌/分钟 | ||
| 混合8x7b | 每天14,400个请求 5,000个令牌/分钟 | ||
| 耳语大V3 | 7,200秒/分钟 每天2,000个请求 | ||
| 耳语大V3涡轮增压 | 7,200秒/分钟 每天2,000个请求 | ||
| OpenRouter | 20个请求/分钟 每天200个请求 | Gemma 2 9b指示 | |
| 爱马仕3 Llama 3.1 405b | |||
| 液体LFM 40B | |||
| Llama 3 8b指示 | |||
| Llama 3.1 405b指示 | |||
| Llama 3.1 70B指示 | |||
| Llama 3.1 8B指示 | |||
| Llama 3.2 11B视觉指示 | |||
| Llama 3.2 1B指示 | |||
| Llama 3.2 3B指示 | |||
| 骆驼3.2 90B视觉指示 | |||
| Mistral 7b指示 | |||
| Mythomax L2 13B | |||
| OpenChat 7b | |||
| PHI-3中128K指令 | |||
| PHI-3 MINI 128K指令 | |||
| QWEN 2 7B指示 | |||
| TOPPY M 7B | |||
| Zephyr 7b Beta | |||
| Google AI Studio | 数据用于培训(在英国/CH/EEA/EU以外使用时)。 | 双子座1.5闪存 | 1,000,000令牌/分钟 每天1,500个请求 15个请求/分钟 |
| 双子座1.5闪存(实验) | 1,000,000令牌/分钟 每天1,500个请求 5个请求/分钟 | ||
| 双子座1.5 Flash-8b | 1,000,000令牌/分钟 每天1,500个请求 15个请求/分钟 | ||
| 双子座1.5 Flash-8b(实验) | 1,000,000令牌/分钟 每天1,500个请求 15个请求/分钟 | ||
| 双子座1.5 Pro | 32,000令牌/分钟 50个请求/天 2个请求/分钟 | ||
| 双子座1.5 Pro(实验) | 1,000,000令牌/分钟 50个请求/天 2个请求/分钟 | ||
| 双子座1.0 Pro | 32,000令牌/分钟 每天1,500个请求 15个请求/分钟 | ||
| 文字插入-004 | 150批次请求/分钟 1,500个请求/分钟 100个内容/批次 | ||
| 嵌入001 | |||
| Lambda Labs(免费预览) | 需要信用卡验证。 | 爱马仕3 405B | |
| 爱马仕3 70B | |||
| 爱马仕3 8b | |||
| 液体LFM 40B | |||
| Llama 3.1 405b指示(FP8) | |||
| Llama 3.1 70b指示(FP8) | |||
| Llama 3.1 8B指示 | |||
| Llama 3.1 Nemotron 70B指示 | |||
| Llama 3.2 3B指示 | |||
| QWEN2.5编码器32B指示 | |||
| Mistral(La Plateforme) | 自由层(实验计划)需要选择数据培训,需要电话号码验证。 | 开放且专有的Mistral模型 | 1请求/第二 500,000令牌/分钟 每月1,000,000个令牌 |
| Mistral(Codestral) | 目前免费使用的是基于每月订阅的,需要电话号码验证。 | Codestral | 30个请求/分钟 每天2,000个请求 |
| 拥抱面无服务器推理 | 仅限于小于10GB的型号。 即使超过10GB,一些受欢迎的模型也得到了支持。 | 各种开放型号 | 每天1,000个请求(带有帐户) |
| Sambanova云 | 骆驼3.1 405b | 10个请求/分钟 | |
| 美洲驼3.2 90b | 1请求/分钟 | ||
| 骆驼3.1 70b | 20个请求/分钟 | ||
| 美洲驼3.2 11b | 10个请求/分钟 | ||
| 美洲驼3.1 8b | 30个请求/分钟 | ||
| 骆驼3.2 3b | 30个请求/分钟 | ||
| 美洲驼3.2 1b | 30个请求/分钟 | ||
| 脑 | 候补名单 自由层仅限于8K上下文 | 美洲驼3.1 8b | 30个请求/分钟 60,000令牌/分钟 900/小时的请求 1,000,000个令牌/小时 每天14,400个请求 每天1,000,000个令牌 |
| 骆驼3.1 70b | 30个请求/分钟 60,000令牌/分钟 900/小时的请求 1,000,000个令牌/小时 每天14,400个请求 每天1,000,000个令牌 | ||
| GitHub模型 | 候补名单 速率限制取决于副本订阅层 | AI21-JAMBA教学 | |
| cohere命令r | |||
| cohere命令r+ | |||
| cohere嵌入V3英语 | |||
| 共嵌入V3多语言 | |||
| meta-llama-3-70B教学 | |||
| meta-llama-3-8b教学 | |||
| meta-llama-3.1-405b-thrinct | |||
| meta-llama-3.1-70B教学 | |||
| meta-llama-3.1-8B教学 | |||
| Mistral大 | |||
| Mistral大(2407) | |||
| Mistral Nemo | |||
| 小小的 | |||
| Openai GPT-4O | |||
| Openai GPT-4O Mini | |||
| Openai文本嵌入3(大) | |||
| Openai文本嵌入3(小) | |||
| PHI-3中心指导(128K) | |||
| PHI-3中心指导(4K) | |||
| PHI-3-MINI指示(128K) | |||
| PHI-3-MINI指示(4K) | |||
| Phi-3-small指示(128K) | |||
| Phi-3-small指示(8K) | |||
| PHI-3.5-MINI指示(128K) | |||
| OVH AI端点(免费beta) | Codellama 13B指令 | 12个请求/分钟 | |
| Codestral Mamba 7B V0.1 | 12个请求/分钟 | ||
| 骆驼2 13B聊天 | 12个请求/分钟 | ||
| Llama 3 70b指示 | 12个请求/分钟 | ||
| Llama 3 8b指示 | 12个请求/分钟 | ||
| Llama 3.1 70B指示 | 12个请求/分钟 | ||
| Mathstral 7b V0.1 | 12个请求/分钟 | ||
| Mistral 7b指示 | 12个请求/分钟 | ||
| Mistral Nemo 2407 | 12个请求/分钟 | ||
| 混音8x22b指令 | 12个请求/分钟 | ||
| 混音8x7b指令 | 12个请求/分钟 | ||
| Cloudflare工人AI | 10,000个令牌/天 | DeepSeek编码器6.7b基础(AWQ) | |
| DeepSeek编码器6.7b指示(AWQ) | |||
| DeepSeek数学7B指示 | |||
| Discolm German 7b V1(AWQ) | |||
| FALCOM 7B指示 | |||
| Gemma 2B指示(Lora) | |||
| Gemma 7b指令 | |||
| Gemma 7b指示(Lora) | |||
| 爱马仕2 Pro Mistral 7b | |||
| Llama 2 13b聊天(AWQ) | |||
| Llama 2 7b聊天(FP16) | |||
| Llama 2 7b聊天(INT8) | |||
| Llama 2 7b聊天(Lora) | |||
| Llama 3 8b指示 | |||
| Llama 3 8b指示 | |||
| Llama 3 8b指示(AWQ) | |||
| Llama 3.1 8B指示 | |||
| Llama 3.1 8b指示(AWQ) | |||
| Llama 3.1 8b指示(FP8) | |||
| Llama 3.2 11B视觉指示 | |||
| Llama 3.2 1B指示 | |||
| Llama 3.2 3B指示 | |||
| Llamaguard 7b(AWQ) | |||
| MISTRAL 7B指示V0.1 | |||
| MISTRAL 7B指示V0.1(AWQ) | |||
| MISTRAL 7B指示V0.2 | |||
| MISTRAL 7B指示V0.2(Lora) | |||
| 神经聊天7b v3.1(AWQ) | |||
| OpenChat 3.5 0106 | |||
| OpenHermes 2.5 Mistral 7b(AWQ) | |||
| PHI-2 | |||
| QWEN 1.5 0.5B聊天 | |||
| QWEN 1.5 1.8B聊天 | |||
| QWEN 1.5 14B聊天(AWQ) | |||
| QWEN 1.5 7b聊天(AWQ) | |||
| SQLCODER 7B 2 | |||
| Starling LM 7B Beta | |||
| Tinyllama 1.1B聊天v1.0 | |||
| UNA Cybertron 7b V2(BF16) | |||
| Zephyr 7b Beta(AWQ) | |||
| 一起 | Llama 3.2 11B视觉指示 | 2024年免费 | |
| 共同 | 20个请求/分钟 每月1,000个请求 | 命令r | 共享限制 |
| 命令r+ | |||
| Google Cloud Vertex AI | Google Cloud的付款验证非常严格。 | Llama 3.1 70B指示 | Llama 3.1 API服务在预览期间免费。 60个请求/分钟 |
| Llama 3.1 8B指示 | Llama 3.1 API服务在预览期间免费。 60个请求/分钟 | ||
| 骆驼3.2 90B视觉指示 | Llama 3.2 API服务在预览期间免费。 30个请求/分钟 | ||
| 双子座闪光灯实验 | 实验双子座模型。 10个请求/分钟 | ||
| 双子座实验 | |||
| glhf.chat(免费beta) | 电子邮件for API访问 | 任何关于在VLLM上运行的型号的模型,并适合A100节点(〜640GB VRAM),包括Llama 3.1 405B在FP8时 |
| 提供者 | 学分 | 要求 | 型号 |
|---|---|---|---|
| 一起 | $ 5 | 各种开放型号 | |
| 烟花 | $ 1 | 各种开放型号 | |
| 统一 | $ 10(+40美元的联系) | 通往其他提供商的路线,各种开放模型和专有模型(OpenAI,Gemini,人类,Mistral,Clelplexity等) | |
| Deepinfra | $ 1.80 | 各种开放型号 | |
| NVIDIA NIM | 1,000个API电话1个月 | 各种开放型号 | |
| AI21 | 3个月$ 10 | jamba/jurrasic-2 | |
| NLP云 | $ 15 | 电话号码验证 | 各种开放型号 |
| 上升 | 3个月$ 10 | 太阳能专业/迷你 | |
| 贝特尼 | $ 30 | 任何支持的模型 - 按计算时间付款 | |
| xai | $ 25/月,直到2024年底 | 格罗克 | |
| 双曲线 | $ 10 | DeepSeek v2.5 | |
| 爱马仕3骆驼3.1 70b | |||
| Llama 3 70b指示 | |||
| Llama 3.1 405B基地 | |||
| Llama 3.1 405b基地(FP8) | |||
| Llama 3.1 405b指示 | |||
| Llama 3.1 70B指示 | |||
| Llama 3.1 8B指示 | |||
| Llama 3.2 3B指示 | |||
| Pixtral 12b(2409) | |||
| QWEN QWQ 32B预览 | |||
| QWEN2-VL 72B指令 | |||
| QWEN2-VL 7B指令 | |||
| QWEN2.5 72B指令 | |||
| QWEN2.5编码器32B指示 |