free llm api resources
1.0.0
В этом перечислены различные услуги, которые предоставляют бесплатный доступ или кредиты на использование LLM на основе API.
Примечание
Пожалуйста, не злоупотребляйте этими услугами, иначе мы можем их потерять.
Предупреждение
Этот список явно исключает любые услуги, которые не являются законными (например, реверс -инженеры - существующий чат -бот)
| Поставщик | Пределы поставщика/примечания | Название модели | Ограничения модели |
|---|---|---|---|
| Гриб | Distil Whisper большой v3 | 7200 аудио-секунды/минута 2000 запросов/день | |
| Gemma 2 9b инструктируется | 14 400 запросов/день 15 000 жетонов/минута | ||
| Джемма 7b инструктируется | 14 400 запросов/день 15 000 жетонов/минута | ||
| Llava 1,5 7b | 14 400 запросов/день 30 000 жетонов/минута | ||
| Лама 3 70b | 14 400 запросов/день 6000 жетонов/минута | ||
| Llama 3 70b - инструмент Groq Использование предварительного просмотра | 14 400 запросов/день 15 000 жетонов/минута | ||
| Лама 3 8b | 14 400 запросов/день 30 000 жетонов/минута | ||
| Llama 3 8b - Groq Tool Используйте предварительный просмотр | 14 400 запросов/день 15 000 жетонов/минута | ||
| Лама 3.1 70b | 14 400 запросов/день 6000 жетонов/минута | ||
| Лама 3.1 8b | 14 400 запросов/день 20 000 жетонов/минута | ||
| Llama 3.2 11b видение | 7000 запросов/день 7000 жетонов/минута | ||
| Лама 3.2 1B | 7000 запросов/день 7000 жетонов/минута | ||
| Лама 3.2 3b | 7000 запросов/день 7000 жетонов/минута | ||
| Llama 3.2 90b Vision | 3500 запросов/день 7000 жетонов/минута | ||
| Llama Guard 3 8b | 14 400 запросов/день 15 000 жетонов/минута | ||
| Миктральный 8x7b | 14 400 запросов/день 5000 жетонов/минута | ||
| Шепот большой v3 | 7200 аудио-секунды/минута 2000 запросов/день | ||
| Шептать большой v3 turbo | 7200 аудио-секунды/минута 2000 запросов/день | ||
| OpenRouter | 20 запросов/минута 200 запросов/день | Gemma 2 9b инструктируется | |
| Hermes 3 Llama 3.1 405b | |||
| Жидкая LFM 40b | |||
| Llama 3 8b инструктируйте | |||
| Llama 3.1 405b инструктируется | |||
| Llama 3.1 70b инструкт | |||
| Llama 3.1 8b инструктируйте | |||
| Llama 3.2 11b Vision | |||
| Llama 3.2 1b инструктируйте | |||
| Llama 3.2 3b инструктируйте | |||
| Llama 3.2 90b Vision | |||
| Миштраль 7B инструктируется | |||
| Mythomax L2 13b | |||
| OpenChat 7b | |||
| PHI-3 среда 128K инструктируйте | |||
| Phi-3 mini 128k | |||
| Qwen 2 7b инструктируйте | |||
| Toppy M 7b | |||
| Зефир 7B Бета | |||
| Google AI Studio | Данные используются для обучения (при использовании за пределами Великобритании/CH/EEA/EU). | Близнецы 1.5 Flash | 1 000 000 жетонов/минута 1500 запросов/день 15 запросов/минута |
| Gemini 1.5 Flash (экспериментальная) | 1 000 000 жетонов/минута 1500 запросов/день 5 запросов/минута | ||
| Близнецы 1.5 Flash-8b | 1 000 000 жетонов/минута 1500 запросов/день 15 запросов/минута | ||
| Gemini 1.5 Flash-8b (экспериментальный) | 1 000 000 жетонов/минута 1500 запросов/день 15 запросов/минута | ||
| Близнецы 1.5 Pro | 32 000 жетонов/минута 50 запросов/день 2 запроса/минута | ||
| Gemini 1.5 Pro (экспериментальный) | 1 000 000 жетонов/минута 50 запросов/день 2 запроса/минута | ||
| Близнецы 1.0 Pro | 32 000 жетонов/минута 1500 запросов/день 15 запросов/минута | ||
| Текст-эмбединг-004 | 150 партийных запросов/минута 1500 запросов/минута 100 контент/партия | ||
| Encedding-001 | |||
| Lambda Labs (бесплатный предварительный просмотр) | Требует проверки кредитной карты. | Гермес 3 405b | |
| Гермес 3 70b | |||
| Hermes 3 8b | |||
| Жидкая LFM 40b | |||
| Llama 3.1 405b инструкт (FP8) | |||
| Llama 3.1 70b инструкт (FP8) | |||
| Llama 3.1 8b инструктируйте | |||
| Llama 3.1 Nemotron 70b инструкт | |||
| Llama 3.2 3b инструктируйте | |||
| QWEN2.5 Coder 32B | |||
| Mistral (La Plateforme) | Бесплатный уровень (План эксперимента) требует выбора обучения данных, требует проверки номера телефона. | Открытые и запатентованные модели Mistral | 1 запрос/второй 500 000 жетонов/минута 1 000 000 000 токенов/месяц |
| Mistral (Codestral) | В настоящее время бесплатно для использования, ежемесячная подписка на основе подписки, требует проверки номера телефона. | Кодестальный | 30 запросов/минута 2000 запросов/день |
| Вывод без сервера без сервера | Ограничено моделями меньше 10 ГБ. Некоторые популярные модели поддерживаются, даже если они превышают 10 ГБ. | Различные открытые модели | 1000 запросов/день (с учетной записью) |
| Самабанова Облако | Лама 3.1 405b | 10 запросов/минута | |
| Лама 3.2 90b | 1 запрос/минута | ||
| Лама 3.1 70b | 20 запросов/минута | ||
| Лама 3.2 11b | 10 запросов/минута | ||
| Лама 3.1 8b | 30 запросов/минута | ||
| Лама 3.2 3b | 30 запросов/минута | ||
| Лама 3.2 1B | 30 запросов/минута | ||
| Церебра | Список ожидания Бесплатный уровень ограничен контекстом 8K | Лама 3.1 8b | 30 запросов/минута 60 000 жетонов/минута 900 запросов/час 1 000 000 жетонов/час 14 400 запросов/день 1 000 000 жетонов/день |
| Лама 3.1 70b | 30 запросов/минута 60 000 жетонов/минута 900 запросов/час 1 000 000 жетонов/час 14 400 запросов/день 1 000 000 жетонов/день | ||
| Модели GitHub | Список ожидания Ограничения скорости в зависимости от уровня подписки на копии | AI21-Jamba-Instruct | |
| Команда Cohere r | |||
| Команда Cohere R+ | |||
| COMERE встраивает V3 English | |||
| COUCE встроенный V3 Multringual | |||
| Метама-3-70B-Инструкция | |||
| Метамама-3-8B-Инструк | |||
| Meta-Llama-3.1-405b-instruct | |||
| Метама-3,1-70B-Инструкция | |||
| Метамама-3,1-8B-Инструк | |||
| Мишстраль большой | |||
| Mistral большой (2407) | |||
| Мишстраль Немо | |||
| Миштрал маленький | |||
| OpenAI GPT-4O | |||
| Openai GPT-4O Mini | |||
| Openai Text Enlceding 3 (большой) | |||
| Openai Text Enlceding 3 (маленький) | |||
| Phi-3-Medium инструкт (128K) | |||
| Phi-3-Medium инструкт (4K) | |||
| Phi-3-Mini инструкт (128K) | |||
| Phi-3-Mini инструктируют (4K) | |||
| Phi-3-Small инструктируется (128K) | |||
| Phi-3-Small инструктируется (8K) | |||
| PHI-3,5-минутный инструкт (128K) | |||
| Конечные точки OVH AI (бесплатная бета -версия) | Коделлама 13b инструкт | 12 запросов/минута | |
| Codestral Mamba 7b v0.1 | 12 запросов/минута | ||
| Лама 2 13b чат | 12 запросов/минута | ||
| Llama 3 70b инструктируется | 12 запросов/минута | ||
| Llama 3 8b инструктируйте | 12 запросов/минута | ||
| Llama 3.1 70b инструкт | 12 запросов/минута | ||
| Mathstral 7b v0.1 | 12 запросов/минута | ||
| Миштраль 7B инструктируется | 12 запросов/минута | ||
| Мишстраль Немо 2407 | 12 запросов/минута | ||
| Mixtral 8x22b инструкт | 12 запросов/минута | ||
| Mixtral 8x7b инструкт | 12 запросов/минута | ||
| Работники Cloudflare AI | 10000 жетонов/день | DeepSeek Coder 6.7b Base (AWQ) | |
| DeepSeek Coder 6.7b инструкт (AWQ) | |||
| DeepSeek Math 7b | |||
| Discolm German 7b v1 (awq) | |||
| Falcom 7b инструкт | |||
| Gemma 2b инструктируйте (Лора) | |||
| Джемма 7b инструктируется | |||
| Gemma 7b инструкт (Лора) | |||
| Hermes 2 Pro Mistral 7b | |||
| Llama 2 13b чат (AWQ) | |||
| Лама 2 7b чат (FP16) | |||
| Лама 2 7b чат (int8) | |||
| Лама 2 7b чат (Лора) | |||
| Llama 3 8b инструктируйте | |||
| Llama 3 8b инструктируйте | |||
| Llama 3 8b инструкт (awq) | |||
| Llama 3.1 8b инструктируйте | |||
| Llama 3.1 8b инструкт (awq) | |||
| Llama 3.1 8b инструкт (FP8) | |||
| Llama 3.2 11b Vision | |||
| Llama 3.2 1b инструктируйте | |||
| Llama 3.2 3b инструктируйте | |||
| LLAMAGUARD 7B (AWQ) | |||
| Mistral 7b инструкт v0.1 | |||
| Mistral 7b инструкт v0.1 (awq) | |||
| Mistral 7b инструкт v0.2 | |||
| Mistral 7b инструкт v0.2 (Lora) | |||
| Нейронный чат 7b v3.1 (awq) | |||
| OpenChat 3.5 0106 | |||
| OpenHermes 2.5 MiStral 7B (AWQ) | |||
| Phi-2 | |||
| QWEN 1,5 0,5B чат | |||
| QWEN 1,5 1,8B чат | |||
| QWEN 1.5 14B Chat (AWQ) | |||
| QWEN 1.5 7B Chat (AWQ) | |||
| SQLCODER 7B 2 | |||
| Starling LM 7b бета | |||
| Tinylymalama 1.1b чат v1.0 | |||
| Una Cybertron 7B V2 (BF16) | |||
| Zephyr 7b бета (awq) | |||
| Вместе | Llama 3.2 11b Vision | Бесплатно на 2024 год | |
| Кожух | 20 запросов/мин 1000 запросов/месяц | Команда | Общий лимит |
| Command-R+ | |||
| Google Cloud Vertex AI | Очень строгая проверка платежей для Google Cloud. | Llama 3.1 70b инструкт | Llama 3.1 API Service бесплатно во время предварительного просмотра. 60 запросов/минута |
| Llama 3.1 8b инструктируйте | Llama 3.1 API Service бесплатно во время предварительного просмотра. 60 запросов/минута | ||
| Llama 3.2 90b Vision | Llama 3.2 API Service бесплатно во время предварительного просмотра. 30 запросов/минута | ||
| Близнецы Флэш -экспериментальный | Экспериментальная модель Близнецов. 10 запросов/минута | ||
| Gemini Pro Experimental | |||
| glhf.chat (бесплатная бета) | Электронная почта для API Access | Любая модель по обнимающему лицом, заполненному на VLLM и подходит на узле A100 (~ 640 ГБ VRAM), включая Llama 3.1 405b на FP8 |
| Поставщик | Кредиты | Требования | Модели |
|---|---|---|---|
| Вместе | 5 долларов | Различные открытые модели | |
| Фейерверк | $ 1 | Различные открытые модели | |
| Unify | 10 долларов США (+40 долларов США для контакта) | Маршруты для других поставщиков, различные открытые модели и запатентованные модели (OpenAI, Близнецы, Антроп, Мистрал, недоумение и т. Д.) | |
| Deepinfra | $ 1,80 | Различные открытые модели | |
| NVIDIA NIM | 1000 API требует 1 месяц | Различные открытые модели | |
| AI21 | 10 долларов за 3 месяца | Джамба/Jurrasic-2 | |
| НЛП облако | $ 15 | Проверка номера телефона | Различные открытые модели |
| Наверх | 10 долларов за 3 месяца | Solar Pro/Mini | |
| Базис | 30 долларов | Любая поддерживаемая модель - оплачивайте за счет вычисления | |
| Xai | $ 25 в месяц до конца 2024 года | Грок | |
| Гиперболический | 10 долларов | DeepSeek v2.5 | |
| Hermes 3 Llama 3.1 70b | |||
| Llama 3 70b инструктируется | |||
| Llama 3.1 405b base | |||
| Llama 3.1 405b Base (FP8) | |||
| Llama 3.1 405b инструктируется | |||
| Llama 3.1 70b инструкт | |||
| Llama 3.1 8b инструктируйте | |||
| Llama 3.2 3b инструктируйте | |||
| Pixtral 12b (2409) | |||
| QWEN QWQ 32B Предварительный просмотр | |||
| QWEN2-VL 72B | |||
| QWEN2-VL 7B | |||
| Qwen2.5 72b | |||
| QWEN2.5 Coder 32B |