free llm api resources
1.0.0
여기에는 API 기반 LLM 사용에 대한 무료 액세스 또는 크레딧을 제공하는 다양한 서비스가 나와 있습니다.
메모
이 서비스를 남용하지 마십시오. 그렇지 않으면 우리는 그 서비스를 잃을 수도 있습니다.
경고
이 목록은 합법적이지 않은 서비스를 명시 적으로 제외합니다 (예 : 리버스 엔지니어는 기존 챗봇)
| 공급자 | 제공자 제한/노트 | 모델 이름 | 모델 한계 |
|---|---|---|---|
| 그로크 | Distil Whisper 큰 v3 | 7,200 오디오 초/분 2,000 개의 요청/일 | |
| Gemma 2 9B 지시 | 14,400 개의 요청/일 15,000 토큰/분 | ||
| Gemma 7b 지시 | 14,400 개의 요청/일 15,000 토큰/분 | ||
| llava 1.5 7b | 14,400 개의 요청/일 30,000 개의 토큰/분 | ||
| 라마 3 70b | 14,400 개의 요청/일 6,000 토큰/분 | ||
| LLAMA 3 70B- GROQ 도구 사용 미리보기 | 14,400 개의 요청/일 15,000 토큰/분 | ||
| 라마 3 8b | 14,400 개의 요청/일 30,000 개의 토큰/분 | ||
| LLAMA 3 8B- GROQ 도구 사용 미리보기 | 14,400 개의 요청/일 15,000 토큰/분 | ||
| 라마 3.1 70b | 14,400 개의 요청/일 6,000 토큰/분 | ||
| 라마 3.1 8b | 14,400 개의 요청/일 20,000 토큰/분 | ||
| 라마 3.2 11b 비전 | 7,000 개의 요청/일 7,000 개의 토큰/분 | ||
| 라마 3.2 1B | 7,000 개의 요청/일 7,000 개의 토큰/분 | ||
| 라마 3.2 3B | 7,000 개의 요청/일 7,000 개의 토큰/분 | ||
| 라마 3.2 90b 비전 | 3,500 개의 요청/일 7,000 개의 토큰/분 | ||
| 라마 가드 3 8b | 14,400 개의 요청/일 15,000 토큰/분 | ||
| 믹스 트랄 8x7b | 14,400 개의 요청/일 5,000 개의 토큰/분 | ||
| 큰 v3 속삭임 | 7,200 오디오 초/분 2,000 개의 요청/일 | ||
| 큰 V3 터보 속삭임 | 7,200 오디오 초/분 2,000 개의 요청/일 | ||
| 오픈 루터 | 20 요청/분 200 개의 요청/일 | Gemma 2 9B 지시 | |
| 헤르메스 3 라마 3.1 405b | |||
| 액체 LFM 40B | |||
| LLAMA 3 8B 지시 | |||
| Llama 3.1 405b 지시 | |||
| LLAMA 3.1 70B 지시 | |||
| Llama 3.1 8B 지시 | |||
| LLAMA 3.2 11B 비전 교육 | |||
| llama 3.2 1b 지시 | |||
| Llama 3.2 3B 지시 | |||
| LLAMA 3.2 90B 비전 지시 | |||
| Mistral 7b 지시 | |||
| Mythomax L2 13B | |||
| OpenChat 7b | |||
| PHI-3 Medium 128K 교육 | |||
| PHI-3 MINI 128K 교육 | |||
| Qwen 2 7b 지시 | |||
| 토피 M 7b | |||
| Zephyr 7b 베타 | |||
| Google AI 스튜디오 | 데이터는 교육에 사용됩니다 (영국/CH/EEA/EU 외부에서 사용될 때). | Gemini 1.5 플래시 | 1,000,000 토큰/분 1,500 개의 요청/일 15 요청/분 |
| Gemini 1.5 플래시 (실험) | 1,000,000 토큰/분 1,500 개의 요청/일 5 요청/분 | ||
| Gemini 1.5 Flash-8B | 1,000,000 토큰/분 1,500 개의 요청/일 15 요청/분 | ||
| Gemini 1.5 Flash-8B (실험) | 1,000,000 토큰/분 1,500 개의 요청/일 15 요청/분 | ||
| Gemini 1.5 Pro | 32,000 토큰/분 50 개의 요청/일 2 요청/분 | ||
| Gemini 1.5 Pro (실험) | 1,000,000 토큰/분 50 개의 요청/일 2 요청/분 | ||
| Gemini 1.0 Pro | 32,000 토큰/분 1,500 개의 요청/일 15 요청/분 | ||
| 텍스트 엠 베딩 -004 | 150 배치 요청/분 1,500 요청/분 100 컨텐츠/배치 | ||
| 임베딩 -001 | |||
| Lambda Labs (무료 미리보기) | 신용 카드 검증이 필요합니다. | 헤르메스 3 405b | |
| 헤르메스 3 70b | |||
| 헤르메스 3 8b | |||
| 액체 LFM 40B | |||
| LLAMA 3.1 405B 교육 (FP8) | |||
| LLAMA 3.1 70B 교육 (FP8) | |||
| Llama 3.1 8B 지시 | |||
| Llama 3.1 Nemotron 70b 지시 | |||
| Llama 3.2 3B 지시 | |||
| QWEN2.5 CODER 32B 지시 | |||
| Mistral (la plateforme) | 무료 계층 (실험 계획)은 데이터 교육을 선택해야하며 전화 번호 확인이 필요합니다. | 개방적이고 독점적 인 미스트랄 모델 | 1 요청/초 500,000 토큰/분 1,000,000,000 토큰/월 |
| 미스트랄 (Codestral) | 현재 월별 구독 기반으로 무료로 사용할 수 있으므로 전화 번호 확인이 필요합니다. | Codestral | 30 요청/분 2,000 개의 요청/일 |
| 서버리스 추론 | 10GB보다 작은 모델로 제한됩니다. 일부 인기있는 모델은 10GB를 초과하더라도 지원됩니다. | 다양한 오픈 모델 | 1,000 요청/일 (계정 포함) |
| 삼바노바 클라우드 | 라마 3.1 405b | 10 요청/분 | |
| 라마 3.2 90b | 1 요청/분 | ||
| 라마 3.1 70b | 20 요청/분 | ||
| 라마 3.2 11b | 10 요청/분 | ||
| 라마 3.1 8b | 30 요청/분 | ||
| 라마 3.2 3B | 30 요청/분 | ||
| 라마 3.2 1B | 30 요청/분 | ||
| 뇌 | 대기자 명단 8K 컨텍스트로 제한된 자유 계층 | 라마 3.1 8b | 30 요청/분 60,000 토큰/분 900 요청/시간 1,000,000 토큰/시간 14,400 개의 요청/일 1,000,000 토큰/일 |
| 라마 3.1 70b | 30 요청/분 60,000 토큰/분 900 요청/시간 1,000,000 토큰/시간 14,400 개의 요청/일 1,000,000 토큰/일 | ||
| Github 모델 | 대기자 명단 Coplot Subscription Tier에 따라 속도 제한 | AI21-Jamba-Instruct | |
| 코셔 명령 r | |||
| 코셔 명령 R+ | |||
| Cohere는 v3 영어를 포함합니다 | |||
| Cohere는 V3 다국어를 포함합니다 | |||
| 메타-롤라마 -3-70b-비율 | |||
| 메타-롤라마 -3-8B 강조 | |||
| 메타-롤라마 -3.1-405B-비율 | |||
| 메타-롤라마 -3.1-70B-비율 | |||
| 메타-롤라마 -3.1-8B 비축 | |||
| 큰 미스트랄 | |||
| 미스 트랄 큰 (2407) | |||
| 미스트랄 니모 | |||
| 미스 트랄이 작습니다 | |||
| Openai GPT-4O | |||
| Openai GPT-4O 미니 | |||
| Openai 텍스트 포함 3 (큰) | |||
| Openai 텍스트 포함 3 (작은) | |||
| PHI-3- 메디움 교육 (128K) | |||
| PHI-3 메디움 교육 (4K) | |||
| PHI-3-MINI Sterruct (128K) | |||
| PHI-3-MINI 교육 (4K) | |||
| PHI-3-SMALL 교육 (128K) | |||
| PHI-3-SMALL 교육 (8K) | |||
| PHI-3.5-MINI Instruct (128K) | |||
| OVH AI 엔드 포인트 (무료 베타) | Codellama 13B 지시 | 12 요청/분 | |
| Codestral mamba 7b v0.1 | 12 요청/분 | ||
| llama 2 13b 채팅 | 12 요청/분 | ||
| LLAMA 3 70B 지시 | 12 요청/분 | ||
| LLAMA 3 8B 지시 | 12 요청/분 | ||
| LLAMA 3.1 70B 지시 | 12 요청/분 | ||
| Mathstral 7B V0.1 | 12 요청/분 | ||
| Mistral 7b 지시 | 12 요청/분 | ||
| 미스트랄 니모 2407 | 12 요청/분 | ||
| Mixtral 8x22b 지시 | 12 요청/분 | ||
| Mixtral 8x7b 지시 | 12 요청/분 | ||
| Cloudflare Workers ai | 10,000 토큰/일 | DeepSeek Coder 6.7B베이스 (AWQ) | |
| DeepSeek Coder 6.7B Instruct (AWQ) | |||
| Deepseek Math 7b 지시 | |||
| Discolm German 7b V1 (AWQ) | |||
| Falcom 7B 지시 | |||
| Gemma 2B Instruct (LORA) | |||
| Gemma 7b 지시 | |||
| Gemma 7B Instruct (LORA) | |||
| 헤르메스 2 Pro Mistral 7b | |||
| llama 2 13b 채팅 (AWQ) | |||
| llama 2 7b 채팅 (FP16) | |||
| llama 2 7b 채팅 (int8) | |||
| llama 2 7b 채팅 (lora) | |||
| LLAMA 3 8B 지시 | |||
| LLAMA 3 8B 지시 | |||
| llama 3 8b instruct (AWQ) | |||
| Llama 3.1 8B 지시 | |||
| llama 3.1 8B 강사 (AWQ) | |||
| llama 3.1 8b 강사 (FP8) | |||
| LLAMA 3.2 11B 비전 교육 | |||
| llama 3.2 1b 지시 | |||
| Llama 3.2 3B 지시 | |||
| llamaguard 7B (AWQ) | |||
| Mistral 7b 지시 v0.1 | |||
| Mistral 7b instruct v0.1 (AWQ) | |||
| Mistral 7b 지시 v0.2 | |||
| Mistral 7b instruct v0.2 (lora) | |||
| 신경 채팅 7B v3.1 (AWQ) | |||
| OpenChat 3.5 0106 | |||
| OpenHermes 2.5 Mistral 7B (AWQ) | |||
| PHI-2 | |||
| Qwen 1.5 0.5b 채팅 | |||
| Qwen 1.5 1.8b 채팅 | |||
| Qwen 1.5 14B 채팅 (AWQ) | |||
| Qwen 1.5 7B 채팅 (AWQ) | |||
| SQLCODER 7B 2 | |||
| Starling LM 7B 베타 | |||
| Tinyllama 1.1b 채팅 v1.0 | |||
| UNA Cybertron 7B V2 (BF16) | |||
| Zephyr 7B 베타 (AWQ) | |||
| 함께 | LLAMA 3.2 11B 비전 교육 | 2024 년 무료 | |
| 코셔 | 20 요청/분 1,000 개의 요청/월 | 명령-r | 공유 한도 |
| 명령-r+ | |||
| Google Cloud Vertex AI | Google Cloud에 대한 매우 엄격한 결제 확인. | LLAMA 3.1 70B 지시 | LLAMA 3.1 미리보기 동안 무료 API 서비스 무료. 60 개의 요청/분 |
| Llama 3.1 8B 지시 | LLAMA 3.1 미리보기 동안 무료 API 서비스 무료. 60 개의 요청/분 | ||
| LLAMA 3.2 90B 비전 지시 | LLAMA 3.2 미리보기 동안 무료 API 서비스. 30 요청/분 | ||
| 쌍둥이 자리 실험 | 실험 쌍둥이 자리 모델. 10 요청/분 | ||
| Gemini Pro 실험 | |||
| glhf.chat (무료 베타) | API 액세스에 대한 이메일 | FP8에서 LLAMA 3.1 405B를 포함하여 A100 노드 (~ 640GB VRAM)에 적합한 포옹 얼굴에 대한 모든 모델 |
| 공급자 | 크레딧 | 요구 사항 | 모델 |
|---|---|---|---|
| 함께 | $ 5 | 다양한 오픈 모델 | |
| 불꽃 | $ 1 | 다양한 오픈 모델 | |
| 하나로 하다 | $ 10 (연락을 위해+$ 40) | 다른 공급자, 다양한 오픈 모델 및 독점 모델 (Openai, Gemini, Anthropic, Mistral, Perplexity 등)으로가는 경로 | |
| DeepInfra | $ 1.80 | 다양한 오픈 모델 | |
| nvidia nim | 1,000 API는 1 개월 동안 요청합니다 | 다양한 오픈 모델 | |
| AI21 | 3 개월 동안 $ 10 | 잠바/jurrasic-2 | |
| NLP 클라우드 | $ 15 | 전화 번호 확인 | 다양한 오픈 모델 |
| 도도한 | 3 개월 동안 $ 10 | 태양 광/미니 | |
| 베이스 텐 | $ 30 | 지원되는 모든 모델 - 컴퓨팅 시간으로 지불하십시오 | |
| Xai | 2024 년 말까지 월 $ 25/월 | 그로크 | |
| 쌍곡선 | $ 10 | Deepseek v2.5 | |
| 헤르메스 3 라마 3.1 70b | |||
| LLAMA 3 70B 지시 | |||
| 라마 3.1 405b베이스 | |||
| LLAMA 3.1 405B베이스 (FP8) | |||
| Llama 3.1 405b 지시 | |||
| LLAMA 3.1 70B 지시 | |||
| Llama 3.1 8B 지시 | |||
| Llama 3.2 3B 지시 | |||
| Pixtral 12b (2409) | |||
| Qwen QWQ 32B 미리보기 | |||
| QWEN2-VL 72B 지시 | |||
| QWEN2-VL 7B 지시 | |||
| Qwen2.5 72b 지시 | |||
| QWEN2.5 CODER 32B 지시 |