modelz llm
23.07.4
Modelz LLM-это сервер вывода, который облегчает использование моделей с широким языком с открытым исходным кодом (LLMS), таких как Fastchat, Llama и ChatGlm, в локальных или облачных средах с API совместимых с OpenAI .
pip install modelz-llm
# or install from source
pip install git+https://github.com/tensorchord/modelz-llm.git[gpu]Пожалуйста, сначала запустите самостоятельный сервер API, следуя инструкциям:
modelz-llm -m bigscience/bloomz-560m --device cpuВ настоящее время мы поддерживаем следующие модели:
| Название модели | Модель объятия | Docker Image | Рекомендуемый графический процессор |
|---|---|---|---|
| Fastchat T5 | lmsys/fastchat-t5-3b-v1.0 | MODELZAI/LLM-FASTCHAT-T5-3B | Nvidia L4 (24 ГБ) |
| Vicuna 7b Delta v1.1 | lmsys/vicuna-7b-delta-v1.1 | MODELZAI/LLM-VICUNA-7B | NVIDIA A100 (40 ГБ) |
| Лама 7b | decapoda-research/llama-7b-hf | MODELZAI/LLM-LLAMA-7B | NVIDIA A100 (40 ГБ) |
| Chatglm 6b Int4 | THUDM/chatglm-6b-int4 | MODELZAI/LLM-CHATGLM-6B-Int4 | Nvidia T4 (16 ГБ) |
| Chatglm 6b | THUDM/chatglm-6b | MODELZAI/LLM-CHATGLM-6B | Nvidia L4 (24 ГБ) |
| Bloomz 560M | bigscience/bloomz-560m | MODELZAI/LLM-BLOOMZ-560M | Процессор |
| Bloomz 1.7b | bigscience/bloomz-1b7 | Процессор | |
| Bloomz 3b | bigscience/bloomz-3b | Nvidia L4 (24 ГБ) | |
| Bloomz 7.1b | bigscience/bloomz-7b1 | NVIDIA A100 (40 ГБ) |
Затем вы можете использовать SDK Openai Python для взаимодействия с моделью:
import openai
openai . api_base = "http://localhost:8000"
openai . api_key = "any"
# create a chat completion
chat_completion = openai . ChatCompletion . create ( model = "any" , messages = [{ "role" : "user" , "content" : "Hello world" }])Вы также можете интегрировать Modelz-LLM с Langchain:
import openai
openai . api_base = "http://localhost:8000"
openai . api_key = "any"
from langchain . llms import OpenAI
llm = OpenAI ()
llm . generate ( prompts = [ "Could you please recommend some movies?" ])Вы также можете развернуть Modelz-LLM непосредственно на Modelz:
Modelz LLM поддерживает следующие API для взаимодействия с моделями с крупным языком с открытым исходным кодом:
/completions/chat/completions/embeddings/engines/<any>/embeddings/v1/completions/v1/chat/completions/v1/embeddings