modelz llm下载-Modelz modelz llm源代码下载

modelz llm

其他源码

23.07.4

下载

Modelz LLM

ModelZ LLM是一款推理服务器，可在具有OpenAI兼容API的本地或基于云的环境上利用开源大语模型（LLM），例如FastChat，Llama和ChatGLM。

特征

OpenAI兼容API ：ModelZ LLM为LLM提供了兼容API，这意味着您可以使用OpenAI Python SDK或Langchain与模型进行交互。
自我托管：ModelZ LLM可以轻松地部署在本地或基于云的环境上。
开源LLMS ：Modelz LLM支持开源LLM，例如FastChat，Llama和ChatGlm。
云本地：我们为不同的LLM提供码头图像，可以轻松地部署在Kubernetes或其他基于云的环境（例如Modelz）上

快速开始

安装

pip install modelz-llm
# or install from source
pip install git+https://github.com/tensorchord/modelz-llm.git[gpu]

运行自托管API服务器

请首先按照说明启动自托管API服务器：

modelz-llm -m bigscience/bloomz-560m --device cpu

目前，我们支持以下模型：

模型名称	拥抱面模型	Docker图像	推荐GPU
Fastchat T5	`lmsys/fastchat-t5-3b-v1.0`	ModelZai/LLM-FastChat-T5-3B	NVIDIA L4（24GB）
Vicuna 7B Delta v1.1	`lmsys/vicuna-7b-delta-v1.1`	Modelzai/LLM-Vicuna-7b	NVIDIA A100（40GB）
美洲驼7b	`decapoda-research/llama-7b-hf`	ModelZai/LLM-LLAMA-7B	NVIDIA A100（40GB）
chatglm 6b int4	`THUDM/chatglm-6b-int4`	modelzai/llm-chatglm-6b-int4	NVIDIA T4（16GB）
chatglm 6b	`THUDM/chatglm-6b`	modelzai/llm-chatglm-6b	NVIDIA L4（24GB）
Bloomz 560m	`bigscience/bloomz-560m`	ModelZai/LLM-Bloomz-560m	中央处理器
Bloomz 1.7b	`bigscience/bloomz-1b7`		中央处理器
Bloomz 3B	`bigscience/bloomz-3b`		NVIDIA L4（24GB）
Bloomz 7.1b	`bigscience/bloomz-7b1`		NVIDIA A100（40GB）

使用Openai Python SDK

然后，您可以使用OpenAi Python SDK与模型进行交互：

 import openai
openai . api_base = "http://localhost:8000"
openai . api_key = "any"

# create a chat completion
chat_completion = openai . ChatCompletion . create ( model = "any" , messages = [{ "role" : "user" , "content" : "Hello world" }])

与Langchain集成

您也可以将Modelz-Llm与Langchain集成：

 import openai
openai . api_base = "http://localhost:8000"
openai . api_key = "any"

from langchain . llms import OpenAI

llm = OpenAI ()

llm . generate ( prompts = [ "Could you please recommend some movies?" ])

部署在ModelZ上

您也可以直接在ModelZ上部署ModelZ-LLM：

支持的API

ModelZ LLM支持以下API，以与开源大语言模型进行交互：

/completions
/chat/completions
/embeddings
/engines/<any>/embeddings
/v1/completions
/v1/chat/completions
/v1/embeddings

致谢

迅速生成逻辑的FastChat。
推理引擎的MOSEC。

展开

附加信息

版本 23.07.4
类型其他源码
更新时间 2025-04-17
大小 37.18KB
来自于 Github

modelz llm

Modelz LLM

特征

快速开始

安装

运行自托管API服务器

使用Openai Python SDK

与Langchain集成

部署在ModelZ上

支持的API

致谢

TensorRT LLM

GitHub sgrebnov/cordova plugin background download

Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express