langport
0.3.11

Langport是一種開源大型語言模型服務平台。我們的目標是建立超級快速的LLM推理服務。
該項目的靈感來自LMSY/FastChat,我們希望服務平台輕巧且快速,但是FastChat包含其他功能,例如培訓和評估,使其變得複雜。
核心功能包括:
ChatProto 。pip install langport或者:
pip install git+https://github.com/vtuber-plan/langport.git 如果您需要GGML生成工作者,請使用此命令:
pip install langport[ggml]如果您想使用GPU:
CT_CUBLAS=1 pip install langport[ggml]git clone https://github.com/vtuber-plan/langport.git
cd langportpip install --upgrade pip
pip install -e . 啟動本地聊天API服務很容易:
首先,在終端開始工作過程:
python -m langport.service.server.generation_worker --port 21001 --model-path < your model path >然後,在另一個終端啟動API服務:
python -m langport.service.gateway.openai_api現在,您可以通過OpenAI協議使用推理API。
啟動單個節點聊天API服務很容易:
python -m langport.service.server.generation_worker --port 21001 --model-path < your model path >
python -m langport.service.gateway.openai_api如果您需要單個節點嵌入式API服務器:
python -m langport.service.server.embedding_worker --port 21002 --model-path bert-base-chinese --gpus 0 --num-gpus 1
python -m langport.service.gateway.openai_api --port 8000 --controller-address http://localhost:21002如果您需要嵌入式API或其他功能,則可以部署分佈式推理群集:
python -m langport.service.server.dummy_worker --port 21001
python -m langport.service.server.generation_worker --model-path < your model path > --neighbors http://localhost:21001
python -m langport.service.server.embedding_worker --model-path < your model path > --neighbors http://localhost:21001
python -m langport.service.gateway.openai_api --controller-address http://localhost:21001實際上,網關可以連接到分佈推理任務的任何節點:
python -m langport.service.server.dummy_worker --port 21001
python -m langport.service.server.generation_worker --port 21002 --model-path < your model path > --neighbors http://localhost:21001
python -m langport.service.server.generation_worker --port 21003 --model-path < your model path > --neighbors http://localhost:21001 http://localhost:21002
python -m langport.service.server.generation_worker --port 21004 --model-path < your model path > --neighbors http://localhost:21001 http://localhost:21003
python -m langport.service.server.generation_worker --port 21005 --model-path < your model path > --neighbors http://localhost:21001 http://localhost:21004
python -m langport.service.gateway.openai_api --controller-address http://localhost:21003 # 21003 is OK!
python -m langport.service.gateway.openai_api --controller-address http://localhost:21002 # Any worker is also OK!使用多GPU運行文本生成:
python -m langport.service.server.generation_worker --port 21001 --model-path < your model path > --gpus 0,1 --num-gpus 2
python -m langport.service.gateway.openai_api與GGML工人一起運行文字生成:
python -m langport.service.server.ggml_generation_worker --port 21001 --model-path < your model path > --gpu-layers < num layer to gpu (resize this for your VRAM) >運行OpenAI遠射服務器:
python -m langport.service.server.chatgpt_generation_worker --port 21001 --api-url < url > --api-key < key > Langport在Apache軟件許可證下發布。