
Langport เป็นแพลตฟอร์มการให้บริการแบบจำลองภาษาขนาดใหญ่โอเพนซอร์ซ เป้าหมายของเราคือการสร้างบริการอนุมาน LLM ที่รวดเร็วเป็นพิเศษ
โครงการนี้ได้รับแรงบันดาลใจจาก LMSYS/FastChat เราหวังว่าแพลตฟอร์มการให้บริการจะมีน้ำหนักเบาและรวดเร็ว แต่ FastChat มีคุณสมบัติอื่น ๆ เช่นการฝึกอบรมและการประเมินผลทำให้มันซับซ้อน
คุณสมบัติหลัก ได้แก่ :
ChatProtopip install langportหรือ:
pip install git+https://github.com/vtuber-plan/langport.git หากคุณต้องการคนงาน GGML Generation ให้ใช้คำสั่งนี้:
pip install langport[ggml]หากคุณต้องการใช้ GPU:
CT_CUBLAS=1 pip install langport[ggml]git clone https://github.com/vtuber-plan/langport.git
cd langportpip install --upgrade pip
pip install -e . เป็นเรื่องง่ายที่จะเริ่มบริการแชท API ในพื้นที่:
ก่อนอื่นให้เริ่มกระบวนการคนงานในเทอร์มินัล:
python -m langport.service.server.generation_worker --port 21001 --model-path < your model path >จากนั้นเริ่มบริการ API ในเทอร์มินัลอื่น:
python -m langport.service.gateway.openai_apiตอนนี้คุณสามารถใช้การอนุมาน API โดย OpenAI Protocol
เป็นเรื่องง่ายที่จะเริ่มบริการโหนดแชท API เดียว:
python -m langport.service.server.generation_worker --port 21001 --model-path < your model path >
python -m langport.service.gateway.openai_apiหากคุณต้องการเซิร์ฟเวอร์ Embeddings API เดียว:
python -m langport.service.server.embedding_worker --port 21002 --model-path bert-base-chinese --gpus 0 --num-gpus 1
python -m langport.service.gateway.openai_api --port 8000 --controller-address http://localhost:21002หากคุณต้องการ Embeddings API หรือคุณสมบัติอื่น ๆ คุณสามารถปรับใช้คลัสเตอร์การกระจายแบบกระจาย:
python -m langport.service.server.dummy_worker --port 21001
python -m langport.service.server.generation_worker --model-path < your model path > --neighbors http://localhost:21001
python -m langport.service.server.embedding_worker --model-path < your model path > --neighbors http://localhost:21001
python -m langport.service.gateway.openai_api --controller-address http://localhost:21001ในทางปฏิบัติเกตเวย์สามารถเชื่อมต่อกับโหนดใด ๆ เพื่อแจกจ่ายงานอนุมาน:
python -m langport.service.server.dummy_worker --port 21001
python -m langport.service.server.generation_worker --port 21002 --model-path < your model path > --neighbors http://localhost:21001
python -m langport.service.server.generation_worker --port 21003 --model-path < your model path > --neighbors http://localhost:21001 http://localhost:21002
python -m langport.service.server.generation_worker --port 21004 --model-path < your model path > --neighbors http://localhost:21001 http://localhost:21003
python -m langport.service.server.generation_worker --port 21005 --model-path < your model path > --neighbors http://localhost:21001 http://localhost:21004
python -m langport.service.gateway.openai_api --controller-address http://localhost:21003 # 21003 is OK!
python -m langport.service.gateway.openai_api --controller-address http://localhost:21002 # Any worker is also OK!เรียกใช้การสร้างข้อความด้วย Multi GPU:
python -m langport.service.server.generation_worker --port 21001 --model-path < your model path > --gpus 0,1 --num-gpus 2
python -m langport.service.gateway.openai_apiเรียกใช้การสร้างข้อความด้วย GGML Worker:
python -m langport.service.server.ggml_generation_worker --port 21001 --model-path < your model path > --gpu-layers < num layer to gpu (resize this for your VRAM) >เรียกใช้ OpenAI Forward Server:
python -m langport.service.server.chatgpt_generation_worker --port 21001 --api-url < url > --api-key < key > Langport เปิดตัวภายใต้ใบอนุญาตซอฟต์แวร์ Apache