Скачать langport - Скачать исходный код langport

langport

AI Исходный код

0.3.11

Скачать

Лэнгпорт

архитектура

Langport-это платформа с большой языковой моделью с открытым исходным кодом. Наша цель - построить супер быстрый сервис вывода LLM.

Этот проект вдохновлен LMSYS/FASTCHAT, мы надеемся, что сервировочная платформа легкая и быстрая, но FastChat включает в себя другие функции, такие как обучение и оценка, усложняют ее.

Основные особенности включают:

Поддержка трансформаторов HuggingFace.
GGML (llama.cpp) Поддержка.
Распределенная система обслуживания для современных моделей.
Потоковая генеральная поддержка с различными стратегиями декодирования.
Пакетный вывод для более высокой пропускной способности.
Поддержка моделей только для энкодера, только декодера и кодера-декодера.
Openai-совместимые API.
Fauxpilot-совместимый API-интерфейс RESTFUL.
API-интерфейс, совместимые с объятиями.
Tabby-совместимые API RESTFUL.

Поддержка модели архитектуры

Llama, Llama2, GLM, Bloom, Opt, GPT2, GPT Neo, GPT Big Code и так далее.

Протестированные модели

Ningyu, Llama, Llama2, Vicuna, Chatglm, Chatglm2, Falcon, Starcoder, Wizardlm, Internlm, Openbuddy, Firefly, Codegen, Phoenix, RWKV, StableLm и так далее.

Новости

[2024/01/13] Представьте ChatProto .
[2023/08/04] Динамический пакетный вывод.
[2023/07/16] Поддержка квантования Int4.
[2023/07/13] Параметр logprobs генерации поддержки.
[2023/06/18] Добавить GGML (llama.cpp gpt.cpp starcoder.cpp и т. Д.) Поддержка работников.
[2023/06/09] Добавьте поддержку работников llama.cpp.
[2023/06/01] Добавить поддержку Huggingface Bert Embedding Worker.
[2023/06/01] Добавьте поддержку API -генерации текста HuggingFace.
[2023/06/01] Добавьте поддержку API Tabby.
[2023/05/23] Добавьте тестовый скрипт ЧАТ.
[2023/05/22] Новая распределенная архитектура.
[2023/05/14] Поддерживается пакетный вывод.
[2023/05/10] Langport Project начал.

Установить

Метод 1: с PIP

pip install langport

или:

pip install git+https://github.com/vtuber-plan/langport.git

Если вам нужен работник генерации GGML, используйте эту команду:

pip install langport[ggml]

Если вы хотите использовать GPU:

CT_CUBLAS=1 pip install langport[ggml]

Метод 2: Из источника

Клонировать это хранилище

git clone https://github.com/vtuber-plan/langport.git
cd langport

Установите пакет

pip install --upgrade pip
pip install -e .

Быстрый старт

Это просто запустить локальный сервис API в чате:

Во -первых, запустите рабочий процесс в терминале:

python -m langport.service.server.generation_worker --port 21001 --model-path < your model path >

Затем запустите службу API в другом терминале:

python -m langport.service.gateway.openai_api

Теперь вы можете использовать API вывода по протоколу Openai.

Запустить сервер

Это просто запустить один узел API -сервис чата:

python -m langport.service.server.generation_worker --port 21001 --model-path < your model path >
python -m langport.service.gateway.openai_api

Если вам нужен один узел API API -сервер:

python -m langport.service.server.embedding_worker --port 21002 --model-path bert-base-chinese --gpus 0 --num-gpus 1
python -m langport.service.gateway.openai_api --port 8000 --controller-address http://localhost:21002

Если вам нужен API Entceddings или другие функции, вы можете развернуть распределенный кластер с выводом:

python -m langport.service.server.dummy_worker --port 21001
python -m langport.service.server.generation_worker --model-path < your model path > --neighbors http://localhost:21001
python -m langport.service.server.embedding_worker --model-path < your model path > --neighbors http://localhost:21001
python -m langport.service.gateway.openai_api --controller-address http://localhost:21001

На практике шлюз может подключаться к любому узлу для распространения задач вывода:

python -m langport.service.server.dummy_worker --port 21001
python -m langport.service.server.generation_worker --port 21002 --model-path < your model path > --neighbors http://localhost:21001
python -m langport.service.server.generation_worker --port 21003 --model-path < your model path > --neighbors http://localhost:21001 http://localhost:21002
python -m langport.service.server.generation_worker --port 21004 --model-path < your model path > --neighbors http://localhost:21001 http://localhost:21003
python -m langport.service.server.generation_worker --port 21005 --model-path < your model path > --neighbors http://localhost:21001 http://localhost:21004
python -m langport.service.gateway.openai_api --controller-address http://localhost:21003 # 21003 is OK!
python -m langport.service.gateway.openai_api --controller-address http://localhost:21002 # Any worker is also OK!

Запустите генерацию текста с помощью нескольких графических процессоров:

python -m langport.service.server.generation_worker --port 21001 --model-path < your model path > --gpus 0,1 --num-gpus 2
python -m langport.service.gateway.openai_api

Запустите генерацию текста с работником GGML:

python -m langport.service.server.ggml_generation_worker --port 21001 --model-path < your model path > --gpu-layers < num layer to gpu (resize this for your VRAM) >

Запустить Openai Worth Server:

python -m langport.service.server.chatgpt_generation_worker --port 21001 --api-url < url > --api-key < key >

Лицензия

Langport выпускается по лицензии Apache Software.

Смотрите также

Langport-Docs
Лэнгпорт-Сорс

Звездная история

Расширять

Дополнительная информация

Версия 0.3.11
Тип AI Исходный код
Время обновления 2025-09-09
размер 323.39KB
От Github

Связанные приложения

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

langport

Лэнгпорт

Поддержка модели архитектуры

Протестированные модели

Новости

Установить

Метод 1: с PIP

Метод 2: Из источника

Быстрый старт

Запустить сервер

Лицензия

Смотрите также

Звездная история

ML stack

awesome free chatgpt

pywin_contextmenu

promptl

tick.chat

FastLoRAChat

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express