nos скачать - nos -исходный код скачать

nos

Другой исходный код

v0.3.0

Скачать

NOS - это быстрый и гибкий сервер вывода Pytorch, который работает в любом облаке или AI HW.

Ключевые функции

Простой в использовании : создан для Pytorch и разработан для оптимизации, подачи и автоматических моделей Pytorch в производстве без ущерба для опыта разработчиков.
? Мультимодальная и мультимодель : подайте несколько основополагающих моделей ИИ (LLMS, диффузии, встраивания, одновременного обнаружения речи в текст и объекта) на одном сервере.
Время выполнения HW -AWARE: без особых усилий развернуть модели Pytorch на современных акселераторах ИИ (NVIDIA GPU, AWS Conferentia2, AMD - скоро и даже процессоры).
☁ Контейнеры-облачные агностики: запустите в любом облаке (AWS, GCP, Azure, Lambda Labs, в Prem) с нашими контейнерами сервера вывода готово к использованию.

Что нового

[Февраль 2024 г.] ✍ [Блог] Представление NOS CONFERENTIA2 ( inf2 ).
[Январь 2024] ✍ [блог] обслуживает LLMS с ограниченным бюджетом с SkyServe.
[Январь 2024]
[Январь 2024] ✍ [Блог] Начало работы с учебниками NOS доступно здесь!
[Декабрь 2023] ? [Repo] Мы открыли игровую площадку NOS, чтобы помочь вам начать работу с большим количеством примеров, построенных на NOS!

QuickStart

Мы настоятельно рекомендуем вам пойти в наше руководство по QuickStart, чтобы начать работу. Чтобы установить клиент NOS, вы можете запустить следующую команду:

conda create -n nos python=3.8 -y
conda activate nos
pip install torch-nos

Как только клиент будет установлен, вы можете запустить NOS -сервер через CLI serve . Это автоматически обнаружит вашу локальную среду, загрузит изображение Docker Runtime и разверните сервер NOS:

nos serve up --http --logging-level INFO

Теперь вы готовы запустить свой первый запрос о выводе с nos! Вы можете запустить любую из следующих команд, чтобы попробовать все. Вы можете установить уровень журнала для DEBUG , если вам нужна более подробная информация с сервера.

? ‍ Что может сделать nos?

Агенты чата / LLM (Chatgpt-as-a-service)

NOS предоставляет OpenAI-совместимый сервер с поддержкой потоковой передачи, чтобы вы могли подключить свой любимый клиент LLM, совместимый с OpenAI, чтобы поговорить с NOS.

API / Использование

GRPC API ⚡

 from nos . client import Client

client = Client ()

model = client . Module ( "TinyLlama/TinyLlama-1.1B-Chat-v1.0" )
response = model . chat ( message = "Tell me a story of 1000 words with emojis" , _stream = True )

REST API

curl 
-X POST http://localhost:8000/v1/chat/completions 
-H " Content-Type: application/json " 
-d ' {
    "model": "TinyLlama/TinyLlama-1.1B-Chat-v1.0",
    "messages": [{
        "role": "user",
        "content": "Tell me a story of 1000 words with emojis"
    }],
    "temperature": 0.7,
    "stream": true
  } '

? ️ генерация изображений (стабильная диффузия как услуга)

Построить боты дискордов в получении за секунды.

API / Использование

GRPC API ⚡

 from nos . client import Client

client = Client ()

sdxl = client . Module ( "stabilityai/stable-diffusion-xl-base-1-0" )
image , = sdxl ( prompts = [ "hippo with glasses in a library, cartoon styling" ],
              width = 1024 , height = 1024 , num_images = 1 )

REST API

curl 
-X POST http://localhost:8000/v1/infer 
-H ' Content-Type: application/json ' 
-d ' {
    "model_id": "stabilityai/stable-diffusion-xl-base-1-0",
    "inputs": {
        "prompts": ["hippo with glasses in a library, cartoon styling"],
        "width": 1024, "height": 1024,
        "num_images": 1
    }
} '

? Встроение текста и изображений (клип-как услуга)

Создайте масштабируемый семантический поиск изображений/видео за считанные минуты.

API / Использование

GRPC API ⚡

 from nos . client import Client

client = Client ()

clip = client . Module ( "openai/clip-vit-base-patch32" )
txt_vec = clip . encode_text ( texts = [ "fox jumped over the moon" ])

REST API

curl 
-X POST http://localhost:8000/v1/infer 
-H ' Content-Type: application/json ' 
-d ' {
    "model_id": "openai/clip-vit-base-patch32",
    "method": "encode_text",
    "inputs": {
        "texts": ["fox jumped over the moon"]
    }
} '

? ️ аудио транскрипция (шепот как услуга)

Выполните транскрипцию звука в реальном времени, используя Whisper.

API / Использование

GRPC API ⚡

 from pathlib import Path
from nos . client import Client

client = Client ()

model = client . Module ( "openai/whisper-small.en" )
with client . UploadFile ( Path ( "audio.wav" )) as remote_path :
  response = model ( path = remote_path )
# {"chunks": ...}

REST API

curl 
-X POST http://localhost:8000/v1/infer/file 
-H ' accept: application/json ' 
-H ' Content-Type: multipart/form-data ' 
-F ' model_id=openai/whisper-small.en ' 
-F ' [email protected] '

? Обнаружение объекта (Yolox-as-a-service)

Запустите классические задачи компьютерного видения в 2 строках кода.

API / Использование

GRPC API ⚡

 from pathlib import Path
from nos . client import Client

client = Client ()

model = client . Module ( "yolox/medium" )
response = model ( images = [ Image . open ( "image.jpg" )])

REST API

curl 
-X POST http://localhost:8000/v1/infer/file 
-H ' accept: application/json ' 
-H ' Content-Type: multipart/form-data ' 
-F ' model_id=yolox/medium ' 
-F ' [email protected] '

⚒ пользовательские модели

Хотите запустить модели, не поддерживаемые NOS? Вы можете легко добавить свои собственные модели, следуя примерам на игровой площадке NOS.

? Лицензия

Этот проект лицензирован по лицензии Apache-2.0.

? Телеметрия

NOS собирает анонимные данные об использовании с использованием Sentry. Это используется, чтобы помочь нам понять, как сообщество использует NOS, и для того, чтобы помочь нам определить приоритеты функций. Вы можете отказаться от телеметрии, установив NOS_TELEMETRY_ENABLED=0 .

? Внося

Мы приветствуем вклад! Пожалуйста, смотрите наше руководство для получения дополнительной информации.

? Быстрые ссылки

Отправьте нам электронное письмо по адресу [email protected] или присоединяйтесь к нашему разногласию для помощи.
Следуйте за нами в Twitter и LinkedIn, чтобы быть в курсе наших продуктов.

Расширять

Дополнительная информация

Версия v0.3.0
Тип Другой исходный код
Время обновления 2025-03-09
размер 12.44MB
От Github

Связанные приложения

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

nos

Ключевые функции

Что нового

QuickStart

? ‍ Что может сделать nos?

Агенты чата / LLM (Chatgpt-as-a-service)

? ️ генерация изображений (стабильная диффузия как услуга)

? Встроение текста и изображений (клип-как услуга)

? ️ аудио транскрипция (шепот как услуга)

? Обнаружение объекта (Yolox-as-a-service)

⚒ пользовательские модели

? Лицензия

? Телеметрия

? Внося

? Быстрые ссылки

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express