Download nos - Download de código -fonte nos

nos

Outro código-fonte

v0.3.0

Baixar

O NOS é um servidor de inferência Pytorch rápido e flexível que é executado em qualquer nuvem ou AI HW.

Principais recursos

Fácil de usar : construído para Pytorch e projetado para otimizar, servir modelos de pytorch em escala automática na produção sem comprometer a experiência do desenvolvedor.
? Multi-modal e multi-model : Sirva vários modelos de IA fundamentais (LLMS, difusão, incorporação, detecção de fala em texto e objetos) simultaneamente, em um único servidor.
Tempo de execução com reconhecimento de HW: Implante o Pytorch modela sem esforço para os aceleradores de IA modernos (NVIDIA GPUS, AWS Inferentia2, AMD - em breve e até CPUs).
☁️ Containers agnósticos em nuvem: Execute em qualquer nuvem (AWS, GCP, Azure, Lambda Labs, no local) com nossos contêineres de servidores de inferência de inferência prontos para uso.

O que há de novo

[Fev 2024] ✍️ [blog] Apresentando o tempo de execução do NOS inferntia2 ( inf2 ).
[Janeiro de 2024] ✍️ [blog] Servindo LLMs com orçamento limitado com o SkyServe.
[JAN 2024] [DOCS] Página de integração Skypilot!
[Janeiro de 2024] ✍️ [blog] Introdução aos tutoriais da NOS está disponível aqui!
[Dezembro de 2023] ? [Repo] Nós abrimos o playground da NOS para ajudá-lo a começar com mais exemplos construídos na NOS!

Investir rápido

É altamente recomendável que você vá ao nosso Guia de Investimento Quick para começar. Para instalar o cliente NOS, você pode executar o seguinte comando:

conda create -n nos python=3.8 -y
conda activate nos
pip install torch-nos

Depois que o cliente estiver instalado, você pode iniciar o servidor NOS através da CLI da serve . Isso detectará automaticamente o seu ambiente local, baixará a imagem do tempo de execução do Docker e aplicará o servidor NOS:

nos serve up --http --logging-level INFO

Agora você está pronto para executar seu primeiro pedido de inferência com a NOS! Você pode executar qualquer um dos seguintes comandos para experimentar as coisas. Você pode definir o nível de log para DEBUG se quiser obter informações mais detalhadas do servidor.

? ‍ O que o NOS pode fazer?

Agentes de bate-papo / LLM (Chatgpt-As-A-Service)

O NOS fornece um servidor compatível com o OpenAI com suporte de streaming para que você possa conectar seu cliente LLM compatível com o OpenAI favorito para conversar com o NOS.

API / Uso

API GRPC ⚡

 from nos . client import Client

client = Client ()

model = client . Module ( "TinyLlama/TinyLlama-1.1B-Chat-v1.0" )
response = model . chat ( message = "Tell me a story of 1000 words with emojis" , _stream = True )

Rest API

curl 
-X POST http://localhost:8000/v1/chat/completions 
-H " Content-Type: application/json " 
-d ' {
    "model": "TinyLlama/TinyLlama-1.1B-Chat-v1.0",
    "messages": [{
        "role": "user",
        "content": "Tell me a story of 1000 words with emojis"
    }],
    "temperature": 0.7,
    "stream": true
  } '

? Sustração de imagem (difusão estável como serviço)

Construa os bots Discord Midjourney em segundos.

API / Uso

API GRPC ⚡

 from nos . client import Client

client = Client ()

sdxl = client . Module ( "stabilityai/stable-diffusion-xl-base-1-0" )
image , = sdxl ( prompts = [ "hippo with glasses in a library, cartoon styling" ],
              width = 1024 , height = 1024 , num_images = 1 )

Rest API

curl 
-X POST http://localhost:8000/v1/infer 
-H ' Content-Type: application/json ' 
-d ' {
    "model_id": "stabilityai/stable-diffusion-xl-base-1-0",
    "inputs": {
        "prompts": ["hippo with glasses in a library, cartoon styling"],
        "width": 1024, "height": 1024,
        "num_images": 1
    }
} '

? Incorporação de texto e imagem (clipe como serviço)

Construa pesquisa semântica escalável de imagens/vídeos em minutos.

API / Uso

API GRPC ⚡

 from nos . client import Client

client = Client ()

clip = client . Module ( "openai/clip-vit-base-patch32" )
txt_vec = clip . encode_text ( texts = [ "fox jumped over the moon" ])

Rest API

curl 
-X POST http://localhost:8000/v1/infer 
-H ' Content-Type: application/json ' 
-d ' {
    "model_id": "openai/clip-vit-base-patch32",
    "method": "encode_text",
    "inputs": {
        "texts": ["fox jumped over the moon"]
    }
} '

? Aste transcrição de áudio (sussurro como serviço)

Realize a transcrição de áudio em tempo real usando o Whisper.

API / Uso

API GRPC ⚡

 from pathlib import Path
from nos . client import Client

client = Client ()

model = client . Module ( "openai/whisper-small.en" )
with client . UploadFile ( Path ( "audio.wav" )) as remote_path :
  response = model ( path = remote_path )
# {"chunks": ...}

Rest API

curl 
-X POST http://localhost:8000/v1/infer/file 
-H ' accept: application/json ' 
-H ' Content-Type: multipart/form-data ' 
-F ' model_id=openai/whisper-small.en ' 
-F ' [email protected] '

? Detecção de objetos (Yolox-As-A-Service)

Execute tarefas clássicas de visão de computador em 2 linhas de código.

API / Uso

API GRPC ⚡

 from pathlib import Path
from nos . client import Client

client = Client ()

model = client . Module ( "yolox/medium" )
response = model ( images = [ Image . open ( "image.jpg" )])

Rest API

curl 
-X POST http://localhost:8000/v1/infer/file 
-H ' accept: application/json ' 
-H ' Content-Type: multipart/form-data ' 
-F ' model_id=yolox/medium ' 
-F ' [email protected] '

Modelos modelos personalizados

Quer executar modelos não suportados pela NOS? Você pode adicionar facilmente seus próprios modelos seguindo os exemplos no playground da NOS.

? Licença

Este projeto está licenciado sob a licença Apache-2.0.

? Telemetria

O NOS coleta dados de uso anônimo usando sentinela. Isso é usado para nos ajudar a entender como a comunidade está usando o NOS e para nos ajudar a priorizar os recursos. Você pode optar por exclusão de telemetria definindo NOS_TELEMETRY_ENABLED=0 .

? Contribuindo

Congratulamo -nos com contribuições! Consulte nosso guia contribuinte para obter mais informações.

? Links rápidos

Envie -nos um e -mail em [email protected] ou junte -se à nossa discórdia para obter ajuda.
Siga-nos no Twitter e no LinkedIn para manter-se atualizado em nossos produtos.

<estilo> .md-tipo H1, .md-content__button {display: Nenhum; } </style>

Expandir

Informações adicionais

Versão v0.3.0
Tipo Outro código-fonte
Data da Última Atualização 2025-03-09
tamanho 12.44MB
Vindo de Github

Aplicativos Relacionados

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos