Descarga nos - Descarga del código fuente nos

nos

Otro código fuente

v0.3.0

Descargar

NOS es un servidor de inferencia de Pytorch rápido y flexible que se ejecuta en cualquier nube o AI HW.

Características clave

? ‍ Fácil de usar : construido para Pytorch y diseñado para optimizar, servir y a la auto-modelos de Pytorch en producción sin comprometer la experiencia del desarrollador.
? Multi-modales y multimodelo : sirva múltiples modelos de IA fundamentales (LLMS, difusión, incrustaciones, detección de voz a texto y objetos) simultáneamente, en un solo servidor.
Tiempo de ejecución de HW -Award: implementa modelos Pytorch sin esfuerzo en los aceleradores de IA modernos (GPU NVIDIA, AWS Inferentia2, AMD - Próximamente e incluso CPU).
☁️ Contenedores agnósticos de la nube: ejecute cualquier nube (AWS, GCP, Azure, Lambda Labs, On-Prem) con nuestros contenedores de servidor de inferencia listos para usar.

Qué hay de nuevo

[Febrero de 2024] ✍️ [Blog] Presentación del tiempo de ejecución NOS Inferentia2 ( inf2 ).
[Enero de 2024] ✍️ [Blog] Sirviendo a LLMS con un presupuesto con Skyserve.
[Enero de 2024] [Docs] ¡Página de integración de NOS x Skypilot!
[Enero de 2024] ✍️ [Blog] Comenzando con tutoriales de NOS está disponible aquí!
[Dic 2023] ? [Repo] ¡Forzamos el patio de recreo de NOS para ayudarlo a comenzar con más ejemplos construidos sobre NOS!

Inicio rápido

Recomendamos encarecidamente que vaya a nuestra guía QuickStart para comenzar. Para instalar el cliente NOS, puede ejecutar el siguiente comando:

conda create -n nos python=3.8 -y
conda activate nos
pip install torch-nos

Una vez que se instala el cliente, puede iniciar el servidor NOS a través de la CLI NOS serve . Esto detectará automáticamente su entorno local, descargue la imagen de tiempo de ejecución de Docker y gire el servidor NOS:

nos serve up --http --logging-level INFO

¡Ahora está listo para ejecutar su primera solicitud de inferencia con NOS! Puede ejecutar cualquiera de los siguientes comandos para probar las cosas. Puede establecer el nivel de registro en DEBUG si desea información más detallada del servidor.

? ‍ ¿ Qué puede hacer NOS?

Agentes de chat / llm (chatgpt-as-a-service)

NOS proporciona un servidor compatible con OpenAI con soporte de transmisión para que pueda conectar su cliente LLM compatible con OpenAI favorito para hablar con NOS.

API / uso

API de GRPC ⚡

 from nos . client import Client

client = Client ()

model = client . Module ( "TinyLlama/TinyLlama-1.1B-Chat-v1.0" )
response = model . chat ( message = "Tell me a story of 1000 words with emojis" , _stream = True )

API REST

curl 
-X POST http://localhost:8000/v1/chat/completions 
-H " Content-Type: application/json " 
-d ' {
    "model": "TinyLlama/TinyLlama-1.1B-Chat-v1.0",
    "messages": [{
        "role": "user",
        "content": "Tell me a story of 1000 words with emojis"
    }],
    "temperature": 0.7,
    "stream": true
  } '

? ️ Generación de imágenes (Estable-Difusión-As-A-Service)

Construye bots de discordia de mediana edad en segundos.

API / uso

API de GRPC ⚡

 from nos . client import Client

client = Client ()

sdxl = client . Module ( "stabilityai/stable-diffusion-xl-base-1-0" )
image , = sdxl ( prompts = [ "hippo with glasses in a library, cartoon styling" ],
              width = 1024 , height = 1024 , num_images = 1 )

API REST

curl 
-X POST http://localhost:8000/v1/infer 
-H ' Content-Type: application/json ' 
-d ' {
    "model_id": "stabilityai/stable-diffusion-xl-base-1-0",
    "inputs": {
        "prompts": ["hippo with glasses in a library, cartoon styling"],
        "width": 1024, "height": 1024,
        "num_images": 1
    }
} '

? Incrustación de texto e imagen (clip-as-a-service)

Construya búsqueda semántica escalable de imágenes/videos en minutos.

API / uso

API de GRPC ⚡

 from nos . client import Client

client = Client ()

clip = client . Module ( "openai/clip-vit-base-patch32" )
txt_vec = clip . encode_text ( texts = [ "fox jumped over the moon" ])

API REST

curl 
-X POST http://localhost:8000/v1/infer 
-H ' Content-Type: application/json ' 
-d ' {
    "model_id": "openai/clip-vit-base-patch32",
    "method": "encode_text",
    "inputs": {
        "texts": ["fox jumped over the moon"]
    }
} '

? ️ Transcripción de audio (Whisper-as-a-Service)

Realice la transcripción de audio en tiempo real usando Whisper.

API / uso

API de GRPC ⚡

 from pathlib import Path
from nos . client import Client

client = Client ()

model = client . Module ( "openai/whisper-small.en" )
with client . UploadFile ( Path ( "audio.wav" )) as remote_path :
  response = model ( path = remote_path )
# {"chunks": ...}

API REST

curl 
-X POST http://localhost:8000/v1/infer/file 
-H ' accept: application/json ' 
-H ' Content-Type: multipart/form-data ' 
-F ' model_id=openai/whisper-small.en ' 
-F ' [email protected] '

? Detección de objetos (yolox como servicio)

Ejecute tareas clásicas de visión por computadora en 2 líneas de código.

API / uso

API de GRPC ⚡

 from pathlib import Path
from nos . client import Client

client = Client ()

model = client . Module ( "yolox/medium" )
response = model ( images = [ Image . open ( "image.jpg" )])

API REST

curl 
-X POST http://localhost:8000/v1/infer/file 
-H ' accept: application/json ' 
-H ' Content-Type: multipart/form-data ' 
-F ' model_id=yolox/medium ' 
-F ' [email protected] '

⚒️ Modelos personalizados

¿Quieres ejecutar modelos no compatibles con NOS? Puede agregar fácilmente sus propios modelos siguiendo los ejemplos en el patio de juegos de NOS.

? Licencia

Este proyecto tiene licencia bajo la licencia Apache-2.0.

? Telemetría

NOS recopila datos de uso anónimo usando Sentry. Esto se usa para ayudarnos a comprender cómo la comunidad está utilizando NOS y para ayudarnos a priorizar las características. Puede optar por no participar en la telemetría configurando NOS_TELEMETRY_ENABLED=0 .

? Que contribuye

¡Agradecemos las contribuciones! Consulte nuestra guía de contribución para obtener más información.

? Enlaces rápidos

Envíenos un correo electrónico a [email protected] o únase a nuestra discordia para obtener ayuda.
Síganos en Twitter y LinkedIn para mantenerse al día con nuestros productos.

<syle> .md-typeSet H1, .md-content__Button {display: none; } </style>

Expandir

Información adicional

Versión v0.3.0
Tipo Otro código fuente
Fecha de actualización 2025-03-09
tamaño 12.44MB
Proviene de Github

Aplicaciones relacionadas

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo