Téléchargement nos - Téléchargement du code source nos

nos

Autre code source

v0.3.0

Télécharger

Nos est un serveur d'inférence Pytorch rapide et flexible qui s'exécute sur n'importe quel cloud ou AI HW.

Caractéristiques clés

? ‍ Facile à utiliser : construit pour Pytorch et conçu pour optimiser, servir et les modèles Pytorch à l'échelle automatique en production sans compromettre l'expérience du développeur.
? Multi-modal et multimodel : servir plusieurs modèles d'IA fondamentaux (LLMS, diffusion, intégres, discours au texte et détection d'objets) simultanément, dans un seul serveur.
HW-Aware Runtime: Déployez les modèles Pytorch sans effort sur les accélérateurs d'IA modernes (NVIDIA GPUS, AWS Inferentia2, AMD - à venir bientôt et même CPU).
☁️ CONTAGEMENTS AGNOSTIQUES Cloud: Exécutez sur n'importe quel cloud (AWS, GCP, Azure, Lambda Labs, sur site) avec nos conteneurs de serveur d'inférence prêt à l'emploi.

Quoi de neuf

[Février 2024] ✍️ [Blog] Présentation de l'exécution NOS Inferentia2 ( inf2 ).
[Janvier 2024] ✍️ [Blog] servant des LLM sur un budget avec SkyServe.
[Janvier 2024] [Docs] Page d'intégration NOS X Skypilot!
[Janvier 2024] ✍️ [Blog] Le début des tutoriels NOS est disponible ici!
[Déc. 2023] ? [Repo] Nous avons ouvert le terrain de jeu nos pour vous aider à démarrer avec plus d'exemples construits sur NOS!

Start

Nous vous recommandons fortement d'aller à notre guide QuickStart pour commencer. Pour installer le client nos, vous pouvez exécuter la commande suivante:

conda create -n nos python=3.8 -y
conda activate nos
pip install torch-nos

Une fois le client installé, vous pouvez démarrer le serveur NOS via le CLI NOS serve . Cela détectera automatiquement votre environnement local, téléchargera l'image d'exécution Docker et fera tourner le serveur NOS:

nos serve up --http --logging-level INFO

Vous êtes maintenant prêt à exécuter votre première demande d'inférence avec nos! Vous pouvez exécuter l'une des commandes suivantes pour essayer les choses. Vous pouvez définir le niveau de journalisation pour DEBUG si vous souhaitez des informations plus détaillées du serveur.

? ‍ Que peut faire nos?

Agents CHAT / LLM (Chatgpt-as-a-Service)

NOS fournit un serveur compatible OpenAI avec prise en charge de streaming afin que vous puissiez connecter votre client LLM OpenAI-compatible préféré pour parler à nos.

API / utilisation

API GRPC ⚡

 from nos . client import Client

client = Client ()

model = client . Module ( "TinyLlama/TinyLlama-1.1B-Chat-v1.0" )
response = model . chat ( message = "Tell me a story of 1000 words with emojis" , _stream = True )

API REST

curl 
-X POST http://localhost:8000/v1/chat/completions 
-H " Content-Type: application/json " 
-d ' {
    "model": "TinyLlama/TinyLlama-1.1B-Chat-v1.0",
    "messages": [{
        "role": "user",
        "content": "Tell me a story of 1000 words with emojis"
    }],
    "temperature": 0.7,
    "stream": true
  } '

? ️ Génération d'images (stable-diffusion-as-a-service)

Construisez des bots de discorde MidJourney en quelques secondes.

API / utilisation

API GRPC ⚡

 from nos . client import Client

client = Client ()

sdxl = client . Module ( "stabilityai/stable-diffusion-xl-base-1-0" )
image , = sdxl ( prompts = [ "hippo with glasses in a library, cartoon styling" ],
              width = 1024 , height = 1024 , num_images = 1 )

API REST

curl 
-X POST http://localhost:8000/v1/infer 
-H ' Content-Type: application/json ' 
-d ' {
    "model_id": "stabilityai/stable-diffusion-xl-base-1-0",
    "inputs": {
        "prompts": ["hippo with glasses in a library, cartoon styling"],
        "width": 1024, "height": 1024,
        "num_images": 1
    }
} '

? Texte et introduction à l'image (clip-as-a-service)

Construisez une recherche sémantique évolutive d'images / vidéos en quelques minutes.

API / utilisation

API GRPC ⚡

 from nos . client import Client

client = Client ()

clip = client . Module ( "openai/clip-vit-base-patch32" )
txt_vec = clip . encode_text ( texts = [ "fox jumped over the moon" ])

API REST

curl 
-X POST http://localhost:8000/v1/infer 
-H ' Content-Type: application/json ' 
-d ' {
    "model_id": "openai/clip-vit-base-patch32",
    "method": "encode_text",
    "inputs": {
        "texts": ["fox jumped over the moon"]
    }
} '

? ️ Transcription audio (Whisper-as-a-Service)

Effectuez la transcription audio en temps réel à l'aide de Whisper.

API / utilisation

API GRPC ⚡

 from pathlib import Path
from nos . client import Client

client = Client ()

model = client . Module ( "openai/whisper-small.en" )
with client . UploadFile ( Path ( "audio.wav" )) as remote_path :
  response = model ( path = remote_path )
# {"chunks": ...}

API REST

curl 
-X POST http://localhost:8000/v1/infer/file 
-H ' accept: application/json ' 
-H ' Content-Type: multipart/form-data ' 
-F ' model_id=openai/whisper-small.en ' 
-F ' [email protected] '

? Détection d'objet (Yolox-As-A-Service)

Exécutez des tâches classiques de vision informatique en 2 lignes de code.

API / utilisation

API GRPC ⚡

 from pathlib import Path
from nos . client import Client

client = Client ()

model = client . Module ( "yolox/medium" )
response = model ( images = [ Image . open ( "image.jpg" )])

API REST

curl 
-X POST http://localhost:8000/v1/infer/file 
-H ' accept: application/json ' 
-H ' Content-Type: multipart/form-data ' 
-F ' model_id=yolox/medium ' 
-F ' [email protected] '

⚒️ Modèles personnalisés

Vous voulez exécuter des modèles non pris en charge par nos? Vous pouvez facilement ajouter vos propres modèles en suivant les exemples du terrain de jeu NOS.

? Licence

Ce projet est concédé sous licence Apache-2.0.

? Télémétrie

NOS recueille des données d'utilisation anonymes à l'aide de Sentry. Ceci est utilisé pour nous aider à comprendre comment la communauté utilise les NOS et pour nous aider à hiérarchiser les fonctionnalités. Vous pouvez désactiver la télémétrie en définissant NOS_TELEMETRY_ENABLED=0 .

? Contributif

Nous accueillons les contributions! Veuillez consulter notre guide de contribution pour plus d'informations.

? Liens rapides

Envoyez-nous un e-mail à [email protected] ou rejoignez notre discorde pour obtenir de l'aide.
Suivez-nous sur Twitter et LinkedIn pour nous tenir à jour sur nos produits.

Développer

Informations supplémentaires

Version v0.3.0
Type Autre code source
Date de mise à jour 2025-03-09
taille 12.44MB
Provenant de Github

Applications connexes

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout