ดาวน์โหลด nos - ดาวน์โหลดซอร์สโค้ด nos

nos

ซอร์สโค้ดอื่น ๆ

v0.3.0

ดาวน์โหลด

เว็บไซต์ | เอกสาร | บทเรียน สนามเด็กเล่น บล็อก | ความไม่ลงรอยกัน

NOS เป็นเซิร์ฟเวอร์การอนุมาน Pytorch ที่รวดเร็วและยืดหยุ่นซึ่งทำงานบนคลาวด์หรือ AI HW ใด ๆ

คุณสมบัติที่สำคัญ

? ‍ ใช้งานง่าย : สร้างขึ้นสำหรับ Pytorch และออกแบบมาเพื่อเพิ่มประสิทธิภาพให้บริการและโมเดล Pytorch ระดับอัตโนมัติในการผลิตโดยไม่ลดทอนประสบการณ์ของนักพัฒนา
- Multi-Modal & Multi-Model : ให้บริการโมเดล AI พื้นฐานหลายแบบ (LLMS, การแพร่กระจาย, Embeddings, คำพูดต่อข้อความและการตรวจจับวัตถุ) พร้อมกันในเซิร์ฟเวอร์เดียว
HW -Aware Runtime: ปรับใช้โมเดล Pytorch ได้อย่างง่ายดายสำหรับเครื่องเร่งความเร็ว AI ที่ทันสมัย (Nvidia GPU, AWS Inferentia2, AMD - เร็ว ๆ นี้และแม้กระทั่งซีพียู)
☁ คอนเทนเนอร์แบบคลาวด์-อ้อย: ทำงานบนคลาวด์ใด ๆ (AWS, GCP, Azure, Lambda Labs, on-Prem) ด้วยคอนเทนเนอร์เซิร์ฟเวอร์การอนุมานพร้อมใช้งานของเรา

มีอะไรใหม่

[ก.พ. 2024] ✍ [บล็อก] แนะนำ NOS Inferentia2 ( inf2 ) รันไทม์
[ม.ค. 2024] ✍ [บล็อก] ให้บริการ LLM ในงบประมาณกับ Skyserve
[ม.ค. 2024] [เอกสาร] หน้าการรวม NOS X Skypilot!
[ม.ค. 2024] ✍ [บล็อก] เริ่มต้นด้วยการสอน NOS มีให้ที่นี่!
[ธ.ค. 2023] ? [repo] เราเปิดสนามเด็กเล่น NOS เพื่อช่วยให้คุณเริ่มต้นด้วยตัวอย่างเพิ่มเติมที่สร้างขึ้นบน NOS!

เร็ว

เราขอแนะนำให้คุณไปที่คู่มือ QuickStart ของเราเพื่อเริ่มต้น ในการติดตั้งไคลเอนต์ NOS คุณสามารถเรียกใช้คำสั่งต่อไปนี้:

conda create -n nos python=3.8 -y
conda activate nos
pip install torch-nos

เมื่อติดตั้งไคลเอนต์แล้วคุณสามารถเริ่มต้นเซิร์ฟเวอร์ NOS ผ่าน NOS serve CLI สิ่งนี้จะตรวจจับสภาพแวดล้อมในพื้นที่ของคุณโดยอัตโนมัติดาวน์โหลดอิมเมจ Docker Runtime และหมุนเซิร์ฟเวอร์ NOS:

nos serve up --http --logging-level INFO

ตอนนี้คุณพร้อมที่จะเรียกใช้คำขออนุมานครั้งแรกกับ NOS! คุณสามารถเรียกใช้คำสั่งใด ๆ ต่อไปนี้เพื่อลองสิ่งต่างๆ คุณสามารถตั้งค่าระดับการบันทึกเพื่อ DEBUG หากคุณต้องการข้อมูลรายละเอียดเพิ่มเติมจากเซิร์ฟเวอร์

nos สามารถทำอะไรได้บ้าง?

ตัวแทนแชท / LLM (chatgpt-as-a-service)

NOS ให้บริการเซิร์ฟเวอร์ที่เข้ากันได้กับ OpenAI พร้อมการสนับสนุนการสตรีมเพื่อให้คุณสามารถเชื่อมต่อไคลเอนต์ LLM ที่เข้ากันได้ของ OpenAI ที่คุณชื่นชอบเพื่อพูดคุยกับ NOS

API / การใช้งาน

grpc api ⚡

 from nos . client import Client

client = Client ()

model = client . Module ( "TinyLlama/TinyLlama-1.1B-Chat-v1.0" )
response = model . chat ( message = "Tell me a story of 1000 words with emojis" , _stream = True )

REST API

curl 
-X POST http://localhost:8000/v1/chat/completions 
-H " Content-Type: application/json " 
-d ' {
    "model": "TinyLlama/TinyLlama-1.1B-Chat-v1.0",
    "messages": [{
        "role": "user",
        "content": "Tell me a story of 1000 words with emojis"
    }],
    "temperature": 0.7,
    "stream": true
  } '

? ️การสร้างภาพ

สร้างบอท Midjourney Discord ในไม่กี่วินาที

API / การใช้งาน

grpc api ⚡

 from nos . client import Client

client = Client ()

sdxl = client . Module ( "stabilityai/stable-diffusion-xl-base-1-0" )
image , = sdxl ( prompts = [ "hippo with glasses in a library, cartoon styling" ],
              width = 1024 , height = 1024 , num_images = 1 )

REST API

curl 
-X POST http://localhost:8000/v1/infer 
-H ' Content-Type: application/json ' 
-d ' {
    "model_id": "stabilityai/stable-diffusion-xl-base-1-0",
    "inputs": {
        "prompts": ["hippo with glasses in a library, cartoon styling"],
        "width": 1024, "height": 1024,
        "num_images": 1
    }
} '

- การฝังข้อความและรูปภาพ (Clip-as-a-service)

สร้างการค้นหาความหมายที่ปรับขนาดได้ของรูปภาพ/วิดีโอในไม่กี่นาที

API / การใช้งาน

grpc api ⚡

 from nos . client import Client

client = Client ()

clip = client . Module ( "openai/clip-vit-base-patch32" )
txt_vec = clip . encode_text ( texts = [ "fox jumped over the moon" ])

REST API

curl 
-X POST http://localhost:8000/v1/infer 
-H ' Content-Type: application/json ' 
-d ' {
    "model_id": "openai/clip-vit-base-patch32",
    "method": "encode_text",
    "inputs": {
        "texts": ["fox jumped over the moon"]
    }
} '

? ️การถอดความเสียง (Whisper-as-a-service)

ทำการถอดความเสียงแบบเรียลไทม์โดยใช้ Whisper

API / การใช้งาน

grpc api ⚡

 from pathlib import Path
from nos . client import Client

client = Client ()

model = client . Module ( "openai/whisper-small.en" )
with client . UploadFile ( Path ( "audio.wav" )) as remote_path :
  response = model ( path = remote_path )
# {"chunks": ...}

REST API

curl 
-X POST http://localhost:8000/v1/infer/file 
-H ' accept: application/json ' 
-H ' Content-Type: multipart/form-data ' 
-F ' model_id=openai/whisper-small.en ' 
-F ' [email protected] '

- การตรวจจับวัตถุ (YOLOX-AS-A-SERVICE)

รันงานการมองเห็นคอมพิวเตอร์แบบคลาสสิกใน 2 บรรทัดของรหัส

API / การใช้งาน

grpc api ⚡

 from pathlib import Path
from nos . client import Client

client = Client ()

model = client . Module ( "yolox/medium" )
response = model ( images = [ Image . open ( "image.jpg" )])

REST API

curl 
-X POST http://localhost:8000/v1/infer/file 
-H ' accept: application/json ' 
-H ' Content-Type: multipart/form-data ' 
-F ' model_id=yolox/medium ' 
-F ' [email protected] '

⚒โมเดลที่กำหนดเอง

ต้องการเรียกใช้โมเดลที่ไม่รองรับโดย NOS หรือไม่? คุณสามารถเพิ่มโมเดลของคุณเองได้อย่างง่ายดายตามตัวอย่างในสนามเด็กเล่น NOS

- ใบอนุญาต

โครงการนี้ได้รับใบอนุญาตภายใต้ใบอนุญาต Apache-2.0

- telemetry

NOS รวบรวมข้อมูลการใช้งานที่ไม่ระบุชื่อโดยใช้ Sentry สิ่งนี้ใช้เพื่อช่วยให้เราเข้าใจว่าชุมชนใช้ NOS และช่วยให้เราจัดลำดับความสำคัญของคุณสมบัติได้อย่างไร คุณสามารถยกเลิกการใช้ telemetry ได้โดยการตั้ง NOS_TELEMETRY_ENABLED=0