model_server download - model_server Quellcode herunterladen

model_server

Anderer Quellcode

ver 2024.5

Herunterladen

OpenVino ™ Model Server

Model Server hostet Modelle und macht sie über Standard -Netzwerkprotokolle für Softwarekomponenten zugänglich: Ein Client sendet eine Anforderung an den Modellserver, der die Modellinferenz ausführt und eine Antwort an den Client zurücksendet. Modellserver bietet viele Vorteile für die effiziente Modellbereitstellung:

Remote -Inferenz ermöglicht es, leichte Clients mit nur den erforderlichen Funktionen zu verwenden, um API -Aufrufe an Edge- oder Cloud -Bereitstellungen auszuführen.
Anwendungen sind unabhängig vom Modell -Framework, dem Hardware -Gerät und der Infrastruktur.
Client -Anwendungen in jeder Programmiersprache, die Rest- oder GRPC -Aufrufe unterstützt, können verwendet werden, um Inferenz auf dem Modellserver auszuführen.
Kunden benötigen weniger Updates, da Kundenbibliotheken sehr selten ändern.
Modelltopologie und Gewichte werden nicht direkt an Client -Anwendungen ausgesetzt, wodurch der Zugriff auf das Modell einfacher gesteuert wird.
Ideale Architektur für mikroservices basierte Anwendungen und Bereitstellungen in Cloud-Umgebungen-einschließlich Kubernetes und OpenShift-Clustern.
Effiziente Ressourcennutzung mit horizontaler und vertikaler Inferenzskalierung.

OVMS -Diagramm

OpenVino ™ Model Server (OVMS) ist ein Hochleistungssystem zum Servieren von Modellen. Der Modellserver wird in C ++ für die Skalierbarkeit implementiert und für die Bereitstellung für Intel -Architekturen optimiert und verwendet dieselbe Architektur und API wie TensorFlow -Serving und KSERVE, während OpenVino für die Ausführung von Inferenz angewendet wird. Der Inferenzdienst wird über GRPC oder REST -API erbracht, wodurch die Bereitstellung neuer Algorithmen und KI -Experimente einfacher wird.

OVMS -Bild

Die vom Server verwendeten Modelle müssen lokal gespeichert oder von Objektspeicherdiensten remote gehostet werden. Weitere Informationen finden Sie in der Vorbereitung der Modell -Repository -Dokumentation. Modellserver arbeitet in Docker -Containern, auf Bare Metal und in Kubernetes -Umgebung. Verwenden Sie den OpenVino-Modellserver mit einem schnellen Servingbeispiel aus dem QuickStart-Handbuch oder erkunden Sie den Model Server-Funktionen.

Lesen Sie Release -Notizen, um herauszufinden, was neu ist.

Schlüsselmerkmale:

[Neu] Texteinbettungen, die mit OpenAI -API kompatibel sind
[Neu] neu kompatibel mit Cohere -API
[Neu] effiziente Textgenerierung über OpenAI -API
Python -Code -Ausführung
GRPC -Streaming
MediaPipe -Diagramme
Modellverwaltung - einschließlich Modellversioning- und Modellaktualisierungen in der Laufzeit
Dynamische Modelleingaben
Regie Acyclic Graph Scheduler zusammen mit benutzerdefinierten Knoten in DAG -Pipelines
Metriken - Metriken kompatibel mit Prometheus Standard
Unterstützung für mehrere Frameworks wie TensorFlow, Paddlepaddle und Onnx
Unterstützung für KI -Beschleuniger

Hinweis: OVMS wurde auf Redhat und Ubuntu getestet. Die neuesten öffentlich veröffentlichten Docker -Bilder basieren auf Ubuntu und UBI. Sie werden in: sie gelagert:

Dockerhub
Redhat -Ökosystemkatalog

Führen Sie OpenVino Model Server aus

Eine Demonstration zur Verwendung von OpenVino-Modellserver finden Sie in unserem Quick-Start-Handbuch für Vision Use Case und LLM-Textgenerierung. Weitere Informationen zur Verwendung des Modellservers in verschiedenen Szenarien finden Sie in den folgenden Anleitungen:

Modellrepository -Konfiguration
Bereitstellungsoptionen
Leistungsstimmung
Regie acyclischer Graphenplaner
Entwicklung von benutzerdefinierten Knoten
Diente staatliche Modelle
Bereitstellen mithilfe eines Kubernetes -Helm -Diagramms
Bereitstellung mit dem Kubernetes -Operator
Verwenden von Binäreingabedaten

Referenzen

OpenVino ™
Tensorflow Serving
GRPC
RESTful -API
Benchmarking -Ergebnisse
Geschwindigkeits- und Skalierung von AI -Inferenzvorgängen über mehrere Architekturen hinweg - Webinaraufzeichnung
Was ist neu in OpenVino Model Server C ++
Capital Health verbessert die Schlaganfallversorgung mit KI - Anwendungsfallbeispiel