model_server下載model_server源代碼下載

model_server

其他源碼

ver 2024.5

下載

OpenVino™模型服務器

Model Server託管模型，並使它們可以通過標準網絡協議可以通過軟件組件訪問：客戶端將請求發送到模型服務器，該模型服務器執行模型推理並將響應發送回客戶端。 Model Server為有效的模型部署提供了許多優勢：

遠程推理可以使用僅具有必要功能的輕量級客戶端執行對邊緣或云部署的API調用。
應用程序獨立於模型框架，硬件設備和基礎架構。
任何支持REST或GRPC調用的編程語言中的客戶端應用程序都可以用於在模型服務器上遠程運行。
客戶端庫的更改很少，因此客戶需要更少的更新。
模型拓撲和權重不會直接暴露於客戶端應用程序，從而更容易控制對模型的訪問。
基於微服務的應用程序和雲環境中的部署的理想體系結構，包括Kubernetes和OpenShift群集。
水平和垂直推理縮放的有效資源利用。

OVMS圖

OpenVino™Model Server（OVM）是用於服務模型的高性能係統。該模型服務器在C ++中實現，以用於可擴展性，並針對英特爾體系結構進行了優化，在應用OpenVino進行推理執行時，使用了與TensorFlow Serving和Kserve相同的體系結構和API。推理服務是通過GRPC或REST API提供的，使部署新算法和AI實驗變得容易。

OVMS圖片

服務器使用的模型需要在本地存儲或通過對象存儲服務遠程託管。有關更多詳細信息，請參閱準備模型存儲庫文檔。模型服務器在Docker容器，裸機和Kubernetes環境中的工作。從QuickStart指南或探索模型服務器功能中使用OpenVino Model Server使用OpenVino Model Server。

閱讀發行說明以找出什麼新功能。