Téléchargement model_server - Téléchargement du code source model

model_server

Autre code source

ver 2024.5

Télécharger

Serveur de modèle OpenVino ™

Le serveur modèle héberge les modèles et les rend accessibles aux composants logiciels sur les protocoles réseau standard: un client envoie une demande au serveur de modèles, qui effectue l'inférence du modèle et renvoie une réponse au client. Model Server offre de nombreux avantages pour un déploiement de modèles efficace:

L'inférence à distance permet d'utiliser des clients légers avec uniquement les fonctions nécessaires pour effectuer des appels d'API pour les déploiements de pointes ou de cloud.
Les applications sont indépendantes du cadre du modèle, du périphérique matériel et de l'infrastructure.
Les applications clients dans tout langage de programmation qui prend en charge les appels REST ou GRPC peuvent être utilisées pour exécuter à distance l'inférence sur le serveur de modèles.
Les clients nécessitent moins de mises à jour car les bibliothèques des clients changent très rarement.
La topologie et les poids du modèle ne sont pas exposés directement aux applications des clients, ce qui facilite le contrôle de l'accès au modèle.
Architecture idéale pour les applications et les déploiements basés sur des microservices dans des environnements cloud - y compris les clusters Kubernetes et OpenShift.
Utilisation efficace des ressources avec une échelle d'inférence horizontale et verticale.

Diagramme OVMS

OpenVino ™ Model Server (OVMS) est un système haute performance pour les modèles de service. Implémenté en C ++ pour l'évolutivité et optimisé pour le déploiement sur les architectures Intel, le serveur modèle utilise la même architecture et l'API que TensorFlow Serving et KServe lors de l'application d'OpenVino pour l'exécution d'inférence. Le service d'inférence est fourni via l'API GRPC ou REST, facilitant le déploiement de nouveaux algorithmes et des expériences d'IA.

Image ovms

Les modèles utilisés par le serveur doivent être stockés localement ou hébergés à distance par les services de stockage d'objets. Pour plus de détails, reportez-vous à la préparation de la documentation du référentiel du modèle. Model Server fonctionne à l'intérieur des conteneurs Docker, sur le métal nu et dans l'environnement Kubernetes. Commencez à utiliser OpenVino Model Server avec un exemple de service rapide à partir du guide QuickStart ou explorez les fonctionnalités du serveur de modèles.

Lisez les notes de publication pour découvrir ce qui est nouveau.

Caractéristiques clés:

[Nouveau] Texte des intérêts compatibles avec l'API OpenAI
[Nouveau] Rerranking compatible avec l'API Cohere
[Nouveau] Génération de texte efficace via l'API OpenAI
Exécution du code Python
Streaming GRPC
Graphiques Medipipe servant
Gestion du modèle - y compris le versioning du modèle et les mises à jour du modèle dans l'exécution
Entrées de modèle dynamique
Planiseur de graphiques acycliques réalisé avec les nœuds personnalisés dans les pipelines DAG
Métriques - Métriques compatibles avec la norme Prometheus
Prise en charge de plusieurs frameworks, tels que TensorFlow, Paddlepaddle et ONNX
Support aux accélérateurs de l'IA

Remarque: OVMS a été testé sur Redhat et Ubuntu. Les dernières images Docker publiées publiques sont basées sur Ubuntu et UBI. Ils sont stockés dans:

Docker
Catalogue écosystème de Redhat

Exécuter le serveur de modèle OpenVino

Une démonstration sur la façon d'utiliser le serveur de modèles OpenVino peut être trouvée dans notre guide rapide pour le cas d'utilisation de la vision et la génération de texte LLM. Pour plus d'informations sur l'utilisation du serveur Model dans divers scénarios, vous pouvez vérifier les guides suivants:

Configuration du référentiel du modèle
Options de déploiement
Réglage des performances
Planificateur de graphiques acycliques réalisé
Développement des nœuds personnalisés
Servir des modèles avec état
Déployer à l'aide d'un graphique de casque Kubernetes
Déploiement à l'aide de l'opérateur de Kubernetes
En utilisant des données d'entrée binaires

Références

OpenVino ™
Tensorflow Service
grpc
API RESTFUL
Benchmarking Résultats
Vitesse et échelle des opérations d'inférence AI sur plusieurs architectures - enregistrement du webinaire
Quoi de neuf dans OpenVino Model Server C ++
Capital Health améliore les soins aux AVC avec l'IA - Exemple de cas d'utilisation

Contact

Si vous avez une question, une demande de fonctionnalité ou un rapport de bogue, n'hésitez pas à soumettre un problème GitHub.

* D'autres noms et marques peuvent être revendiqués comme la propriété d'autres.

Développer

Informations supplémentaires

Version ver 2024.5
Type Autre code source
Date de mise à jour 2025-02-26
taille 21MB
Provenant de Github

Applications connexes

server

2024-11-05
Serveur SQL

2009-07-04
Serveur FileZilla

2009-07-03
Serveur FileZilla

2009-07-03
Serveur WinFtp

2009-07-03
Serveur FileZilla

2009-06-22

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Autre code source

1.0.0
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Autre code source

1.0.0

Actualités connexes Tout