يستضيف الخادم النموذج النماذج ويجعلها في متناول مكونات البرامج عبر بروتوكولات الشبكة القياسية: يرسل العميل طلبًا إلى خادم النموذج ، والذي يؤدي استنتاج النموذج ويرسل استجابة إلى العميل. يوفر خادم النموذج العديد من المزايا لنشر النموذج الفعال:

OpenVino ™ Model Server (OVMS) هو نظام عالي الأداء لخدمة النماذج. يتم تنفيذه في C ++ من أجل قابلية التوسع والمحسّنة للنشر على بنيات Intel ، ويستخدم خادم النموذج نفس الهندسة المعمارية و API مثل خدمة TensorFlow و KServe أثناء تطبيق OpenVino لتنفيذ الاستدلال. يتم توفير خدمة الاستدلال عبر GRPC أو REST API ، مما يجعل نشر خوارزميات جديدة وتجارب منظمة العفو الدولية سهلة.

يجب تخزين النماذج المستخدمة من قبل الخادم محليًا أو استضافتها عن بُعد بواسطة خدمات تخزين الكائنات. لمزيد من التفاصيل ، راجع إعداد وثائق مستودع النموذج. يعمل خادم النموذج داخل حاويات Docker ، على المعدن العاري ، وفي بيئة Kubernetes. ابدأ باستخدام خادم OpenVino Model مع مثال التقديم السريع من دليل QuickStart أو استكشاف ميزات خادم النموذج.
اقرأ ملاحظات الإصدار لمعرفة ما هو جديد.
ملاحظة: تم اختبار OVMS على Redhat ، و Ubuntu. تستند أحدث صور Docker التي تم إصدارها بشكل عام على Ubuntu و UBI. يتم تخزينها في:
يمكن العثور على عرض توضيحي حول كيفية استخدام خادم OpenVino Model Server في دليل البدء السريع الخاص بنا لحالة استخدام الرؤية وتوليد نص LLM. لمزيد من المعلومات حول استخدام خادم النموذج في سيناريوهات مختلفة ، يمكنك التحقق من الأدلة التالية:
تكوين مستودع النموذج
خيارات النشر
ضبط الأداء
جدولة الرسم البياني الأعماق الموجه
تطوير العقد المخصصة
خدمة نماذج الدولة
نشر باستخدام مخطط Helm Kubernetes
النشر باستخدام مشغل Kubernetes
باستخدام بيانات الإدخال الثنائية
Openvino ™
تنسورفورو الخدمة
GRPC
API راحة
نتائج القياس
عمليات الاستدلال للسرعة والسرعة عبر البنية المتعددة - تسجيل ندوة عبر الإنترنت
ما هو جديد في OpenVino Model Server C ++
تعمل Capital Health على تحسين رعاية السكتة الدماغية مع AI - مثال استخدام الحالة
إذا كان لديك سؤال أو طلب ميزة أو تقرير الأخطاء ، فلا تتردد في تقديم مشكلة github.
* يمكن المطالبة بأسماء وعلامات تجارية أخرى كممتلكات للآخرين.