يوضح تطبيق React هذا الاستدلال ML في المتصفح باستخدام
عرض مباشر في https://aiserv.cloud/.

راجع أيضًا منشور مدونتي الذي ينقل استنتاج ML من السحابة إلى الحافة ونشر نماذج المحولات في المتصفح مع #OnnxRuntime على YouTube.
نموذج التنبؤ العاطفي هو نسخة جيدة من نموذج اللغة التي تم تدريبها مسبقًا Microsoft/Xtremedistil-L6-H384. تم ضبط النموذج بشكل جيد على مجموعة بيانات Goemotions وهي مشكلة تصنيف النص متعددة العلامات.
Goemotions ، مجموعة بيانات من الإنسان المتمثلة في 58K Reddit تعليقات مستخرجة من الفرعية الشهيرة باللغة الإنجليزية وتسمى 27 فئة العاطفة. باعتبارها أكبر مجموعة بيانات العاطفة باللغة الإنجليزية المشروحة بالكامل حتى الآن. على عكس العواطف الستة الأساسية ، والتي تشمل عاطفة إيجابية واحدة فقط (الفرح) ، فإن التصنيف يشمل 12 فئة إيجابية و 11 سلبية و 4 فئات عاطفية غامضة و 1 "محايدة" ، مما يجعلها مناسبة على نطاق واسع لمهام فهم المحادثة التي تتطلب تمايزًا دقيقًا بين تعبيرات العاطفة.
Paper Goemotions: مجموعة بيانات من المشاعر الدقيقة
go_emotions على HUGGINGFACE DATASET HUB.راجع Traingoemotions.ipynb لمعرفة كيفية تدريب نموذج على مجموعة البيانات وتصدير النموذج الذي تم ضبطه إلى ONNX.
يتم تقدير النموذج إلى أوزان int8 ولديه 22 متر معلمة قابلة للتدريب.
الاستدلال متعدد الخيوط. لاستخدام مؤشرات ترابط الاستدلال المتعددة ، يجب تقديم رؤوس HTTP محددة بواسطة CDN ، انظر جعل موقع الويب الخاص بك "يعزز إلى الأصل" باستخدام Coop و Coep.
يتم استخدام ثلاثة مؤشرات ترابط للاستدلال. نظرًا للاضطراب إلى هذا الخطأ ، كان لا بد من تعطيل رؤوس الخيوط المتعددة ورؤوس COOP لأن النموذج سيفشل بصمت في تهيئة أجهزة iOS.
للتنمية ، يضيف SRC/Setupproxy.js الرؤوس المطلوبة. انظر القضية React 10210
تم تدريب نموذج اللغة التي تم تدريبها مسبقًا على نص مع تحيزات ، انظر على مخاطر الببغاوات العشوائية: هل يمكن أن تكون نماذج اللغة كبيرة جدًا؟ لدراسة حول مخاطر نماذج اللغة التي تم تدريبها مسبقًا ونقل التعلم.
من أدوات ورقة مجموعة البيانات: مجموعة بيانات من العواطف الدقيقة:
إخلاء البيانات: نحن ندرك أن مجموعة البيانات تحتوي على تحيزات وليست تمثل التنوع العالمي. نحن ندرك أن مجموعة البيانات تحتوي على محتوى يحتمل أن يكون مشكلة. تشمل التحيزات المحتملة في البيانات: التحيزات المتأصلة في التحيزات في Reddit وحساب المستخدمين ، قوائم الكلمات الهجومية/المبتذلة المستخدمة في تصفية البيانات ، التحيز المتأصل أو اللاوعي في تقييم ملصقات الهوية الهجومية ، كانت كل من المتحدثين باللغة الإنجليزية الأصلية من الهند. كل هذه تؤثر على الأرجح على وضع العلامات والدقة والاستدعاء لنموذج مدرب. تم تدريب النموذج التجريبي العاطفي المستخدم لوضع العلامات على المشاعر ، على أمثلة تمت مراجعتها من قبل فريق البحث. يجب أن يكون أي شخص يستخدم مجموعة البيانات هذه على دراية بهذه القيود في مجموعة البيانات.
تثبيت node.js/npm ، راجع تثبيت node.js
في دليل المشروع ، يمكنك تشغيل:
npm start يدير التطبيق في وضع التطوير.
افتح http: // localhost: 3000 لمشاهدته في متصفحك.
سيتم إعادة تحميل الصفحة عند إجراء تغييرات.
قد ترى أيضًا أي أخطاء في وحدة التحكم في وحدة التحكم.
npm run build يبني التطبيق للإنتاج إلى مجلد build .
تتفاعل حزمها بشكل صحيح في وضع الإنتاج وتحسن البناء للحصول على أفضل أداء.
استنساخ هذا الريبو واستخدم صفحات CloudFlare.