Eunoia-plus: نظام Chitchat للمجال المفتوح
Eunoia-Plus هو نظام تشيتشات مفتوح المجال المفتوح يدمج عدة وحدات منظمة العفو الدولية لإنشاء محادثات ديناميكية وذكية وطبيعية. تم تصميم النظام باستخدام بنية متعددة الوحدات ، مما يتيح له فهم مدخلات المستخدمين والاستجابة لها عبر مجموعة واسعة من المجالات ، بما في ذلك الطقس والعملة والمزيد.
سمات
العمارة المعيارية : ينقسم النظام إلى أربع وحدات رئيسية:
- فهم اللغة الطبيعية (NLU) : يستخدم نموذج Roberta الذي تم ضبطه لاكتشاف نوايا المستخدم واستخراج المعلومات اللازمة بدقة عالية.
- التحقق من صحة القصد : يضمن نموذج قائم على XgBoost صحة النوايا المكتشفة ، والتعامل مع نوايا غامضة ومتداخلة بكفاءة.
- تتبع حالة الحوار (DST) : تتبع حالة المحادثة باستخدام كل من أساليب Turbo المستندة إلى القواعد و GPT-3.5 ، مما يوفر المرونة في إدارة تدفق المحادثة.
- توليد الإجابة : يستخدم نماذج Bloom و T5 لتوليد استجابات متماسكة ومناسبة سياقًا.
الدعم لمختلف الهياكل النية : يتعامل مع أربع فئات من النوايا:
- نوايا بدون فتحات.
- نوايا مع فتحات اختيارية.
- نوايا تتطلب فتحة واحدة أساسية.
- نوايا تتطلب فتحات أساسية متعددة.
دقة عالية : يوفر النظام دقة عالية عبر عدة مقاييس:
- وحدة NLU: 96 ٪ دقة اكتشاف النية ، دقة ملء الفتحة 97 ٪.
- التحقق من صحة القصد: 95 ٪ دقة.
- تتبع حالة الحوار: دقة 92 ٪ باستخدام الأساليب القائمة على القواعد ، مع دقة السياق المعززة عبر الأساليب المستندة إلى GPT.
- توليد الإجابة: ينتج عن الاستجابات ذات الصلة من خلال الاستفادة من تاريخ المحادثة والدولة.
الاستخدام
- تم تصميم النظام للتعامل مع المحادثات متعددة المنعطفات بناءً على مجموعة بيانات المجال المفتوح.
- يمكن للمستخدمين التفاعل مع النظام عبر سطر الأوامر أو دمجه في منصات أو تطبيقات محادثة أخرى.
- تتيح البنية المعيارية تخصيصًا سهلاً ، مما يجعله قابلاً للتكيف مع مجالات أو نوايا مختلفة.
هيكل المشروع
-
nlu/ : يحتوي على رمز لوحدة فهم اللغة الطبيعية وبياناتها. -
api/ : يحتوي على رمز API لاتصال النموذج الذي تم ضبطه كخادم. -
intent_validation/ : الوحدة النمطية المستندة إلى xgboost للتحقق من الصحة المكتشفة. -
dst/ : القاعدة المستندة إلى الحوار و GPT-3.5 الحوار القائم على تطبيقات تتبع الدولة. -
answer_generation/ : نماذج توليد الإجابة ، بما في ذلك Bloom و T5.
النماذج المستخدمة
- روبرتا : للكشف عن القصد وملء الفتحة.
- XgBoost : للتحقق من صحة القصد وضمان دقة نية موثوقة.
- GPT-3.5 Turbo : لتتبع حالة الحوار المتقدم باستخدام التعلم قليلًا.
- بلوم و T5 : لتوليد الاستجابات ذات الصلة بالسياق.
أداء
تم تقييم النظام باستخدام العديد من المقاييس الرئيسية:
- الكشف عن القصد : 96 ٪ دقة.
- حشوة الفتحة : 97 ٪ دقة.
- التحقق من صحة القصد : 95 ٪ دقة.
- تتبع حالة الحوار :
- القاعدة القائمة: 92 ٪ دقة الدولة.
- GPT المستند إلى GPT: 69.94 ٪ الدقة الإجمالية (ناتج NLU) ، طلاقة 100 ٪ (تدفق المحادثة).