أطلقت MISTRAL AI مؤخرًا نموذجًا لغويًا جديدًا يسمى SABA ، والذي يركز على تحسين فهم الاختلافات اللغوية والثقافية في الشرق الأوسط وجنوب شرق آسيا. تمثل هذه الخطوة المبتكرة خطوة مهمة في التطبيق الإقليمي لتقنيات الذكاء الاصطناعي ، وخاصة في المعالجة متعددة اللغات والقدرة على التكيف الثقافي.
يحتوي نموذج SABA على 24 مليار معلمة ، وعلى الرغم من أصغر من العديد من المنافسين ، فإن Mistral AI يدعي أنه يوفر سرعات أعلى وخفض التكاليف مع ضمان الدقة. قد تكون الهندسة المعمارية مشابهة لنموذج Mistral Small3. SABA قادرة على التشغيل بكفاءة على أنظمة منخفضة الأداء ، وحتى في إعداد GPU واحد يمكن أن يحقق سرعات أكثر من 150 رمز في الثانية. تتيح هذه الكفاءة SABA أداء أداء ممتاز في بيئات محدودة الموارد ، مما يوفر لمزيد من المستخدمين حلول منظمة العفو الدولية المريحة.

هذا النموذج جيد بشكل خاص في التعامل مع اللغة العربية والهندية ، بما في ذلك جنوب الهندية ، مثل التاميل والمالايالامية. تظهر معايير Mistral AI أن Saba تتفوق باللغة العربية مع الحفاظ على قدرات مماثلة للغة الإنجليزية. إن إمكانية المعالجة متعددة اللغات تجعل SABA لديها آفاق تطبيق واسعة في التواصل بين الثقافات والبيئات متعددة اللغات.
تم تطبيق SABA في سيناريوهات الحياة الواقعية ، بما في ذلك المساعدين الافتراضيين العربيين والأدوات المخصصة في قطاعات الطاقة والأسواق المالية وقطاعات الرعاية الصحية. يمكّنه فهمه للتعابير المحلية والمراجع الثقافية من توليد المحتوى بشكل فعال في مجال معين. مكّن هذا الفهم الثقافي العميق SABA من أداء جيد في تقديم خدمات ودعم مخصصة ، وتلبية الاحتياجات المتنوعة للمستخدمين في مناطق مختلفة.
يمكن للمستخدمين الوصول إلى SABA من خلال واجهات برمجة التطبيقات المدفوعة أو عمليات النشر المحلية. مثل النماذج الأخرى من Mistral AI ، فإن Saba ليس نموذجًا مفتوحًا المصدر. يضمن هذا النموذج التجاري أن يمكن أن يستمر Mistral AI في الاستثمار في البحث والتطوير وتزويد المستخدمين بمنتجات وخدمات عالية الجودة.

يوضح اختبار Mistral القياسي أن Saba يعمل بشكل جيد باللغة العربية ولديه مهارات إنجليزية قابلة للمقارنة | المصدر: Mistral AI
يعكس إطلاق SABA انتباه حقل الذكاء الاصطناعي لاحتياجات نماذج اللغة في مناطق محددة. يتم إجراء أبحاث مماثلة من قبل منظمات أخرى مثل مشروع OpenGPT-X (إصدار طراز Teuken-7B) ، و Openai (تطوير نموذج GPT-4 الياباني) ومشروع Eurolingua (مع التركيز على اللغات الأوروبية). يوضح هذا الاتجاه أن مطوري الذكاء الاصطناعى في جميع أنحاء العالم يستجيبون بنشاط لتحديات التنوع متعدد اللغات والثقافي وتعزيز تعميم وتطبيق تقنيات الذكاء الاصطناعي في جميع أنحاء العالم.
تعتمد نماذج اللغة الكبيرة التقليدية بشكل أساسي على عدد كبير من مجموعات البيانات النصية الإنجليزية للتدريب ، ومن السهل تجاهل الفروق الدقيقة للغات المحددة. تهدف SABA إلى ملء هذه الفجوة وتوفير قدرات معالجة اللغة أكثر دقة وأكثر تتماشى مع السياق الثقافي المحلي. يجعل هذا التصميم المستهدف SABA أداءً جيدًا في بيئات محددة ولغة وبيئات ثقافية ، مما يوفر للمستخدمين خدمات أكثر دقة وتخصيصًا.