في الآونة الأخيرة، حققت العديد من شركات الذكاء الاصطناعي الرائدة تقدمًا كبيرًا في مجال نماذج اللغات واسعة النطاق وأطلقت نماذج وميزات جديدة تهدف إلى تحسين أداء النموذج وتجربة المستخدم. وتغطي هذه التحديثات تحسين طول السياق، وتحسين بنية النموذج ودعم التطبيقات على مستوى المؤسسة، مما يمثل التطور المستمر والنضج لتكنولوجيا الذكاء الاصطناعي. ستركز هذه المقالة على أحدث النتائج التي أصدرتها مؤخرًا AI21 Labs وMistral AI وCohere.
أصدرت AI21 أول نموذج Jamba لمستوى إنتاج Mamba في العالم، والذي يعتمد بنية SSM-Transformer، ويحتوي على معلمات 52B ويدعم طول السياق 256K. يجمع نموذج Jamba بين تقنية SSM وهندسة المحولات ويؤدي أداءً جيدًا في معالجة المهام النصية الطويلة. أطلقت MistralAI Mistral7Bv0.2BaseModel، مما أدى إلى زيادة السياق إلى 32 كيلو بايت، وتسعى جاهدة لتوفير حلول أفضل للذكاء الاصطناعي. أصدرت Cohere Command-R، مع التركيز على تنفيذ الذكاء الاصطناعي على نطاق الإنتاج وتزويد المؤسسات بنماذج توليدية قابلة للتطوير.
ويدل إطلاق هذه النماذج الجديدة على حيوية الابتكار المستمر في مجال الذكاء الاصطناعي، كما يشير إلى أن النماذج اللغوية واسعة النطاق ستتطور في اتجاه أكثر كفاءة وقوة في المستقبل. ستوفر نافذة السياق الأطول وبنية النموذج الأكثر قوة للمستخدمين تجربة تطبيق أكثر ثراءً وتوفر أساسًا أكثر صلابة لتطبيقات الذكاء الاصطناعي على مستوى المؤسسة. ونحن نتطلع إلى رؤية المزيد من الابتكارات في المستقبل.