لقد بدأ مجال الذكاء الاصطناعي في اختراق كبير ، وأصدر مختبر الأبحاث غير الربحي في Cohere مؤخرًا نموذجًا متعدد الوسائط من الذكاء الاصطناعي يسمى AYA Vision. اجتذب هذا الإنجاز المبتكر اهتمامًا واسع النطاق في هذه الصناعة ويتم الترحيب به من قبل Cohere كواحدة من أكثر التقنيات تقدمًا في الوقت الحالي.

توضح AYA Vision براعة ممتازة ، قادرة على التعامل مع المهام المعقدة بما في ذلك توليد وصف الصورة ، والأسئلة المتعلقة بالصور ، والترجمة النصية ، والإنشاء التجريدي في 23 لغة رئيسية. لتعزيز الأبحاث العلمية العالمية ، توفر Cohere هذه التكنولوجيا مجانًا من خلال منصة WhatsApp ، مما يتيح للباحثين في جميع أنحاء العالم الوصول بسهولة إلى هذا الإنجاز المتطور.

تم تسليط الضوء على Cohere في مدونته الرسمية أنه على الرغم من التقدم الكبير في تكنولوجيا الذكاء الاصطناعي ، لا تزال هناك فجوات مهمة في المعالجة متعددة اللغات والمهام متعددة الوسائط. تتمثل البحث وتطوير AYA Vision في اختراق عنق الزجاجة الفني هذا وتعزيز التطوير الإضافي للذكاء الاصطناعي في مجالات اللغة المتقاطعة والطويلة.
النموذج متاح في نسختين: AYA Vision32B و AYA Vision8B. من بينها ، كان أداء AYA Vision32B جيدًا في العديد من معايير التفاهم البصري ، حتى تجاوز النماذج التنافسية الأكبر ، بما في ذلك رؤية Meta-3.290b. كان أداء AYA Vision8B جيدًا أيضًا ، حيث يتفوق على النماذج عشرة أضعاف حجمها في بعض التقييمات.

تم إصدار هذين النموذجين على وجه منصة تطوير الذكاء الاصطناعى ، ويتم ترخيصهما بموجب Creative Commons4.0 ، ويخضع المستخدمون لشروط الاستخدام المقبولة لـ Cohere ويقتصران على الاستخدام غير التجاري.
فيما يتعلق بأساليب التدريب ، تعتمد Cohere مجموعة بيانات إنجليزية "متنوعة" مبتكرة لتدريب النماذج من خلال تقنيات الترجمة والتعليقات الاصطناعية. يتم إنشاء تقنية التعليقات التوضيحية هذه من قبل الذكاء الاصطناعي. على الرغم من أن لديها قيودًا معينة ، فقد تم تبنيها من قبل العديد من المؤسسات الرائدة ، بما في ذلك Openai ، مما يدل على إمكاناته في تحسين أداء النموذج.
قال Cohere إن استخدام تكنولوجيا التعليقات التوضيحية الاصطناعية لا يحسن كفاءة التدريب فحسب ، بل يقلل أيضًا بشكل كبير من استهلاك الموارد ، مما يعكس المزايا المزدوجة للشركة في الابتكار التكنولوجي وتحسين الموارد.
لدعم المزيد من الأبحاث المتعمقة ، أطلقت Cohere أيضًا AyavisionBench ، وهي أداة تقييم قياسية جديدة. تم تصميم الأداة لتقييم أداء النموذج في المهام المرئية واللغوية مثل التعرف على اختلاف الصورة والميزات المعقدة لقطات الشاشة إلى الرمز.
على خلفية "أزمة التقييم" الحالية في صناعة الذكاء الاصطناعي ، يوفر إطلاق AyavisionBench إطارًا أكثر شمولاً وصعبة لتقييم النموذج ، والذي من المتوقع أن يعزز الابتكار في معايير تقييم الصناعة.
المدونة الرسمية: https://coery.com/blog/aya-vision