Google Gemini EXP 1114 خارج أي مكان! أول معركة سحق GPT -4 ، وتوصلت تقييمات القدرة المتعددة إلى القمة لصدمة الصناعة - مقالات الذكاء الاصطناعي

الكاتب：Eve Cole وقت التحديث：2025-02-06 00:16:01

حقق الإصدار التجريبي لـ Google DeepMind (EXP1114) إنجازات رائعة على منصة chatbot Arena في أكثر من أسبوع من الاختبارات المجتمعية ، وقد تجاوزت العديد من المنافسين بميزة مطلقة لأكثر من 6000 صوت ، وقد تم تحقيق قوته الشاملة بالكامل. يعرض. تظهر نتائج الاختبار أن الجوزاء EXP-1114 مرتبط بالمركز الأول مع GPT-4-Latest في الدرجات الإجمالية ، وأخذ زمام المبادرة في العديد من المجالات الرئيسية مثل الرياضيات ، والمعالجة السريعة المعقدة ، والكتابة الإبداعية ، والتي تُظهرها المتعددة القوية- القدرات. هذا يمثل زيادة كبيرة في القدرة التنافسية لـ Google في مجال نماذج AI.

حقق أحدث إصدار تجريبي لـ Google DeepMind من Gemini (Exp1114) نتائج رائعة على منصة chatbot Arena. بعد أكثر من أسبوع من الاختبارات المجتمعية ، تم إظهار بيانات أكثر من 6000 صوت بشكل تراكمي أن هذا النموذج الجديد يتجاوز منافسيه بميزة كبيرة ويظهر قوة مذهلة في مجالات رئيسية متعددة.

من حيث التقييمات الإجمالية ، تعادل Gemini-EXP-1114 للمركز الأول مع GPT-4-Latest مع درجات ممتازة من أكثر من 40 نقطة ، متجاوزًا إصدار GPT-4-Preview الرائد سابقًا. الأمر الأكثر إثارة للدهشة هو أن النموذج قد وصل إلى القمة في الحقول الأساسية مثل الرياضيات والمطالبات المعقدة والكتابة الإبداعية ، مما يدل على قوة شاملة قوية للغاية.

على وجه التحديد ، تقدم Gemini-EXP-1114 مثير للإعجاب:

من رقم 3 إلى الأعلى في الترتيب الكلي

ارتفع تقييم القدرة الرياضية من الثالث إلى الأول

ارتفعت المعالجة السريعة المعقدة من الرابع إلى المركز الأول

تم تحسين أداء الكتابة الإبداعية من المركز الثاني إلى المركز الأول

إمكانات المعالجة البصرية أيضا المرتبة الأولى

كما تم تحسين مستوى البرمجة من الخامس إلى الثالث

أطلقت Google AI Studio رسميًا هذا الإصدار الجديد للمستخدمين لتجربة ذلك في الممارسة العملية. ومع ذلك ، أعرب المجتمع أيضًا عن قلقه بشأن بعض القضايا المحددة ، مثل ما إذا كان الحد الأقصى من 1000 رمز لا يزال موجودًا ، وكيفية التعامل مع مشكلات التطبيق العملية مثل إخراج النص الطويل.

يعتقد محللو الصناعة أن هذا التقدم المفروض يوضح أن استثمار Google على المدى الطويل في مجال الذكاء الاصطناعى قد بدأ في جني النتائج. ومن المثير للاهتمام ، أن النموذج يحافظ على تصنيفه الرابع في السيطرة على الأسلوب ، مما قد يعني أن فريق التطوير قد تبنى نهجًا جديدًا بعد التدريب بدلاً من إجراء تغييرات على نموذج ما قبل التدريب.

وقد أثار هذا الاختراق الرئيسي أيضًا مناقشات حول هيكل الصناعة. استخدم Openai لإطلاق منتجات جديدة عندما أصدر المنافسون تحديثات مهمة ، ولكن هذه المرة جذب تقدم Google انتباه الصناعة. يعتقد بعض الناس أن هذا قد يعبّر بوصول Gemini2 ، وأن القدرة التنافسية لـ Google في مجال النماذج الكبيرة تتحسن بشكل كبير.

لا يوضح الأداء المتميز لـ Gemini-EXP-1114 قوة Google القوية في مجال الذكاء الاصطناعي فحسب ، بل يوفر أيضًا مصدر إلهام جديد لاتجاه التطوير المستقبلي لتكنولوجيا الطراز الكبيرة ، والذي يستحق التطلع إليه في المستقبل.