يستعد Openai بنشاط لإطلاق نموذج متعدد الوسائط يسمى GPT-Vision ، وهي خطوة يُنظر إليها كمنافسة مباشرة مع Gemini من Google. سيمكن GPT-Vision GPT-4 من الحصول على قدرة معالجة الصور الأوسع ، قادرة على إنشاء نص مرتبط بمحتوى الصورة ، وبالتالي لعب دور مهم في سيناريوهات الاستخدام التي تجمع بين الرؤية واللغة. يمثل إطلاق هذه التكنولوجيا اختراقًا إضافيًا في Openai في مجال الذكاء الاصطناعي متعدد الوسائط ، مما يوفر للمستخدمين تجربة تفاعلية أكثر ذكاءً وبديهية.
بالإضافة إلى GPT-Vision ، يقوم Openai أيضًا بتطوير نموذج آخر من الذكاء الاصطناعي متعدد الوسائط يسمى Gobi ، والذي يُعتقد أنه أساس GPT-5. يركز اتجاه البحث والتطوير الخاص بـ Gobi بشكل أكبر على دمج ومعالجة البيانات متعددة الوسائط ، بهدف تحقيق قدرات أكثر فاعلية وتوليد أكثر كفاءة. يوضح هذا التقدم أن Openai يسرع ابتكار تقنية الذكاء الاصطناعي ووضع أساس متين للتطبيقات الذكية المستقبلية.
تخطط Openai للإعلان عن ميزات جديدة لـ GPT-4 في مؤتمر المطورين في 6 نوفمبر ، والتي جذبت اهتمامًا واسعًا من هذه الصناعة. مع إطلاق GPT-Vision و Gobi ، ستعمل Openai على توحيد قيادتها في مجال الذكاء الاصطناعي ، مع قيادة التطورات التكنولوجية في جميع أنحاء الصناعة. لن تؤدي هذه المنافسة مع Google إلى تسريع تطوير تقنية الذكاء الاصطناعي فحسب ، بل ستجلب أيضًا المزيد من المنتجات والخدمات المبتكرة للمستهلكين.
ليست المنافسة بين Openai و Google مسابقة فقط بين عمالقة التكنولوجيا ، ولكن أيضًا قوة دافعة مهمة لتطوير تكنولوجيا الذكاء الاصطناعي. مع التطور المستمر للنماذج متعددة الوسائط ، ستحقق الذكاء الاصطناعى تكاملًا أعمق في حقول متعددة مثل الصور والنصوص والصوت ، وتزويد المستخدمين بمزيد من الحلول الذكية. سيكون المستفيد النهائي من مسابقة التكنولوجيا هذه هو المستهلكين الذين سيستمتعون بتطبيقات الذكاء الاصطناعى المتقدمة والمريحة.