Openai secara aktif mempersiapkan peluncuran model multimodal yang disebut GPT-Vision, sebuah langkah yang dipandang sebagai kompetisi langsung dengan Gemini Google. GPT-Vision akan memungkinkan GPT-4 untuk memiliki kemampuan pemrosesan gambar yang lebih luas, mampu menghasilkan teks yang terkait dengan konten gambar, sehingga memainkan peran penting dalam skenario penggunaan yang menggabungkan visi dan bahasa. Peluncuran teknologi ini menandai terobosan lebih lanjut di Openai di bidang AI multimodal, memberikan pengguna pengalaman interaktif yang lebih cerdas dan intuitif.
Selain GPT-Vision, Openai juga mengembangkan model AI multimodal lain yang disebut Gobi, yang diyakini sebagai dasar GPT-5. Arah penelitian dan pengembangan Gobi lebih fokus pada integrasi dan pemrosesan data multimodal, yang bertujuan untuk mencapai pemahaman lintas-modal yang lebih efisien dan kemampuan pembangkitan. Kemajuan ini menunjukkan bahwa Openai mempercepat inovasi teknologi AI dan meletakkan dasar yang kuat untuk aplikasi cerdas di masa depan.
Openai berencana untuk mengumumkan fitur baru GPT-4 di konferensi pengembang pada 6 November, yang telah menarik perhatian luas dari industri. Dengan peluncuran GPT-Vision dan Gobi, Openai akan lebih mengkonsolidasikan kepemimpinannya di bidang AI, sementara juga mendorong kemajuan teknologi di seluruh industri. Persaingan dengan Google ini tidak hanya akan mempercepat pengembangan teknologi AI, tetapi juga akan membawa produk dan layanan yang lebih inovatif bagi konsumen.
Persaingan antara Openai dan Google tidak hanya kontes antara dua raksasa teknologi, tetapi juga kekuatan pendorong penting untuk pengembangan teknologi AI. Dengan evolusi model multimodal yang berkelanjutan, AI akan mencapai integrasi yang lebih dalam di berbagai bidang seperti gambar, teks, dan suara, memberikan pengguna solusi yang lebih cerdas. Penerima manfaat utama dari kompetisi teknologi ini adalah konsumen yang akan menikmati aplikasi AI yang lebih maju dan nyaman.