В последнее время Google и OpenAI, гиганты в области искусственного интеллекта, вступили в жесткую конкуренцию, и скорость выпуска новых моделей обеими сторонами ошеломляет. Эта конкуренция отражается не только в конкуренции производительности моделей, но также отражает быстрое развитие итераций технологий искусственного интеллекта и способность быстро реагировать на рынок. Инвестиции и инновации Google и OpenAI в технологические исследования и разработки будут и дальше способствовать прогрессу в области искусственного интеллекта и предоставлять пользователям более удобные и интеллектуальные услуги.
В последнее время конкуренция между Google и OpenAI снова обострилась. Всего через день после того, как новая версия GPT-4o возглавила список соревнований по искусственному интеллекту, Google запустила новейшую экспериментальную модель Gemini-Exp-1121, быстро вернув себе первенство. Всего неделю назад Google выпустила Gemini-Exp-1114, что, похоже, указывает на то, что Google очень быстро отреагировал на динамику OpenAI.

Джек Рэй, главный научный сотрудник Google DeepMind, сказал, что это был «блиц», подразумевая, что скорость итерации пост-обучения выше, чем пред-обучения.
Согласно официальной информации, Gemini-Exp-1121 был значительно улучшен во многих аспектах, что в основном выразилось в улучшении возможностей кодирования, рассуждений и возможностей визуального понимания. Кроме того, эта модель достигла уровня, сравнимого с нынешним топом o1-preview и New Sonnet3.5 в стиле управления сложными подсказками.
В реальных тестах Gemini-Exp-1121 также показал лучшие результаты, чем новая версия GPT-4o, в понимании комиксов. Его ответы были более полными, и он мог четко использовать субтитры и жирный акцент для представления информации. В классическом вопросе о логическом рассуждении Animal Crossing River ответ Близнеца-Exp-1121 был полностью правильным, демонстрируя более сильные способности к логическому рассуждению. С другой стороны, новая версия GPT-4o допустила некоторые ошибки.
В то же время OpenAI также активно разрабатывает новые функции. Недавно в последней версии ChatGPT был обнаружен код функции видео «Живая камера», что свидетельствует о ее прогрессе в области распознавания голоса и изображения. Пользователи OpenAI также впервые испытают эту возможность при использовании расширенного режима речи, что свидетельствует о намерении расширить использование этой функции в будущем.
Ожидается, что в следующем году основной метод общения с чат-ботом может постепенно перейти от традиционного текстового диалога к голосовым и более интеллектуальным агентским услугам. Это изменение может быть вызвано запуском функции «живой камеры».
Выделять:
Новая модель Google Gemini-Exp-1121 быстро обогнала GPT-4o после достижения вершины и вернулась на вершину соревнования ИИ.
Gemini-Exp-1121 улучшил свои возможности кодирования, рассуждения и визуального понимания и показал хорошие результаты.
OpenAI разрабатывает функцию «камеры в реальном времени», которая может изменить способ общения с ИИ в будущем.
В целом конкуренция между Google и OpenAI способствовала быстрому развитию технологий искусственного интеллекта. В будущем способы взаимодействия искусственного интеллекта с людьми станут более разнообразными и интеллектуальными, и этого стоит ожидать.