Экспериментальная версия Google DeepMind (EXP1114) достигла замечательных достижений на платформе Chatbot Arena, в течение более недели общественного тестирования он превзошел многих конкурентов с абсолютным преимуществом. Показывать. Результаты теста показывают, что Gemini-EXP-1114, связанный на первом месте с GPT-4-Latest в общих баллах, и взял на себя инициативу во многих ключевых областях, таких как математика, сложная оперативная обработка и творческое письмо, показывая его мощное много способности. Это знаменует собой значительное повышение конкурентоспособности Google в области макетов ИИ.
Последняя экспериментальная версия Google DeepMind Gemini (Exp1114) достигла замечательных результатов на платформе Chatbot Arena. После более чем недели общественного тестирования данные о более чем 6000 голосов были совокупными, что эта новая модель превосходит своих конкурентов со значительным преимуществом и демонстрирует удивительную силу в нескольких ключевых областях.

С точки зрения общих рейтингов, Gemini-EXP-1114, привязанный к первому месту с GPT-4-Latest с превосходными баллами более 40 баллов, что превосходит ранее ведущую версию GPT-4-Preview. Что еще более удивительно, так это то, что модель достигла вершины в основных областях, таких как математика, сложные подсказки и творческое письмо, демонстрируя чрезвычайно сильную комплексную силу.
В частности, прогресс Gemini-EXP-1114 впечатляет:
От № 3 до полного рейтинга
Оценка математических способностей выросла с 3 до 1 -го
Сложная оперативная обработка поднялась с 4 -го по 1 -е место
Творческое исполнение письма улучшилось с 2 -го места до 1 -го места
Возможности визуальной обработки также занимают первое место
Уровень программирования также был улучшен с 5 до 3 -го
Google AI Studio официально запустила эту новую версию для пользователей, чтобы испытать ее на практике. Тем не менее, сообщество также выразило обеспокоенность по поводу некоторых конкретных вопросов, например, существует ли лимит 1000 токенов, и как решать практические проблемы применения, такие как сверхпрочный текст.

Отраслевые аналитики считают, что этот прорывной прогресс показывает, что долгосрочные инвестиции Google в область ИИ начали пожинать результаты. Интересно, что модель поддерживает свой 4-й рейтинг по контролю в стиле, что может означать, что команда разработчиков приняла новый подход после тренировки вместо того, чтобы вносить изменения в модель предварительного обучения.
Этот основной прорыв также вызвал дискуссии по структуре отрасли. OpenAI использовал для запуска новых продуктов, когда конкуренты выпустили важные обновления, но на этот раз прогресс Google привлек внимание отрасли. Некоторые люди считают, что это может показать прибытие Gemini2, и конкурентоспособность Google в области крупных моделей значительно улучшается.
Выдающаяся производительность Gemini-EXP-1114 не только демонстрирует сильную силу Google в области ИИ, но и обеспечивает новое вдохновение для будущего направления развития технологии крупно-модели, которую стоит с нетерпением ждать в будущем.