Компания Elon Musk's Artifical Intelligence Company Xai выпустила свою последнюю языковую модель Grok3 в этот понедельник, что отмечает значительный прогресс, достигнутый в области искусственного интеллекта. На пресс-конференции Musk сообщил, что новая модель в десять раз превышает вычислительную мощь своего предшественника благодаря центру обработки данных из Мемфиса, который оснащен около 200 000 графических процессоров, обеспечивая сильную вычислительную поддержку модели.
Модели серии Grok3 запустили множество вариантов, включая оптимизированную версию, которая жертвует часть точности при увеличении скорости. Кроме того, недавно запущенная модель «вывода» разработана специально для решения математических и научных проблем, и пользователи могут регулировать эти функции с помощью настройки «думать» и «мозг» на границе раздела Grok. Xai сказал, что эта версия еще не была завершена, модель все еще непрерывно обучается, и команда планирует сделать дальнейшие улучшения и оптимизации в ближайшие недели.
Согласно платформе AI Benchmarking Lmarena.ai, Grok3 забил более 1400 в поле чат -бот, став лидером в этой области. Он превосходит во всех категориях, таких как программирование, превосходство моделей OpenAI, Anpropic и Google. Однако фактическая производительность может отличаться от контрольных результатов. Например, хотя CLAUDE3.5sonnet баллы ниже, чем в некоторых моделях в контрольных показателях, многие пользователи по -прежнему считают его лучшим выбором для задач программирования.
Основатель Openai Андрей Карпати получил ранний доступ к Grok3, и он высоко оценил способность модели на логическую рассуждения. Карпаси сказал, что функция «Think» может успешно выполнять сложные задачи, такие как вычисление учебных провалов GPT-2 или создание шестиугольной сетки для настольных игр, которые ранее были ограничены высококлассной моделью OpenAI. Кроме того, эта функция повышает точность базовых математических операций, таких как подсчет букв и сравнение десятичных десятиц.
С точки зрения новых возможностей поиска, Карпаси отметил, что качество DeepSearch сопоставимо с инструментами исследования недоумения, предоставляя соответствующие ответы на такие темы, как предстоящие продукты Apple и Delantir Stock Dynamics. Тем не менее, он также нашел некоторые очевидные проблемы: модель иногда генерирует поддельные URL -адреса, делает неподдерживаемые заявления и цитирует только посты X в определенных подсказках.
Кроме того, GROK3 также, по -видимому, не имеет осознания его существования, пропустив местоположение XAI в основных лабораториях ИИ. Эти ограничения оставили глубокий исследование еще не на уровне качества «глубоких исследований» OpenAI и не подчеркивались юмору и этическим вопросам. Тем не менее, запуск GROK3 по -прежнему демонстрирует сильную силу и инновационные возможности XAI в области искусственного интеллекта.