На рынок выходит крупная модель Apple MM1: параметры достигают 30 миллиардов, более половины авторов — китайцы

Автор：Eve Cole Время обновления：2025-02-11 06:48:02

Недавно Apple выпустила свою крупномасштабную мультимодальную базовую модель MM1 с размером параметров 30 миллиардов и гибридной экспертной (MoE) архитектурой. Стоит отметить, что более половины членов научно-исследовательской группы модели — китайцы, что отражает важный вклад китайских учёных в области искусственного интеллекта. MM1 показал хорошие результаты в мультимодальных тестах производительности, что указывает на то, что Apple совершила крупный прорыв в области генеративного искусственного интеллекта и может заложить прочную основу для будущей разработки продуктов. Он использует вариант MoE и лидирует по показателям предварительного обучения и множеству мультимодальных эталонных тестов. Исследователи также подтвердили важность архитектуры модели и выбора данных перед обучением с помощью многочисленных экспериментов по абляции.

Apple выпустила масштабную мультимодальную базовую модель под названием MM1 с 30 миллиардами параметров, использующую архитектуру MoE, причем более половины авторов — китайцы. Эта модель имеет большое значение в мультимодальной сфере и может предвещать запуск сопутствующих продуктов Apple в будущем. Apple увеличила свои инвестиции в область генеративного искусственного интеллекта, продемонстрировав решимость добиться значительного прогресса. MM1 использует вариант MoE и лидирует по показателям предварительного обучения и множеству мультимодальных эталонных тестов. Исследователи изучили важность архитектуры модели и отбора данных перед обучением посредством многочисленных экспериментов по абляции.

Выпуск MM1 знаменует собой важный шаг для Apple в области искусственного интеллекта. Его мощные характеристики и вклад китайской команды достойны внимания. В будущем мы можем ожидать, что Apple выпустит больше инновационных продуктов и услуг на основе MM1 для дальнейшего продвижения разработки и применения технологии мультимодального искусственного интеллекта.