Глобальная конференция разработчиков (GDC) вновь стала в центре внимания глобального технологического сообщества, и на этот раз сила инноваций в искусственном интеллекте Китая стала главным героем на сцене. На конференции Alibaba Cloud Modai объявили о том, что две многомодальные модели с открытым исходным кодом были запущены в первый раз, а именно Step-Video-T2V, крупнейшая в мире модель генерации видео с открытым исходным кодом и Step-Audio, первая в отрасли модель голосового взаимодействия с открытым исходным кодом. Эта новость быстро вызвала жаркие дискуссии в глобальном сообществе с открытым исходным кодом AI, дополнительно консолидируя главную позицию Китая в области искусственного интеллекта.
Как крупнейшее в Китае сообщество моделей ИИ, две модели, выпущенные сообществом Alibaba Cloud Modai, несомненно, являются важными прорывами в мультимодальной области. Благодаря огромной шкале параметров, Step-Video-T2V обновил запись модели генерации видео с открытым исходным кодом, указывая на то, что будущее создание видеоконтента будет более утонченным и высококачественным. Step-Audio прорывается через ограничения традиционных голосовых моделей и становится первой системой голосового взаимодействия на уровне продукта, прокладывая путь для более естественной и умной технологии голосового взаимодействия.

Сообщество Alibaba Cloud Modai собрало более 40 000 моделей с открытым исходным кодом, охватывающие несколько передовых полей, таких как модель крупных языков (LLM), системы диалога, голосовые технологии, литературные и видео, и твердо занимает как крупнейшее сообщество моделей ИИ в Китае. Две тяжеловесные модели открытого исходного кода в сообществе Модай являются не только признанием силы платформы сообщества, но и отражают активной вклад Цзейексингхена в строительство экосистемы с открытым исходным кодом.
Выпустив такие важные результаты с открытым исходным кодом на стадии GDC, глобального застройщика, несомненно, показывает миру тенденцию развития развития и открытое отношение к сотрудничеству с технологией искусственного интеллекта Китая. Открытый источник этих двух моделей значительно снизит порог для использования технологии ИИ, ускоряет популяризацию и разработку технологий глобального искусственного интеллекта и предоставит глобальным разработчикам больше возможностей для инноваций и применения.