После сентябрьского обновления версии Guangcone Intelligence узнала от круга друзей Тан Цзяю, соучредителя и генерального директора Shengshu Technology, что большая модель Vidu будет снова обновлена на этой неделе, и вскоре будет выпущена версия Vidu-1.5.
Направление обновления этой версии по-прежнему сосредоточено на расширении возможностей обобщения и предметной согласованности больших моделей. Предыдущая версия была ориентирована на согласованность одного объекта, тогда как последняя версия может понимать и интегрировать несколько концепций, таких как персонажи, объекты и окружающая среда, а также следовать инструкциям пользователя для создания соответствующих видеорезультатов объединения нескольких объектов в течение 30 секунд, принимая во внимание лидировать в создании мультиагентной последовательной генерации.
Помимо Vidu, с сентября этого года, согласно неполной статистике, все основные платформы создания видео с использованием искусственного интеллекта, включая Jimeng AI от Bytedance, Kuaishou Keling AI, Runway, Zhipu Qingying, Aishi Technology PixVerse и pika, получили все обновления версии A.

В настоящее время в сфере создания горячего видео с использованием искусственного интеллекта в игру вступили крупные модельные стартапы и крупные интернет-компании. После интенсивного запуска продукта на ранней стадии он вступил в стадию конкуренции по итерации и обновлению продукта.
Благодаря обновленному контенту каждой версии нетрудно обнаружить, что общим направлением итерации возможностей большой модели генерации видео AI по-прежнему остается продолжительность генерируемого видео, стабильность и непрерывность изображения, а также последовательность объекта. до и после.
Но в то же время различные игроки начали «разделяться» по реальным функциональным приложениям, каждый со своим акцентом. Некоторые мелкие и средние игроки также начали находить свои собственные сегменты рынка.
Например, в последней версии Runway обновлен Act-One, который может точно воспроизводить выражения лиц реальных людей для персонажей искусственного интеллекта, чтобы обеспечить возможность управления 3D-камерой с искусственным интеллектом. PixVerse выпустила различные спецэффекты Хэллоуина, спецэффекты яда и т. д.
Что касается этого раунда обновлений различных платформ создания видео с использованием искусственного интеллекта, Чэнь Кун, основатель Xingxian Culture и продюсер оригинального фэнтезийного IP-проекта с искусственным интеллектом «Зеркало гор и морей», считает: «Самым большим обновлением должна стать миграция выражений Act- Один, который обеспечивает лучший способ исполнения персонажей. Основные возможности. Что касается последовательности и стабильности персонажей, то «прогресс есть, но нет прогресса между поколениями».
По словам Вики, создателя видео AI, по сравнению с оригинальным продуктом в первой половине года, последняя обновленная видеоплатформа AI не только повторила возможности базовой модели, но и обновила ее функции, такие как голова и хвост. сшивка, качество изображения и увеличение частоты кадров, дублирование и другие функции: «улучшение этих функций на самом деле более комплексное, чем в первой половине года».
Если первая половина 2024 года — это гонка вооружений на треке генерации ИИ-видео, то вторая половина года станет циклом мелкошагового обновления версий.
На данном этапе конкуренция между Byte и Kuaishou все еще остается жесткой. Малые и средние производители начинают находить свои собственные уникальные пути, а некоторые компании сосредотачиваются на зарубежных рынках и также добились эффекта «цветения внутри страны и аромата». за стеной».
Несомненно, борьба на этом этапе может показаться умеренной, но она оказывает существенное влияние на собственное позиционирование платформы и направление дальнейшего развития, а также на последующий устойчивый рост групп и количества пользователей.
«Цжимэн немного отстает». Это объективная оценка, которую дают пользователи платформы генерации видео с помощью искусственного интеллекта.
Являясь одной из первых платформ для создания видео с использованием искусственного интеллекта в прошлом году и являясь продуктом Byte, эффекты создания видео Dream AI подверглись критике со стороны пользователей и проигрывают таким игрокам, как Runway и Pika.
В июне этого года компания Kuaishou, прямой конкурент Byte в области коротких видеороликов, официально запустила на своем официальном сайте модель генерации большого видео «Keling» и быстро вышла из индустрии. В то же время появляется все больше и больше платформ для создания видео с использованием искусственного интеллекта, и направление создания видео с использованием искусственного интеллекта находится на подъеме.
В условиях сильного конкурентного давления Bytedance, как первый эшелон отечественных продуктов искусственного интеллекта, восполнила недостатки генерации видео, которая стала главным приоритетом, и скорость ее достижения превосходит воображение.
24 сентября в Шэньчжэне прошел тур по инновациям в области искусственного интеллекта Volcano Engine 2024. Чэнь Синьрань, бывший руководитель Douyin Art, выступил в качестве руководителя отдела искусственного интеллекта Jimeng, а также рынка и операций по сокращению и объявил, что AI Jimeng подключен к последней разработке Doubao. Модель генерации видео.
В то же время ByteDance выпустила две модели генерации видео, Seaweed и Pixeldance, из семейства моделей Doubao, и предложила создателям и корпоративным клиентам провести мелкомасштабное тестирование через Jimeng AI и Huoshan Engine соответственно.
8 ноября Dream AI, платформа AI-контента, принадлежащая ByteDance, объявила, что Seaweed, модель генерации видео, разработанная ByteDance, официально открыта для пользователей платформы.
По данным ByteDance, модель создания видео в виде погремушек Seaweed, которая на этот раз открыта для использования, является стандартной версией этой модели. Для создания высококачественного AI-видео продолжительностью 5 секунд требуется всего 60 секунд, что на 3–5 минут раньше. все отечественные отраслевые стандарты. Требуется время разработки.
Jimeng AI также сообщил, что Pro-версии двух моделей видеопоколения, Seaweed и Pixeldance, также будут доступны для использования в ближайшем будущем. Модель Pro-версии может реализовывать естественные и последовательные действия при съемке нескольких кадров и сложные взаимодействия с несколькими объектами, а также устраняет проблему согласованности переключения при съемке нескольких кадров. Она может поддерживать согласованность объекта, стиля и атмосферы при переключении объективов. подходит для фильмов, телевидения и компьютеров, мобильных телефонов и других устройств.
ByteDouyin и Kuaishou, как лидеры отечественных платформ короткого видео, их конкуренция сместилась с короткого видео и электронной коммерции в область искусственного интеллекта. Объективно говоря, Douyin опережает Kuaishou по всем аспектам. Но только в области ИИ Куайшоу дал красивую контратаку.
С момента своего мгновенного успеха в июне у Kuaishou Keling было несколько итераций уменьшенных версий.
Но что касается базовых возможностей больших моделей, 20 сентября этого года Kuaishou выпустила версию Keling 1.5, которая связана с моделями нового поколения и добилась значительных улучшений в качестве изображения и динамическом качестве. В исходную модель также добавлены улучшения. новая функция - движение Кисть, эффект генерации более управляем.
«Keling 1.5 очень силен. Можно сказать, что это самая реалистичная из всех моделей. По сравнению с Runway, она в основном преодолела предыдущую проблему деформации персонажей», — сказал Lightcone Intelligence предприниматель AIGC AIgen (сценический псевдоним).
В фактически созданных видеоэффектах, сравнивая Keling и Runway, мы видим, что при использовании одного и того же слова-подсказки оба сильно влияют на стабильность реального персонажа, но видеоэффекты, созданные Keling, могут автоматически разблокировать выражение лица. .
«На самом деле Runway может генерировать выражения лица самостоятельно, но эффект очень странный», — сказал Ямцзян AIgen. Однако способности Keling AI и Runway случайны и не фиксированы.
Фактически, видно, что Keling AI и Runway превосходят реальные эффекты генерации, а с точки зрения понимания подсказок Keling AI действительно находится на переднем крае, но в будущем его все равно необходимо будет постоянно итеративно обновлять, чтобы он был в состоянии Эта способность закрепилась.
(Подиум, подсказка: женщина-модель в новой китайской одежде, демонстрирующая свой стиль, на фоне плавает разноцветный дым, предоставлено AIgen)
(Keling AI, подсказка: женщина-модель в новой китайской одежде демонстрирует свой стиль, на фоне плавает разноцветный дым, предоставлено Yamjiang AIgen)
Однако после того, как Jimeng выпустил последнее видео по созданию большой модели, Вики считает, что возможности его модели и дизайн пользовательского интерфейса мало чем отличаются от Keling. В то же время во время внутреннего тестирования модели версии Jimeng Platform Pro она может легко контролировать диапазон перемещения и действия экрана.
Как ведущие платформы коротких видео в Китае, Kuaishou и Bytedance представили свои треки по созданию видео с помощью искусственного интеллекта. Конечная цель — привлечь и удержать внимание пользователей, что требует постоянного производства нового, высококачественного и креативного контента.
Исходя из этого, короткометражные драмы с искусственным интеллектом также стали одним из фокусов конкуренции между Bytedance и Kuaishou Keling.
В июле этого года короткометражка AI «Горы, моря и странные зеркала: рубящие волны», созданная «Keling AI», привлекла широкое внимание. Короткометражная драма стала первой оригинальной короткометражной фэнтезийной драмой AIGC в Китае.
В сентябре компании Kuaishou Xingmang Short Drama и «Keling AI» объявили «Конкурс создания короткометражных драм Xing You Lingxi-AI». Сообщается, что конкурс побуждает больше людей присоединиться к созданию короткометражных драм с использованием искусственного интеллекта с помощью различных мер, таких как вознаграждение за трафик, почетные награды и подписание контента.
Компания Byte также не собирается отставать. Хотя Dream AI объединяется с Bona Pictures для выпуска первой созданной AIGC научно-фантастической короткометражной драмы «Саньсиндуй: Будущий апокалипсис», она также сотрудничает со многими «суперкреаторами» на платформе Douyin. для достижения совместного творчества, приглашая На платформе есть высококлассные поклонники и влиятельные эксперты, которые совместно присоединились к программе «Super Creator Alliance» в надежде создать крупнейшее сообщество виртуального творчества в Китае.
Но на данном этапе, будь то Douyin или Kuaishou, контенту, созданному создателями кино и телевидения на своих видеоплатформах, «трудно вырваться из круга», сказала Вики: «Потому что весь рынок еще не сформирован, и» Конечные пользователи C не знают, как ею пользоваться. Для чего она здесь? Будет некоторый коммерческий спрос на голову, но спроса не так много, и в целом ситуация нестабильна».
В конце концов, на данном этапе в мире все еще относительно мало профессиональных создателей, а технология создания крупных моделей видео с помощью искусственного интеллекта все еще находится на ранних стадиях своего развития.
Поэтому, поскольку компания является ведущей видеоплатформой, конкуренция между Byte и Kuaishou становится все более жесткой. Помимо борьбы за базовые технологии и продукты искусственного интеллекта, более важным является то, кто может возглавить исследование пути создания технологического контента. . В конце концов, если платформа сможет собрать больше создателей инновационного контента, она сможет создать экосистему сообщества, которая будет более заинтересована и любима пользователями.
Конечно, помимо Byte и Kuaishou, другие игроки на пути создания видео AI также начали «разделяться». Некоторые малые и средние производители также начали исследовать и находить свой собственный путь к дифференцированной конкуренции.
На платформах коротких видео, таких как Douyin и Kuaishou, контент, созданный некоторыми авторами, может быть трудно вырваться из круга, но некоторые видеоролики, содержащие спецэффекты призраков и животных, чрезвычайно популярны, например, созданное искусственным интеллектом видео Хэ Цзюн и Хуан Лэй внезапно начал сражаться.

Для игроков на треке создания видео с помощью искусственного интеллекта ByteDance и Kuaishou конкурируют в полном спектре технологий и экосистем контента, в то время как другие малые и средние игроки больше сосредоточены на сегментировании трека и определении своих собственных платформ, а позиционирование продукта имеет стать основой выживания и развития.
В конце октября генеральный директор Runway ясно дал понять в открытом письме, что Runway — это не компания, занимающаяся искусственным интеллектом, а медиа- и развлекательная компания: «Я думаю, что эпоха компаний, занимающихся искусственным интеллектом, закончилась».
Исходя из этого, в то время как крупные компании конкурируют за улучшение продолжительности, точности и плавности генерации видео с помощью ИИ, Runway явно разработала свои собственные особенности в видеотреке с использованием ИИ — создавая ИИ, который специально служит искусству, средствам массовой информации и развлечениям.
Судя по реальным эффектам генерации видео Runway, можно сказать, что его влияние на стабильность и последовательность персонажей находится на переднем плане. Помимо базовых технических возможностей, в последнем обновлении версии две новые функции, запущенные Runway, хоть и небольшие, но обеспечат большое удобство и огромную экономию средств аниматорам, разработчикам игр и кинематографистам.
Можно сказать, что Runway является одним из самых популярных продуктов среди специалистов кино и телевидения. Помимо технической мощи, самым важным фактором является его экономическая эффективность.
«Runway такой ароматный. Мы используем Keling экономно, но Runway не ограничен. Не имеет значения, курите ли вы его сотни раз в день». AIgen сказал: «Случайность видео AI по-прежнему очень сильна. По мнению авторов, обычным авторам может быть трудно позволить себе такую стоимость».
С другой стороны, если вы используете 1000 юаней для покупки очков, вы можете купить 15 000 очков келинга. Каждый раз, когда вы используете 35 очков келинга, 1000 юаней можно получить только 428 раз. Для настоящих предпринимателей этого в принципе недостаточно. «Судя по частоте создания более 200 видеороликов, которые я создаю каждый день на Runway, баллы, купленные Келингом за 1000 юаней, в основном сгорают за 2 дня».
В предыдущей статье Guangcone Intelligence «Взрывные видеоролики об искусственном интеллекте: крупные производители идут налево, стартапы — направо» также упоминалось, что метод взимания платы за членство, принятый каждой платформой на данном этапе, не может быть коммерциализирован. Для предпринимателей замкнутого цикла последующая ставка оплаты и готовность платить будут не очень высокими. В настоящее время кажется, что даже для предпринимателей, которые могут добиться коммерциализации замкнутого цикла, экономическая эффективность также является ключевым фактором, влияющим на использование ими продукции.
Помимо Runway, свои треки нашли также Pika и Pixverse. Из их последней обновленной версии видно, что целью этих двух компаний является обучение некоторым спецэффектам, которые пользователи могут использовать напрямую: «Хотя эта метафора может быть неуместной, она немного близка к стикерам, сделанным Доуином раньше. «Сказал Картошка Цзян Айген.
Например, во время Хэллоуина в конце октября в версию Pixverse V3 было добавлено множество новых спецэффектов на тему Хэллоуина, включая режим зомби, шляпы волшебников, вторжение монстров и другие тематические эффекты, а также специальные эффекты ИИ, похожие на эффекты Пики. популярные функции AI-сжатия и расширения видео. Пользователи могут добавлять дополнительные 5–8 секунд контента к существующим видео и точно контролировать направление контента в новых добавленных клипах.
С недавним выпуском фильма «Веном: Последний танец» компания PixVerse представила новый видеоэффект со спецэффектом «We Are Venom», основанный на новейшей видеомодели PixVerse V3, который может создавать крутые анимации яда из изображений одним щелчком мыши.
В настоящее время такого рода призрачные спецэффекты пользуются большой популярностью среди пользователей социальных платформ. Ранее Pika запустила специальный эффект щипка AI в версии 1.5. После запуска он понравился пользователям. Этот эффект волны также использовался для достижения обгона в поворотах. Conch AI, который начал развиваться примерно в то же время, что и Pika, фактически полагался на характеристики персонажей и пакеты мемов, чтобы напрямую разжечь зарубежное общественное мнение и обогнать других в углу.

Эффекты сжатия ИИ Пики
Фактически, хотя Conch AI был запущен поздно, специалисты отрасли имеют высокое мнение о Conch AI. «Показатели Conch AI в движениях персонажей очень хорошие. Недавнее созданное AI видео боя Хэ Цзюна и Хуан Лея было создано Conch AI», — сказал Янтаоцзян AIgen.
Однако, что еще более важно, Conch AI добился эффекта «цветения дома и благоухания за стеной». Поскольку отечественная компания MiniMax выпустила за рубежом платформу для создания видео с использованием искусственного интеллекта, ее популярность в поисковых системах продолжала расти после ее запуска.
Согласно статистике из «Списка продуктов AI», количество посещений веб-версии Conch AI выросло на 860% в сентябре, заняв первое место по глобальному и внутреннему росту в сентябре. Зарубежные пользователи поделились своим опытом на социальных платформах, и обычно считается, что Conch AI — один из лучших инструментов для создания видео с использованием искусственного интеллекта, доступных в настоящее время на рынке.
Благодаря популярности своей продукции на зарубежных рынках, MiniMax оказалась в авангарде большой модели Six Little Tigers с точки зрения возможностей коммерциализации.
Для сравнения, такие платформы, как Vidu и Zhipu Qingying, постоянно развиваются с точки зрения тематической согласованности, стабильности персонажей и продолжительности создания видео, но у них еще не сформировался собственный стиль и уникальность.
Хотя технология генерации видео с помощью искусственного интеллекта постоянно развивается и привела к появлению уникальных сегментированных треков. Тем не менее, исследовательский отчет Cinda Securities также показывает, что технология создания видео с помощью искусственного интеллекта все еще нуждается в дальнейшем совершенствовании с точки зрения согласованности символов, необходимой продолжительности и качества изображения, чтобы соответствовать стандартам коммерциализации.
В то же время нынешние основные инструменты для создания видео с использованием искусственного интеллекта все еще находятся на стадии конкуренции за создание видео, и большинство из них являются однофункциональными продуктами, для достижения которых по-прежнему требуется последовательное использование множества различных инструментов для создания видео. эффект прямого вывода коммерческих видеороликов.
В будущем платформа крупных моделей создания видео с использованием искусственного интеллекта все равно должна будет продолжать итеративную эволюцию.