Официальный веб-сайт www.binance.com/zh-cn :введите официальный веб-сайт ☜☜
Приложение: ☞☞official App Download☜☜
Недавно HPC-AI Tech объявила о запуске Open-Sora 2.0, прорывной системы видео ИИ, которая может достичь качества коммерческого класса только примерно в одной десятой от типичной стоимости обучения. Этот прогресс знаменует собой возможный сдвиг парадигмы в ресурсном поле видео ИИ, сравнимого с повышением эффективности, наблюдаемых в языковых моделях.
В то время как существующие высококачественные системы генерации видео, такие как Movie Gen и Step-Video-T2V, могут потребовать миллионов долларов на обучение, расходы на обучение Open-Sora2.0 составляют всего около 200 000 долларов. Несмотря на существенное снижение затрат, тестирование показало, что его качество выпуска сопоставимо с установленными коммерческими системами, такими как GEN-3Alpha и Hunyuanvideo. Система использует 224 NVIDIA H200GPUS для обучения.
Совет: «Две женщины сидят на бежевом диване, комната теплая и удобная, с кирпичными стенами на заднем плане. Они счастливо разговаривают, улыбаются и поднимают бокалы, чтобы отпраздновать красное вино в интимном выстреле средней сцены». | Видео: HPC-AI Tech
Open-Sora2.0 достигает своей эффективности благодаря новому трехэтапному обучению, начиная с видео с низким разрешением и постепенно совершенствуется более высоким разрешением. Интегрированные предварительно обученные модели изображений, такие как Flux, дополнительно оптимизируют использование ресурсов. По своей сути лежит Video DC-AE AutoEncoder, который обеспечивает отличные скорости сжатия по сравнению с традиционными методами. Это инновация превращается в замечательную скорость обучения в 5,2 раза и более высокую скорость генерации видео. В то время как более высокие показатели сжатия приводят к небольшому снижению данных вывода, это значительно ускоряет процесс создания видео.
Совет: «Томатный серфинговый ломтик салата, водопад с пастбищным соусом, преувеличенный серфинг и эффекты гладких волн подчеркивают удовольствие от 3D -анимации». | Видео: HPC-AI Tech
Эта система с открытым исходным кодом может генерировать видео из описания текста и отдельных изображений и позволяет пользователям управлять интенсивностью движения в сгенерированных зажигах через функцию оценки движения. Примеры, предоставленные HPC-AI Tech Showcase различные сценарии, включая реалистичный диалог и причудливые анимации.
Тем не менее, Open-Sora 2.0 в настоящее время имеет ограничения в разрешении (768x768 пикселей) и максимальную продолжительность видео (5 секунд или 128 кадров), что уступает возможностям ведущих моделей, таких как Sora Openai. Тем не менее, его производительность в ключевых областях, таких как визуальное качество, точность сигналов и обработка движения, приближается к коммерческим стандартам. Стоит отметить, что оценка Vbench Open-Sora2.0 в настоящее время составляет всего 0,69% после Sora Openai, что значительное улучшение по сравнению с 4,52% предыдущей версии.
Совет: «Куча антропоморфных грибов проводят диско -вечеринку в темном магическом лесу, сопровождаемой мигающими неоновыми огнями и преувеличенными танцевальными шагами, их гладкие текстуры и отражающие поверхности подчеркивают забавное 3D -внешний вид». | Видео: HPC-AI Tech
Экономическая стратегия Open-Sora2.0 повторяет «момент DeepSeek» в языковой модели, когда улучшенные методы обучения позволили системам открытого исходного кода для достижения эффективности коммерческого уровня по гораздо более низкой стоимости, чем коммерческие системы. Эта разработка может оказать понижательное давление на цены в поле видео AI, которое в настоящее время взимается на секунды из -за высокого спроса на вычисление.

Сравнение затрат на обучение: Open-Sora2,0 стоит около 200 000 долларов, а Gon Gen стоит 2,5 миллиона долларов, а Step-Video-T2V стоит 1 миллион долларов. | Фото: HPC-AI Tech
Несмотря на этот прогресс, разрыв в производительности между открытым исходным исходным и коммерческим видео ИИ все еще больше, чем у языковых моделей, подчеркивая текущие технические проблемы в этой области. Open-Sora2.0 теперь доступен в качестве проекта с открытым исходным кодом на GitHub.