Недавно команда DeepBeepMiep выпустила WAN2.1GP на GitHub, модель генерации видео, оптимизированная для низкоуровневых пользователей GPU. Основываясь на WAN2.1 от Alibaba, модель предназначена для обеспечения сильных возможностей генерации видео для пользователей, которым не хватает высокопроизводительных ресурсов GPU. Запуск WAN2.1GP знаменует собой важный прогресс в технологии генерации видео, особенно в области с открытым исходным кодом.
Основные особенности WAN2.1gp включают ее превосходную производительность и широкую применимость. Модель продолжает превзойти существующие модели с открытым исходным кодом и некоторые коммерческие решения в нескольких критериях, демонстрируя сильную конкурентоспособность. Кроме того, модель T2V-1.3B требует всего 8,19 ГБ видео памяти, что делает почти все графические процессоры потребительского уровня. С помощью видеокарты RTX4090 пользователи могут генерировать 5-секундное видео 480p примерно за 4 минуты, и их производительность даже сопоставима с некоторыми моделями с замкнутым исходным кодом.
WAN2.1GP не только поддерживает текст к видео, изображениям на видео, редактирование видео и другие задачи, но и первая видео -модель, которая может одновременно генерировать китайский и английский текст. Эта функция приносит больше возможностей для практических приложений пользователей. Кроме того, модель оснащена мощным вариационным видеосодером (VAE), который может эффективно кодировать и декодировать 1080p видео с любой длиной, не повреждая время, закладывая прочную основу для генерации видео и изображений.
Чтобы улучшить пользовательский опыт, WAN2.1GP сделал несколько оптимизаций, включая значительное снижение требований памяти и видео памяти, и поддерживает несколько конфигураций в соответствии с устройствами с различной производительностью. Пользователи могут быстро начать работу с этим инструментом с помощью упрощенного процесса установки. С непрерывными обновлениями версии WAN2.1GP постепенно добавляли более практические функции, такие как поддержка чайного кэша, улучшение интерфейса Gradio и т. Д., Дополнительное улучшение скорости генерации и удобства использования.
Вход в проект: https://github.com/deepbeepmeep/wan2gp
Ключевые моменты:
Производительность SOTA: WAN2.1GP хорошо работает в нескольких тестах, превосходя существующие решения с открытым исходным кодом и коммерческими решениями.
Сильная совместимость: требуется только 8,19 ГБ видео памяти, она поддерживает почти все графические процессоры потребительского уровня, подходящие для пользователей низкого уровня.
Поддержка с несколькими задачами: поддерживает несколько задач генерации, таких как текст к видео, изображение в видео, и имеет возможность генерировать китайские и английские тексты.