9 марта 2025 года, Калифорния, США - Модель с открытым исходным кодом делает видео технологии Wensheng все более интересными. Developer AI Ostris (@ostrisai) недавно поделился результатами своей модели WAN2.1lor, обученной на платформе X. Только около 20 фотографий и домашней видеокарты RTX4090, она достигла удивительных эффектов генерации видео. Этот результат не только демонстрирует потенциал технологии с открытым исходным кодом, но и вызывает жаркое обсуждение в сообществе X на видео инструментах обучения LORA.

Удивительный эксперимент Остриса
Острис впервые продемонстрировал результаты обучения WAN2.114b Lora в посте 7 марта. Он написал: «WAN2.114B LORA тренировалась успешно на 24 ГБ! Средние 1,7 секунды за шаг при разрешении 480p на 4090». Он также поделился предварительным видео, которое продемонстрировало осуществимость этой модели на домашнем оборудовании. Затем, 9 марта, он также выпустил «недорогие короткое музыкальное видео с концепцией», которое было в сочетании с текстами, которую он создал, и музыкой, созданной @sunomusic. Цифровое изображение в видео было обучено на его собственных фотографиях.
Острис сказал, что он использовал только около 20 личных фотографий, завершив процесс с помощью инструмента обучения видео Lora, который он разработал. Он вздохнул в посте: «Я не ожидал, что эффект будет таким хорошим! Мне было очень весело». Этот эксперимент не только подтвердил мощную производительность WAN2.1la, но также показал возможность обычных пользователей, использующих инструменты с открытым исходным кодом для достижения высококачественных литературных видеороликов.
Инструмент обучения с открытым исходным кодом. Обмен инструментом обучения LORA, разработанного Ostris, стал основным моментом этого выпуска. Пользователь @Sundyme опубликовал 9 марта: «Видео обучение LORA здесь, пусть вы станете главным героем видео ИИ!» и общая ссылка на инструмент Ostris. Этот инструмент поддерживает модель WAN2.1, позволяя пользователям обучать персонализированные видео модели с небольшим количеством фотографий, значительно снижая технический порог.
X Пользователи проявляют сильный интерес к этому инструменту. @Sundime сказал: «Инструмент обучения Lora, разработанный @ostrisai, поддерживает WAN2.1 и имеет удивительные результаты». Обратная связь с сообществом показывает, что эффективная работа инструмента на графических картах потребителей, таких как RTX4090, позволяет большему количеству создателей попробовать генерацию видео с ИИ дома.
Реакция сообщества и техническое значение
Ответ на X показывает, что результаты Остриса вызвали широкий энтузиазм. Один пользователь прокомментировал: «Невероятно обучать такого реалистичного цифрового человека с 20 фотографиями!» Другой пользователь высоко оценил потенциал модели с открытым исходным кодом: «Видео Wensheng становятся все более и более интересными, а открытый исходный код позволяет обычным людям играть с ИИ».
Инсайдеры отрасли считают, что эксперимент Ostris подчеркивает прорыв моделей с открытым исходным кодом в области генерации видео. WAN2.1lora объединяет технологию обучения с небольшим количеством образцов, не только снижает требования к аппаратному обеспечению, но и улучшает доступность персонализированного создания. Этот подход открывает новые пути для независимых разработчиков и небольших команд по сравнению с традиционными моделями, которые требуют больших наборов данных и высокопроизводительных серверов.
Адрес проекта: https://github.com/ostris/ai-toolkit