2025年3月9日、米国カリフォルニア州 - オープンソースモデルは、Wenshengビデオテクノロジーをますます興味深いものにしています。 AI開発者Ostris(@ostrisai)は最近、Xプラットフォームで訓練されたWAN2.1loraモデルの結果を共有しました。約20枚の写真とホームRTX4090グラフィックスカードで、驚くべきビデオ生成効果を達成しました。この結果は、オープンソーステクノロジーの可能性を実証するだけでなく、ビデオロラトレーニングツールに関するXコミュニティでの激しい議論を引き起こします。

オストリスの驚くべき実験
オストリスは、3月7日のXポストでWAN2.114Bロラのトレーニング結果を最初に披露しました。彼は次のように書いています。彼はまた、ホームハードウェア上のこのモデルの実現可能性を実証する予備ビデオを共有しました。その後、3月9日に、彼はさらに「低コストの概念実証ショートミュージックビデオ」をリリースしました。これは、彼が作成した歌詞と@sunomusicによって生成された音楽と組み合わされました。ビデオのデジタル画像は、彼自身の写真で訓練されました。
オストリスは、彼が開発したビデオLORAトレーニングツールでプロセスを完了し、約20個の個人写真しか使用していないと言いました。彼はポストでため息をつきました:「私はその効果がそんなに良いとは思っていませんでした!私はとても楽しかったです。」この実験により、WAN2.1loraの強力なパフォーマンスが検証されただけでなく、高品質の文学ビデオを実現するためにオープンソースツールを使用する可能性も示しました。
トレーニングツールオープンソースオストリスが開発したビデオLORAトレーニングツールを共有することは、このリリースのハイライトとなっています。 3月9日に投稿されたユーザー@Sundyme:「ビデオロラトレーニングはここにあります。AIビデオの主人公になりましょう!」 Ostrisのツールリンクの共有。このツールはWAN2.1モデルをサポートし、ユーザーが少数の写真でパーソナライズされたビデオモデルをトレーニングできるようにし、技術的なしきい値を大幅に下げます。
Xユーザーは、このツールに強い関心を示しています。 @Sundyme氏は次のように述べています。「 @Ostrisaiが開発したLORAトレーニングツールはWAN2.1をサポートしており、驚くべき結果があります。」コミュニティのフィードバックは、RTX4090などの消費者グラフィックカードでツールを効率的に操作することで、より多くのクリエイターが自宅でAIビデオ生成を試すことができることを示しています。
コミュニティの対応と技術的意義
Xの応答は、オストリスの結果が広範囲にわたる熱意を引き起こしたことを示しています。あるユーザーはコメントしました:「20枚の写真でこのような現実的なデジタル人を訓練することは信じられないほどです!」別のユーザーは、オープンソースモデルの可能性を称賛しました。「Wenshengビデオはますます興味深いものになり、オープンソースは普通の人がAIで遊ぶことができます。」
業界のインサイダーは、オストリスの実験がビデオ生成の分野におけるオープンソースモデルのブレークスルーを強調していると考えています。 WAN2.1loraは、トレーニングテクノロジーをサンプルの少ないものと組み合わせて、ハードウェアの要件を削減するだけでなく、パーソナライズされた作成のアクセシビリティを向上させます。このアプローチは、大規模なデータセットと高性能サーバーを必要とする従来のモデルと比較して、独立した開発者と小チームに新しいパスを開きます。
プロジェクトアドレス:https://github.com/ostris/ai-toolkit