シンガポール国立大学の Learning and Vision Lab チームは、Video-Infinity と呼ばれる分散型長時間ビデオ生成ツールを開発しました。このツールは、既存の長時間ビデオ生成テクノロジーのボトルネックを打破し、その効率性、利便性、強力な機能で大きな注目を集めています。 。トレーニング モデルを追加することなく、マルチ GPU 環境で高品質の長いビデオを迅速に生成できるため、ビデオの生成時間が大幅に短縮され、制作効率が大幅に向上します。ユーザーは簡単な構成でパーソナライズされたビデオ生成のニーズを実現し、パラメータ調整を通じてビデオ品質を最適化できます。
製品入口:https://top.aibase.com/tool/video-infinity
このツールは分散型で高速でトレーニング不要で、conda 環境を使用してインストールされ、使いやすいです。ユーザーは、必要に応じて基本構成、パイプライン構成、および Video-Infinity 構成を実行して、さまざまなビデオ生成のニーズを実現できます。
同時に、高周波情報の損失を避けるために、ビデオの品質と安定性を維持するために、アテンション モデルのローカル コンテキスト フレーム数とグローバル コンテキスト フレーム数の合計を 24 未満に設定することをお勧めします。 。
実験結果を比較すると、この技術はビデオ フレーム数の点で明らかな利点があるだけでなく、時間コストの点でも優れていることがわかります。技術チームは、この手法では 8 つの Nvidia Ada6000 GPU のサポートとサンプリング ステップを 30 に設定することでこの成果を達成したと述べています。
この技術の研究者らは、アブレーションによるクリップ並列性とデュアルスコープ アテンションの効果を分析するための対立実験も実施しました。その結果、これら 2 つの要素がビデオ生成に大きな影響を与えることがわかりました。さらに、このテクノロジーは複数のプロンプト (マルチプロンプト) もサポートしており、背景、スタイル、テーマのスムーズな移行を実現し、ビデオ生成の可能性を高めます。
ハイライト:
⭐ このテクノロジーは、5 分間で 2300 フレームのビデオを生成でき、以前の方法より 100 倍速くなります。
⭐ クリップの平行性とデュアルスコープ アテンションはビデオ生成に大きな影響を与えます。
⭐ 複数のプロンプト (マルチプロンプト) をサポートし、スムーズな移行を実現します。
Video-Infinity の登場は、長時間ビデオ生成テクノロジーにおける大きな進歩を示しています。その効率的な生成速度と便利な操作方法は、映画やテレビの制作、アニメーション制作などの分野に革命的な変化をもたらし、ユーザーにより便利で効率的なビデオ制作体験を提供します。 今後このテクノロジーがさらに開発され、より強力なビデオ生成機能がより多くのユーザーに提供されることを楽しみにしています。