最近、DeepBeePmeepチームは、ローエンドGPUユーザー向けに最適化されたビデオ生成モデルであるGitHubでWAN2.1GPをリリースしました。 AlibabaのWAN2.1に基づいて、このモデルは、高性能GPUリソースを欠いているユーザーに強力なビデオ生成機能を提供するように設計されています。 WAN2.1GPの発売は、特にオープンソースの分野で、ビデオ生成テクノロジーの重要な進歩を示しています。
WAN2.1GPの主な機能には、その優れたパフォーマンスと幅広い適用性が含まれます。このモデルは、既存のオープンソースモデルと複数のベンチマークでいくつかの商用ソリューションを上回り続けており、強力な競争力を示しています。さらに、T2V-1.3Bモデルには8.19GBのビデオメモリのみが必要であり、ほとんどすべての消費者グレードGPUを実行します。 RTX4090グラフィックカードを使用すると、ユーザーは約4分で5秒の480pビデオを生成でき、パフォーマンスは一部のクローズドソースモデルに匹敵します。
WAN2.1GPは、ビデオからビデオ、ビデオへの画像、ビデオ編集、その他のタスクをサポートするだけでなく、中国と英語のテキストを同時に生成できる最初のビデオモデルでもあります。この機能は、ユーザーの実用的なアプリケーションにより多くの可能性をもたらします。さらに、このモデルには、長さの1080pビデオを効率的にエンコードおよびデコードできる強力なビデオ変動自動エンコーダー(VAE)が装備されており、時間情報をそのまま維持し、ビデオと画像生成の強固な基盤を築きます。
ユーザーエクスペリエンスを向上させるために、WAN2.1GPは、メモリとビデオのメモリ要件を大幅に削減するなど、いくつかの最適化を行い、異なるパフォーマンスのデバイスに合わせて複数の構成をサポートしています。ユーザーは、単純化されたインストールプロセスを通じて、このツールをすばやく開始できます。継続バージョンの更新により、WAN2.1GPは、ティーキャッシュサポート、グラデーションインターフェイスの改善など、より実用的な機能を徐々に追加し、使用の生成速度と利便性をさらに向上させました。
プロジェクトの入り口:https://github.com/deepbeepmeep/wan2gp
キーポイント:
SOTAパフォーマンス:WAN2.1GPは、既存のオープンソースと商業ソリューションを上回り、複数のベンチマークでうまく機能します。
強力な互換性:8.19GBのビデオメモリのみが必要であり、ローエンドユーザーに適したほぼすべての消費者グレードGPUをサポートします。
マルチタスクサポート:ビデオからビデオ、画像からビデオへのテキストなどの複数の世代タスクをサポートし、中国語と英語のテキストを生成する機能を備えています。