Vidu がオンラインになってから 100 日以上が経過し、Shengshu Technology は Vidu バージョン 1.5 を正式にリリースしました。このバージョンは、多様な入力の理解と「一貫性」の問題の解決において世界をリードする画期的な進歩をもたらしました。 Downcodes のエディターでは、Vidu 1.5 によってもたらされたイノベーションと、Vidu 1.5 がどのようにビジュアル モデルを「コンテキスト」時代に移行させ、汎用人工知能 (AGI) の到来を加速させるのかを深く理解できます。
Vidu がオンラインになってから 100 日以上が経過したことを機に、Shengshu Technology は Vidu 1.5 の新バージョンのリリースを発表できることを誇りに思います。これは、特に多様な入力の理解と「一貫性」の突破において、世界をリードする画期的な進歩を達成しました。問題。
Vidu1.5 のリリースは、ビジュアル モデルが新しい「コンテキスト」時代に入り、汎用人工知能 (AGI) の到来を加速することを示しています。 Vidu は世界的な発売以来、一貫したキャラクターを生成する機能を備えており、キャラクターの顔の特徴をロックすることでビデオ生成における主要な問題点を解決しています。 Viduは9月に世界で初めて「被写体の一貫性」機能をリリースし、顔の一貫性を全身の一貫性まで拡張し、範囲を動物、物体、仮想キャラクターなどあらゆる被写体に拡張しました。 Vidu の技術的進歩は主に 3 つの側面に反映されています。複雑な被写体の正確な制御、顔の特徴とキャラクターのダイナミックな表現の自然な一貫性、および複数の被写体の一貫性です。


Vidu1.5 は、ビジュアル モデルとその強力なコンテキスト学習機能の新しい「インテリジェントな出現」を実証します。これは、ビジュアル モデルが理解して想像する能力があるだけでなく、生成プロセス中にメモリ管理も実行できることを意味します。 Vidu1.5 は業界をリードする生成効率を維持しており、30 秒未満でビデオを生成できます。 Vidu は、汎用性の概念と LLM (Large Language Model) に準拠した設計哲学を遵守し、すべての問題を視覚的な入力と視覚的な出力の問題に統合し、単一の Transformer を使用して可変長の入力と出力を均一にモデル化し、ビデオ データから取得します。圧縮されたインテリジェンス。
Vidu1.5 のリリースにより、ビデオ モデルの制御性が向上するだけでなく、柔軟な複数入力を通じて複数のアングル、複数の被写体、複数の要素の一貫した生成が実現されます。これは視覚知能の出現を示し、AGI の到来を加速します。 Vidu はもはや、高品質で効率的なビデオ ジェネレーターであるだけでなく、コンテキスト情報とメモリを生成プロセスに組み込むこともできます。これは、ビジュアル モーダル インテリジェンスの「大きな進歩」です。視覚モデルはより強力な認知機能を持ち、AGI パズルの重要なピースになります。
体験アドレス: www.vidu.studio
Vidu バージョン 1.5 のリリースは、ビジュアル AI テクノロジーの新たな章を告げるものです。その強力な機能と便利な操作は、ユーザーに新しいビデオ生成体験をもたらすでしょう。 Vidu が将来の開発で躍進を続け、AGI の登場にさらに貢献することを楽しみにしています。