Shengshuテクノロジービデオ生成モデルViduバージョン1.5リリースは、「マルチサブジェクトの一貫性」の問題を克服します-AI記事

著者：Eve Cole 更新時間：2025-02-12 03:32:01

Viduが発売されてから100日以上経ってから、Shengshu TechnologyはViduバージョン1.5を壮大に発売しました。これにより、多様化された入力を理解し、「一貫性」の問題を解決するために世界をリードするブレークスルーが行われました。これは、視覚モデルの「コンテキスト」時代へのエントリをマークし、一般的な人工知能（AGI）の加速開発のための強固な基盤を築きます。 Vidu 1.5は、単純な機能アップグレードではなく、視覚モデルのインテリジェンスの出現を反映しています。

Viduが発売されてから100日以上経ってから、Shengshu TechnologyはVidu1.5の新しいバージョンの発売を誇らしげに発表しました。これは、特に多様化された入力を理解し、「一貫性」問題を突破するために、世界の主要レベルでブレークスルーを達成しました。

VIDU1.5の発売は、視覚モデルの「コンテキスト」の新しい時代へのエントリをマークし、一般的な人工知能（AGI）の到着を加速します。 Viduは、グローバルな発売の開始時にキャラクターを一貫して生成する機能を備えており、キャラクターの顔の特徴をロックすることにより、ビデオ生成の重要な問題ポイントを解決しました。 9月、ヴィドゥは「サブジェクトの一貫性」関数をリリースした世界で最初のものであり、全身の一貫性に対する顔の一貫性を拡大し、動物、オブジェクト、仮想文字などの被験者に範囲を拡大しました。 Viduの技術的ブレークスルーは、主に3つの側面に反映されています。複雑な被験者の正確な制御、顔の特徴と動的表現の自然な一貫性、およびマルチサブジェクトの一貫性です。

微信截图_20241113135537.png

微信截图_20241113135531.png

VIDU1.5は、視覚モデルの新しい「インテリジェンスの出現」を示しており、その強力なコンテキスト学習能力を示しています。これは、視覚モデルが理解して想像する能力を持っているだけでなく、生成プロセス中にメモリを管理できることを意味します。 VIDU1.5は、業界をリードする世代の効率を継続し、30秒以内にビデオを生成します。 Viduは、LLM（大手言語モデル）と一致する設計哲学である普遍性の概念を順守し、視覚入力と視覚出力の問題にすべての問題を統合し、単一の変圧器を使用して可変長の入力と出力を均一にモデル化し、単一の変圧器は、可変長入力と出力のモデリングを統合し、ビデオデータから圧縮のインテリジェンスを取得します。

VIDU1.5の発売は、ビデオモデルの制御性を改善するだけでなく、柔軟で多様な入力を介して複数の角度、複数の被験者、複数の要素の一貫した生成を達成します。これは、視覚知能の出現をマークし、AGIの到着を加速します。 Viduは、もはや高品質で効率的なビデオジェネレーターではなく、生成プロセスにコンテキスト情報とメモリを組み込むこともできます。視覚モデルは、より強い認知能力を持ち、AGIの重要なパズルになります。

経験住所：www.vidu.studio

Vidu 1.5のリリースは、技術的なブレークスルーであるだけでなく、視覚知能の分野でのマイルストーンの進歩でもあります。 AGIの将来の発展に新しい可能性を提供し、より多くの分野でのアプリケーションと革新を楽しみにしています。エクスペリエンスアドレスを訪問し、視覚知能の魅力を体験してください！