ソウルアップは最近「AI+ソーシャル」の分野で大躍進中! Downcodes の編集者は、Soul が自社開発したエンドツーエンドの全二重音声通話モデルが再びアップグレードされ、仮想の人々と現実の人々と同様に自然でスムーズな音声会話が可能になったと公式に発表したことを知りました。この動きは、Soul にとって AI テクノロジーの応用における重要なステップとなり、ユーザーにより没入型でインタラクティブなソーシャル エクスペリエンスをもたらします。この記事では、この大型モデルのユニークな機能と、AI ソーシャル分野におけるソウルの探求について詳しく掘り下げていきます。
国内の「AI + ソーシャル」路線で、Soul App は AI を活用して新たな活力を注入しようとしています。
最近、Soul は音声モデルが再びアップグレードされ、自社開発のエンドツーエンド全二重音声通話モデルが開始されたことを正式に発表しました。
このアップグレードの最も驚くべき効果は、ユーザーと仮想人物間の音声通話が、現実の人物とチャットするのと同じくらい自然でスムーズになることです。
効果はどのくらい現実的ですか? まずは以下のビデオを見て、その感触を味わってください。
「AIによるリアルタイム通話を体験」の公式事例
では、Soul が自社開発したエンドツーエンド音声通話モデルの何がそんなに特別なのでしょうか? 公式説明によると、その最大のハイライトは次のとおりです。
超低インタラクション遅延
素早い自動中断
超リアルな音声表現
感情の知覚・理解能力など
超低インタラクション遅延能力とは、話しかけた瞬間にAIが遅延なく即座に応答し、あなたとAIの距離を一瞬で縮めることができます。実際にコミュニケーションを取りたい場合は、待つ必要はまったくありません。まるで実際の人間と話しているのと同じです。
Soul のラージボイスモデルは高速自動中断をサポートします。つまり、AIとコミュニケーションをとっているときに、こちらが遮ろうと思えば、相手の意図を完全に理解して、簡単に遮ってくれる、このやりとりがとても面白いんです!
最後に、超リアルな音声表現と感情の知覚および理解機能と組み合わせることで、AI はあなたの言葉を理解するだけでなく、あなたの感情を感知し、あなたの感情に基づいて適切な応答を返すことができます。
公式ビデオの例に基づくと、この機能が将来的に本格的にリリースされると、多くのユーザーが Soul でこの機能を体験すると、現実の人間と AI 仮想人間の区別がつかなくなる可能性があると推定されます。
Soul は、そのエンドツーエンドの音声通話大規模モデルが「Echo of Another World」リアルタイム通話シナリオ (内部テスト中) に適用され、AI などの複数の AI コンパニオンシップおよび AI インタラクション シナリオに拡張されると述べました。未来のゴウダン。

ソウルは、2020年の早い段階でAIGCテクノロジーの研究開発を開始し、インテリジェントな対話、音声テクノロジー、バーチャルヒューマンなどの主要テクノロジーの研究開発に焦点を当て、これらのAI機能を社会シナリオに深く統合したことがわかっています。
AI を使用して社会的交流をアップグレードする過程で、Soul は擬人化された自然な感情的な交友体験を実現することに特別な注意を払っています。
ユーザーにより良い感情的なフィードバックと親睦をもたらすために、Soul 技術チームは感情の理解と遅延の問題に注意を払ってきました。自社開発の音声生成モデル、音声認識モデル、音声対話モデル、音楽生成モデルなどを発売しており、リアルトーン生成、音声DIY、多言語切り替え、多感情没入型リアルタイム対話などの機能をサポートしています。これらはすでに「AI轟弾」、「人狼ファントム」AI音声リアルタイムインタラクション、「異世界からの響き」など、ソウルの複数のシナリオで使用されています。
Soul が自社開発したエンドツーエンドの音声通話モデルがオンラインになり、ユーザーはより自然な人間とコンピューターの対話体験を楽しむことができます。将来的には、Soul は、人間と AI の間のインタラクションをより興味深く、没入感のあるものにするために、マルチモーダルなエンドツーエンドの大規模モデル機能の構築をさらに推進する予定です。
今回のソウルのAI技術アップグレードは、ユーザーエクスペリエンスを向上させるだけでなく、「AI + ソーシャル」という将来の発展方向に新たなアイデアを提供します。近い将来、AI技術をベースにしたさらに革新的なソーシャルアプリケーションが登場し、人々の社会生活がより楽しく便利になると信じています。