Soul App近期在「AI+社群」領域取得重大突破! Downcodes小編獲悉,Soul官方宣布其自研的端對端全雙工語音通話大模型再次升級,實現了與虛擬人進行如同真人般自然流暢的語音對話。此舉標誌著Soul在AI技術應用方面邁出了重要一步,為用戶帶來了更具沉浸感和互動性的社交體驗。本文將深入探討此大模型的獨特之處以及Soul在AI社交領域的探索。
在國內「AI+社交」這條賽道上,Soul App即將利用AI注入了新的活力!
最近,Soul官方宣布其語音大模型再次升級,上線自研端對端全雙工語音通話大模型。
這次升級帶來最驚人的效果是,可以讓使用者和虛擬人之間的語音通話就像和真人聊天一樣自然流暢!
效果有多真實,大家可以先看看下面的影片感受:
官方展示的「體驗與AI即時通話」的範例
那麼,Soul自研端對端語音通話大模型到底有什麼特別之處呢?根據官方描述,其最大的亮點包括:
具備超低互動延遲
快速自動打斷
超真實聲音表達
情緒感知理解能力等
超低互動延遲能力意味著,你說話的那一瞬間,AI 就能立刻做出反應,沒有任何的延遲,瞬間就能拉近你和AI 之間的距離。想要和它進行真實的交流,根本不需要等待,簡直就像在跟真人對話一樣。
Soul 的語音大模型支援快速自動打斷功能。也就是說,當你和AI 交流的時候,如果你想插話,它完全能理解你的意思,輕鬆打斷對方,這樣的互動真是太有趣了!
最後,再加上超真實的聲音表達和情緒感知理解能力,AI 不僅能聽懂你的話,還能感知你的情緒,根據情緒給予適當的回應。
結合官方展示的影片範例,如果這個功能之後全量上線,估計有一大波用戶在Soul上體驗的時候,可能會連真人和AI虛擬人都傻傻分不清楚。
Soul方面表示,目前其端對端語音通話大模型已應用於「異世界迴響」即時通話場景(內測中),並將在後續拓展至AI苟蛋等多個AI陪伴、AI互動場景。

據了解,早在2020年,Soul已經啟動了AIGC技術研發,專注於智慧對話、語音技術、虛擬人等關鍵技術的研發,並把這些AI能力深度融入到社交場景中。
在用AI升級社交的過程中,Soul特別著重實現擬人化、自然化的情感陪伴體驗。
為了帶給用戶更好的情緒回饋和陪伴感,Soul技術團隊一直在關注情緒理解和延遲問題。他們推出了自研的語音生成大模型、語音辨識大模型、語音對話大模型、音樂生成大模型等,支援真實音色生成、語音DIY、多語言切換、多情感擬真人即時對話等功能,這些已經應用在了Soul的多個場景中,例如「AI苟蛋」、「狼人魅影」AI語音即時互動、「異世界迴響」等。
Soul自研的端對端語音通話大模型上線了,代表使用者可以享受更自然的人機互動體驗。未來,Soul 也計畫進一步推動多模態端到端大模型能力的建設,讓人與AI 的互動更加有趣、沉浸感更強。
Soul此次的AI技術升級,不僅提升了使用者體驗,也為未來「AI+社交」的發展方向提供了新的思路。相信在不久的將來,我們將看到更多基於AI技術的創新社交應用出現,為人們的社交生活帶來更多樂趣和便利。