在播客領域,Podcastle 平台近日宣布推出其全新的AI 文本轉語音模型Asyncflow v1.0。這一創新模型為用戶提供了超過450種不同的AI 語音,涵蓋了多種語言和語調,極大地豐富了語音選擇。此外,Podcastle 還向開發者開放了API 接口,使他們能夠輕鬆地將這一文本轉語音功能集成到自己的應用程序中,從而提升用戶體驗。

Podcastle 的創始人Arto Yeritsyan 表示,公司長期以來一直希望開發一個高質量的文本轉語音模型,但由於過去高昂的訓練成本和數據需求,這一目標一直未能實現。然而,隨著近年來大型語言模型技術的飛速發展,Podcastle 終於在去年取得了重大突破,能夠在不需要大量數據的情況下,構建出高質量的語音模型。 Yeritsyan 還提到,Podcastle 的研發得到了去年1350萬美元的A 輪融資的支持,這為其技術創新提供了堅實的資金保障。
在價格方面,Podcastle 的文本轉語音服務定價為每500分鐘約40美元,這一價格相比競爭對手ElevenLabs 的99美元更具競爭力。除了文本轉語音模型外,Podcastle 的語音克隆功能也得到了顯著升級。過去,用戶需要朗讀70句不同的句子來訓練語音模型,而現在,這一過程被大幅縮短至僅需幾秒的錄音。這一改進得益於Podcastle 去年推出的Magic Dust AI 技術,該技術顯著提高了音頻錄製質量,使語音克隆更加高效和精準。
在實際測試中,儘管新生成的語音聽起來稍顯機器人化,但它仍然能夠較好地模仿說話者的語調和節奏。 Podcastle 表示,隨著技術的不斷進步,這一功能將逐步改進,用戶也可以通過提供不同的錄音樣本來訓練出更加自然和多樣化的聲音效果。
Yeritsyan 指出,除了成本優勢外,Podcastle 還將音頻、視頻、播客和AI 驅動的敘述工具整合到一個重新設計的網站中,這一舉措將使Podcastle 在激烈的市場競爭中脫穎而出。他提到,雖然大多數用戶目前仍主要使用Podcastle 進行音頻內容創作,但視頻製作的需求也在逐漸上升,這表明Podcastle 正在向多領域擴展其服務範圍。
入口:https://podcastle.ai/ai-voices
劃重點:
Podcastle 推出Asyncflow v1.0模型,提供超過450種AI 語音。
該平台每500分鍾文本轉語音的收費為40美元,低於競爭對手的定價。
語音克隆功能經過升級,訓練時間大幅縮短,用戶體驗不斷優化。