在播客领域,Podcastle 平台近日宣布推出其全新的 AI 文本转语音模型 Asyncflow v1.0。这一创新模型为用户提供了超过450种不同的 AI 语音,涵盖了多种语言和语调,极大地丰富了语音选择。此外,Podcastle 还向开发者开放了 API 接口,使他们能够轻松地将这一文本转语音功能集成到自己的应用程序中,从而提升用户体验。

Podcastle 的创始人 Arto Yeritsyan 表示,公司长期以来一直希望开发一个高质量的文本转语音模型,但由于过去高昂的训练成本和数据需求,这一目标一直未能实现。然而,随着近年来大型语言模型技术的飞速发展,Podcastle 终于在去年取得了重大突破,能够在不需要大量数据的情况下,构建出高质量的语音模型。Yeritsyan 还提到,Podcastle 的研发得到了去年1350万美元的 A 轮融资的支持,这为其技术创新提供了坚实的资金保障。
在价格方面,Podcastle 的文本转语音服务定价为每500分钟约40美元,这一价格相比竞争对手 ElevenLabs 的99美元更具竞争力。除了文本转语音模型外,Podcastle 的语音克隆功能也得到了显著升级。过去,用户需要朗读70句不同的句子来训练语音模型,而现在,这一过程被大幅缩短至仅需几秒的录音。这一改进得益于 Podcastle 去年推出的 Magic Dust AI 技术,该技术显著提高了音频录制质量,使语音克隆更加高效和精准。
在实际测试中,尽管新生成的语音听起来稍显机器人化,但它仍然能够较好地模仿说话者的语调和节奏。Podcastle 表示,随着技术的不断进步,这一功能将逐步改进,用户也可以通过提供不同的录音样本来训练出更加自然和多样化的声音效果。
Yeritsyan 指出,除了成本优势外,Podcastle 还将音频、视频、播客和 AI 驱动的叙述工具整合到一个重新设计的网站中,这一举措将使 Podcastle 在激烈的市场竞争中脱颖而出。他提到,虽然大多数用户目前仍主要使用 Podcastle 进行音频内容创作,但视频制作的需求也在逐渐上升,这表明 Podcastle 正在向多领域扩展其服务范围。
入口:https://podcastle.ai/ai-voices
划重点:
Podcastle 推出 Asyncflow v1.0模型,提供超过450种 AI 语音。
该平台每500分钟文本转语音的收费为40美元,低于竞争对手的定价。
语音克隆功能经过升级,训练时间大幅缩短,用户体验不断优化。