谷歌云在伦敦的DeepMind总部举办了一场重要发布会,正式推出了其最新的高清语音模型Chirp3。这一模型通过Vertex AI统一机器学习平台向开发者开放,提供了丰富的开发工具,旨在推动程序创新。Chirp3的发布标志着谷歌在语音技术领域的又一重大突破。

Chirp3支持248种不同的声音,并可用31种语言进行语音合成。开发者可以利用这一模型创建多种应用,如智能语音助手、有声读物和视频配音等。谷歌表示,Chirp3的语音功能能够捕捉人类语调的细微差别,使得对话更加生动和引人入胜。这一技术的应用前景广阔,将为用户带来更加自然和流畅的语音交互体验。
除了使用现成的语音,用户还可以通过谷歌云的文本转语音API创建自定义语音。然而,谷歌为了确保负责任的使用,限制了这一语音克隆功能的访问权限,以防止潜在的滥用行为,并确保符合伦理AI的实践。这一举措体现了谷歌在技术开发中对伦理和责任的重视。
在发布会上,谷歌云首席执行官托马斯・库里安(Thomas Kurian)强调,谷歌的总体愿景是提供一系列广泛的模型,除了Chirp3外,还包括Gemini、Imagen、Veil等多款产品。谷歌还推出了一个名为Agent Space的新产品,专为商业用户设计,以满足其特定需求。这些产品的推出将进一步丰富谷歌的AI生态系统,为用户提供更多选择。
谷歌DeepMind的首席执行官德米斯・哈萨比斯(Sir Demis Hassabis)也介绍了Gemini的演进,尤其是其多模态理解能力。他提到,在AI Studio中,用户可以发布YouTube链接,Gemini能够处理视频内容,利用其长时上下文窗口让用户提问,快速找到讲座或体育赛事的关键时刻。这一功能将极大地提升用户在处理视频内容时的效率和体验。
此外,谷歌还借此机会宣布了一项计划,旨在通过综合培训项目来提升英国的AI技能,帮助专业人士有效掌握AI技术。谷歌将向英国初创企业提供云基础设施和AI工具的使用积分,支持它们快速开发和扩展创新解决方案,以刺激创业活动。这一计划将有助于推动英国AI产业的发展,培养更多AI人才。
在隐私和合规性方面,谷歌重申了对数据驻留的承诺,其Vertex AI和Agent Space AI工具可以帮助组织在符合当地法律的情况下,进行模型的训练和服务。这一点对于医疗和金融等行业至关重要,因为这些领域对隐私和合规性要求极高。谷歌的这一承诺将增强用户对其产品的信任。
项目:https://cloud.google.com/text-to-speech/docs/chirp3-hd
划重点:
谷歌云推出Chirp3语音模型,支持248种声音和31种语言,助力开发者构建智能应用。
谷歌限制语音克隆功能的访问权限,以确保伦理AI的实践和防止滥用。
谷歌发起计划提升英国AI技能,并向初创企业提供云基础设施支持,促进创新。