谷歌云在倫敦的DeepMind總部舉辦了一場重要發布會,正式推出了其最新的高清語音模型Chirp3。這一模型通過Vertex AI統一機器學習平台向開發者開放,提供了豐富的開發工具,旨在推動程序創新。 Chirp3的發布標誌著谷歌在語音技術領域的又一重大突破。

Chirp3支持248種不同的聲音,並可用31種語言進行語音合成。開發者可以利用這一模型創建多種應用,如智能語音助手、有聲讀物和視頻配音等。谷歌表示,Chirp3的語音功能能夠捕捉人類語調的細微差別,使得對話更加生動和引人入勝。這一技術的應用前景廣闊,將為用戶帶來更加自然和流暢的語音交互體驗。
除了使用現成的語音,用戶還可以通過谷歌云的文本轉語音API創建自定義語音。然而,谷歌為了確保負責任的使用,限制了這一語音克隆功能的訪問權限,以防止潛在的濫用行為,並確保符合倫理AI的實踐。這一舉措體現了谷歌在技術開發中對倫理和責任的重視。
在發布會上,谷歌云首席執行官托馬斯・庫里安(Thomas Kurian)強調,谷歌的總體願景是提供一系列廣泛的模型,除了Chirp3外,還包括Gemini、Imagen、Veil等多款產品。谷歌還推出了一個名為Agent Space的新產品,專為商業用戶設計,以滿足其特定需求。這些產品的推出將進一步豐富谷歌的AI生態系統,為用戶提供更多選擇。
谷歌DeepMind的首席執行官德米斯・哈薩比斯(Sir Demis Hassabis)也介紹了Gemini的演進,尤其是其多模態理解能力。他提到,在AI Studio中,用戶可以發布YouTube鏈接,Gemini能夠處理視頻內容,利用其長時上下文窗口讓用戶提問,快速找到講座或體育賽事的關鍵時刻。這一功能將極大地提升用戶在處理視頻內容時的效率和體驗。
此外,谷歌還藉此機會宣布了一項計劃,旨在通過綜合培訓項目來提升英國的AI技能,幫助專業人士有效掌握AI技術。谷歌將向英國初創企業提供雲基礎設施和AI工具的使用積分,支持它們快速開發和擴展創新解決方案,以刺激創業活動。這一計劃將有助於推動英國AI產業的發展,培養更多AI人才。
在隱私和合規性方面,谷歌重申了對數據駐留的承諾,其Vertex AI和Agent Space AI工具可以幫助組織在符合當地法律的情況下,進行模型的訓練和服務。這一點對於醫療和金融等行業至關重要,因為這些領域對隱私和合規性要求極高。谷歌的這一承諾將增強用戶對其產品的信任。
項目:https://cloud.google.com/text-to-speech/docs/chirp3-hd
劃重點:
谷歌云推出Chirp3語音模型,支持248種聲音和31種語言,助力開發者構建智能應用。
谷歌限制語音克隆功能的訪問權限,以確保倫理AI的實踐和防止濫用。
谷歌發起計劃提升英國AI技能,並向初創企業提供雲基礎設施支持,促進創新。