Google Cloudは、ロンドンのDeepmind本社で重要な打ち上げ会議を開催し、最新の高解像度の音声モデルChirp3を正式に発売しました。このモデルは、Vertex AI Unified Machine Learningプラットフォームを介して開発者に開放されており、プログラムの革新を促進するために設計された豊富な開発ツールを提供します。 Chirp3の発売は、Voice Technologyの分野におけるGoogleのもう1つの大きなブレークスルーをマークします。

Chirp3は248の異なるサウンドをサポートし、31言語で合成できます。開発者は、このモデルを使用して、スマートボイスアシスタント、オーディオブック、ビデオダビングなど、さまざまなアプリケーションを作成できます。 Googleは、Chirp3の音声機能が人間の声でニュアンスをキャプチャし、会話をより鮮明で魅力的にすることができると言います。このテクノロジーのアプリケーションの見通しは幅広く、ユーザーはより自然でスムーズな音声相互作用体験をもたらします。
既製の音声を使用することに加えて、ユーザーはGoogle Cloudのテキストを介してAPIを音声で作成することもできます。ただし、責任ある使用を確実にするために、Googleは潜在的な虐待を防ぎ、倫理的AIの実践を確保するために、この音声クローン機能へのアクセスを制限します。この動きは、テクノロジー開発における倫理と責任に対するGoogleの重点を反映しています。
記者会見で、Google Cloud CEOのThomas Kurianは、Googleの全体的なビジョンは、Chirp3に加えてGemini、Imagen、Veil、その他の製品を含む幅広いモデルを提供することであると強調しました。 Googleは、特定のニーズを満たすためにビジネスユーザーが設計されたAgent Spaceと呼ばれる新製品も発売しました。これらの製品の発売により、GoogleのAIエコシステムがさらに濃縮され、ユーザーがより多くの選択肢を提供します。
Google DeepmindのCEOであるDemis Hassabis irも、Geminiの進化、特にマルチモーダルの理解を紹介しました。彼は、AI StudioでユーザーがYouTubeリンクを投稿でき、Geminiはビデオコンテンツを処理し、長期的なコンテキストウィンドウを使用してユーザーに質問をさせ、講義やスポーツイベントの重要な瞬間をすばやく見つけることができると述べました。この機能は、ビデオコンテンツを処理する際のユーザーの効率とエクスペリエンスを大幅に改善します。
さらに、Googleは、包括的なトレーニングプログラムを通じて英国のAIスキルを改善し、専門家がAIテクノロジーを効果的に習得するのを支援することを目的とした計画を発表する機会を得ています。 Googleは、クラウドインフラストラクチャとAIツールを使用するためのポイントを英国のスタートアップに提供し、起業家活動を刺激するための革新的なソリューションを迅速に開発および拡大するようにサポートします。この計画は、英国のAI産業の発展を促進し、より多くのAIの才能を育成するのに役立ちます。
プライバシーとコンプライアンスの観点から、Googleはデータレジデンシーへのコミットメントを繰り返し繰り返しており、その頂点AIおよびエージェントスペースAIツールは、組織が現地の法律に準拠してモデルを訓練および提供するのに役立ちます。これは、プライバシーとコンプライアンスが非常に厳しいヘルスケアや金融などの業界にとって非常に重要です。 Googleからのこのコミットメントは、製品に対するユーザーの信頼を高めます。
プロジェクト:https://cloud.google.com/text-topeech/docs/chirp3-hd
キーポイント:
Google Cloudは、248のサウンドと31の言語をサポートするChirp3音声モデルを起動し、開発者がスマートアプリケーションを構築するのに役立ちます。
Googleは、倫理的AIの実践を確保し、虐待を防ぐために、音声クローニング機能へのアクセスを制限しています。
Googleは、英国のAIスキルを向上させ、イノベーションを促進するためにスタートアップにクラウドインフラストラクチャサポートを提供する計画を開始します。