Google Cloud는 런던의 Deepmind 본사에서 중요한 런칭 컨퍼런스를 개최하여 공식적으로 최신 고화질 음성 모델 ChIRP3을 출시했습니다. 이 모델은 Vertex AI Unified Machine Learning 플랫폼을 통해 개발자에게 공개되어 프로그램 혁신을 촉진하도록 설계된 풍부한 개발 도구를 제공합니다. ChIRP3의 출시는 음성 기술 분야에서 Google의 또 다른 주요 획기적인 획기적인 발전을 보여줍니다.

ChIRP3는 248 개의 서로 다른 사운드를 지원하며 31 개 언어로 합성 할 수 있습니다. 개발자는이 모델을 사용하여 Smart Voice Assistant, Audiobooks 및 Video Dubbing과 같은 다양한 응용 프로그램을 만들 수 있습니다. Google은 Chirp3의 음성 기능이 인간의 목소리로 뉘앙스를 포착하여 대화를보다 생생하고 매력적으로 만들 수 있다고 말합니다. 이 기술의 응용 전망은 광범위하며 사용자에게보다 자연스럽고 부드러운 음성 상호 작용 경험을 제공합니다.
기성품 음성을 사용하는 것 외에도 Google Cloud의 텍스트를 통해 Voice API를 통해 사용자 정의 음성을 만들 수도 있습니다. 그러나 책임있는 사용을 보장하기 위해 Google 은이 음성 복제 기능에 대한 액세스를 제한하여 잠재적 인 남용을 방지하고 윤리적 AI 관행을 보장합니다. 이러한 움직임은 기술 개발의 윤리와 책임에 대한 Google의 강조를 반영합니다.
기자 회견에서 Google Cloud CEO Thomas Kurian은 Google의 전반적인 비전은 ChiRP3 외에 Gemini, Imagen, Veil 및 기타 제품을 포함한 광범위한 모델을 제공하는 것이라고 강조했습니다. Google은 또한 비즈니스 사용자가 특정 요구 사항을 충족하도록 설계된 Agent Space라는 새로운 제품을 출시했습니다. 이 제품의 출시는 Google의 AI 생태계를 더욱 풍부하게하고 사용자에게 더 많은 선택을 제공 할 것입니다.
Google Deepmind의 CEO 인 Demis Hassabis 경은 또한 Gemini의 진화, 특히 멀티 모달 이해를 소개했습니다. 그는 AI Studio에서 사용자는 YouTube 링크를 게시 할 수 있으며 Gemini는 비디오 컨텐츠를 처리하고 장기 컨텍스트 창을 사용하여 사용자가 질문을 할 수 있도록하며 강의 나 스포츠 이벤트에 대한 중요한 순간을 신속하게 찾을 수 있다고 언급했습니다. 이 기능은 비디오 컨텐츠를 처리 할 때 사용자의 효율성과 경험을 크게 향상시킵니다.
또한 Google은 포괄적 인 교육 프로그램을 통해 영국의 AI 기술을 향상시키고 전문가가 AI 기술을 효과적으로 마스터하도록 돕기위한 계획을 발표 할 기회를 얻었습니다. Google은 영국 신생 기업에 클라우드 인프라 및 AI 도구 사용 포인트를 제공하여 기업가 활동을 자극하기 위해 혁신적인 솔루션을 신속하게 개발하고 확장 할 수 있도록 지원합니다. 이 계획은 영국의 AI 산업의 발전을 촉진하고 더 많은 AI 인재를 양성하는 데 도움이 될 것입니다.
개인 정보 보호 및 규정 준수 측면에서 Google은 데이터 거주에 대한 약속을 되풀이하며 Vertex AI 및 Agent Space AI 도구는 조직이 현지 법률을 준수하는 모델을 훈련시키고 서비스 할 수 있습니다. 이는 개인 정보 및 규정 준수가 매우 까다로운 의료 및 금융과 같은 산업에 중요합니다. Google의 이러한 약속은 제품에 대한 사용자의 신뢰를 높일 것입니다.
프로젝트 : https://cloud.google.com/text-to-speech/docs/chirp3-hd
핵심 사항 :
Google Cloud는 248 개의 사운드와 31 개의 언어를 지원하는 ChIRP3 음성 모델을 출시하여 개발자가 스마트 애플리케이션을 구축 할 수 있도록 도와줍니다.
Google은 윤리적 AI 관행을 보장하고 남용을 방지하기 위해 음성 복제 기능에 대한 액세스를 제한합니다.
Google은 영국 AI 기술을 향상시키고 클라우드 인프라 지원을 시작하여 스타트 업에 혁신을 촉진하기위한 계획을 시작합니다.