O Google Cloud realizou uma importante conferência de lançamento em sua sede da DeepMind em Londres, lançando oficialmente seu mais recente modelo de voz de alta definição Chirp3. Este modelo está aberto a desenvolvedores através da plataforma de aprendizado de máquina unificada da AI Vertex, fornecendo uma riqueza de ferramentas de desenvolvimento projetadas para promover a inovação do programa. O lançamento do Chirp3 marca outro grande avanço para o Google no campo da tecnologia de voz.

O Chirp3 suporta 248 sons diferentes e pode ser sintetizado em 31 idiomas. Os desenvolvedores podem usar esse modelo para criar uma variedade de aplicativos, como assistentes de voz inteligentes, audiolivros e dublagem de vídeo. O Google diz que o recurso de voz de Chirp3 pode capturar nuances na voz humana, tornando a conversa mais vívida e envolvente. As perspectivas de aplicativos dessa tecnologia são amplas e trarão aos usuários uma experiência de interação de voz mais natural e suave.
Além de usar a voz pronta, os usuários também podem criar vozes personalizadas através da API de texto do Google Cloud. No entanto, para garantir o uso responsável, o Google restringe o acesso a esse recurso de clonagem de voz para evitar possíveis abusos e garantir práticas éticas de IA. Esse movimento reflete a ênfase do Google na ética e responsabilidade no desenvolvimento de tecnologia.
Na conferência de imprensa, o CEO do Google Cloud, Thomas Kurian, enfatizou que a visão geral do Google é fornecer uma ampla gama de modelos, incluindo Gêmeos, Imagen, Veil e outros produtos, além do Chirp3. O Google também lançou um novo produto chamado Agent Space, projetado para usuários de negócios para atender às suas necessidades específicas. O lançamento desses produtos enriquecerá ainda mais o ecossistema de AI do Google e fornecerá aos usuários mais opções.
Sir Demis Hassabis, CEO do Google Deepmind, também introduziu a evolução de Gemini, especialmente seu entendimento multimodal. Ele mencionou que, no estúdio de IA, os usuários podem postar links do YouTube, e a Gemini pode processar conteúdo de vídeo, usar sua janela de contexto de longo prazo para permitir que os usuários façam perguntas e rapidamente encontre momentos críticos para palestras ou eventos esportivos. Esse recurso melhorará bastante a eficiência e a experiência dos usuários ao processar o conteúdo de vídeo.
Além disso, o Google aproveitou a oportunidade para anunciar um plano destinado a melhorar as habilidades de IA do Reino Unido por meio de programas de treinamento abrangentes e ajudar os profissionais a dominar efetivamente a tecnologia de IA. O Google fornecerá às startups do Reino Unido pontos para o uso de infraestrutura em nuvem e ferramentas de IA, apoiando -as para desenvolver e escalar rapidamente soluções inovadoras para estimular atividades empresariais. Esse plano ajudará a promover o desenvolvimento da indústria de IA do Reino Unido e cultivará mais talentos de IA.
Em termos de privacidade e conformidade, o Google reitera seu compromisso com a residência de dados, e suas ferramentas de IA do Espaço de AI e do Agente podem ajudar as organizações a treinar e servir modelos em conformidade com as leis locais. Isso é crucial para indústrias como saúde e finanças, onde a privacidade e a conformidade são extremamente exigentes. Esse compromisso do Google aumentará a confiança dos usuários em seus produtos.
Projeto: https://cloud.google.com/text-to-seech/docs/chirp3-hd
Pontos -chave:
O Google Cloud inicia o modelo de voz Chirp3, suportando 248 sons e 31 idiomas, ajudando os desenvolvedores a criar aplicativos inteligentes.
O Google restringe o acesso aos recursos de clonagem de voz para garantir praticar a IA ética e evitar abusos.
O Google inicia os planos para aprimorar as habilidades da IA do Reino Unido e fornecer suporte à infraestrutura em nuvem para iniciantes para promover a inovação.