No campo do podcast, a plataforma podcastle anunciou recentemente o lançamento de seu novo modelo de texto para fala da AI, asyncflow v1.0. Esse modelo inovador fornece aos usuários mais de 450 vozes de IA diferentes, cobrindo vários idiomas e entonações, enriquecendo bastante a seleção de voz. Além disso, o Podcastle também abre uma interface de API para os desenvolvedores, permitindo que eles integrem facilmente esse recurso de texto em fala em seus aplicativos, aprimorando assim a experiência do usuário.

Arto Yeritsyan, fundador da Podcastle, disse que a empresa há muito tempo quer desenvolver um modelo de texto em fala de alta qualidade, mas esse objetivo não foi alcançado devido aos altos custos de treinamento e requisitos de dados no passado. No entanto, com o rápido desenvolvimento da tecnologia de modelos de linguagem em larga escala nos últimos anos, o Podcastle finalmente fez um grande avanço no ano passado e conseguiu criar modelos de voz de alta qualidade sem exigir uma grande quantidade de dados. Yeritsyan também mencionou que a P&D do Podcastle foi apoiada por um financiamento da Série A de US $ 13,5 milhões no ano passado, que fornece um sólido apoio financeiro para sua inovação tecnológica.
Em termos de preço, o serviço de texto para voz do Podcastle custa cerca de US $ 40 por 500 minutos, o que é mais competitivo que os US $ 99 da rival Elevenlabs. Além do modelo de texto em fala, a função de clonagem de voz do Podcastle também foi significativamente atualizada. No passado, os usuários tinham que ler 70 frases diferentes para treinar o modelo de pronúncia, mas agora esse processo foi bastante reduzido para gravações que levam apenas alguns segundos. Essa melhoria é graças à tecnologia mágica de pó mágica do Podcastle lançado no ano passado, o que melhora significativamente a qualidade da gravação de áudio e torna a clonagem de voz mais eficiente e precisa.
Nos testes reais, embora a voz recém -gerada pareça um pouco robótica, ela ainda imita bem o tom e o ritmo do falante. O Podcastle disse que, com o avanço contínuo da tecnologia, esse recurso será gradualmente melhorado e os usuários também podem treinar efeitos sonoros mais naturais e diversos, fornecendo diferentes amostras de gravação.
Yeritsyan observa que, além das vantagens de custo, o Podcastle também integra ferramentas narrativas de áudio, vídeo, podcast e IA em um site reprojetado, um movimento que diferenciará o podcastle da feroz concurso do mercado. Ele mencionou que, embora a maioria dos usuários ainda esteja usando o podcastle principalmente para criação de conteúdo de áudio, a demanda por produção de vídeo também está aumentando gradualmente, indicando que o Podcastle está expandindo seu escopo de serviço para vários campos.
Entrada: https://podcastle.ai/ai-voices
Pontos -chave:
O Podcastle lança o modelo AsyncFlow v1.0, fornecendo mais de 450 vozes de IA.
A plataforma cobra US $ 40 por 500 minutos de texto em voz, o que é menor que o preço do concorrente.
A função de clonagem de voz foi atualizada, o tempo de treinamento foi bastante reduzido e a experiência do usuário foi otimizada continuamente.