Podcastle Platform Podcastle lanza el modelo de texto de IA al modelo de habla: proporciona 450 tipos de voces - Artículos de IA

Autor：Eve Cole Fecha de actualización：2025-05-16 13:00:03

En el campo de podcast, la plataforma Podcastle anunció recientemente el lanzamiento de su nuevo modelo de texto a voz de IA, Asyncflow V1.0. Este modelo innovador proporciona a los usuarios más de 450 voces de IA diferentes, que cubren múltiples idiomas y entonaciones, enriqueciendo una selección de voz enormemente enriquecedor. Además, Podcastle también abre una interfaz API a los desarrolladores, lo que les permite integrar fácilmente esta función de texto a voz en sus aplicaciones, mejorando así la experiencia del usuario.

Arto Yeritsyan, fundador de Podcastle, dijo que la compañía ha querido desarrollar un modelo de texto a voz de alta calidad, pero este objetivo no se ha logrado debido a los altos costos de capacitación y los requisitos de datos en el pasado. Sin embargo, con el rápido desarrollo de la tecnología de modelos de lenguaje a gran escala en los últimos años, Podcastle finalmente hizo un gran avance el año pasado, y pudo construir modelos de voz de alta calidad sin requerir una gran cantidad de datos. Yeritsyan también mencionó que la I + D de Podcastle fue respaldada por un financiamiento de la Serie A de $ 13.5 millones el año pasado, que proporciona un sólido apoyo financiero para su innovación tecnológica.

En términos de precio, el servicio de texto a voz de Podcastle tiene un precio de aproximadamente $ 40 por 500 minutos, que es más competitivo que los $ 99 de rival Elevenlabs. Además del modelo de texto a voz, la función de clonación de voz de Podcastle también se ha actualizado significativamente. En el pasado, los usuarios tenían que leer 70 oraciones diferentes para capacitar al modelo de pronunciación, pero ahora, este proceso se ha acortado en gran medida a las grabaciones que toman solo unos segundos. Esta mejora es gracias a la tecnología Magic Dust AI de Podcastle lanzada el año pasado, lo que mejora significativamente la calidad de la grabación de audio y hace que la clonación de voz sea más eficiente y precisa.

En las pruebas reales, aunque la voz recién generada suena un poco robótica, todavía imita bien el tono y el ritmo del altavoz. Podcastle dijo que con el avance continuo de la tecnología, esta característica mejorará gradualmente, y los usuarios también pueden capacitar efectos de sonido más naturales y diversos al proporcionar diferentes muestras de grabación.

Yeritsyan señala que, además de las ventajas de costos, Podcastle también integra herramientas narrativas de audio, video, podcast y IA en un sitio web rediseñado, un movimiento que distingue a Podcastle aparte de la feroz competencia del mercado. Mencionó que aunque la mayoría de los usuarios todavía están utilizando principalmente Podcastle para la creación de contenido de audio, la demanda de producción de video también está aumentando gradualmente, lo que indica que Podcastle está expandiendo su alcance de servicio a múltiples campos.

Entrada: https://podcastle.ai/ai-voices

Puntos clave:

Podcastle lanza el modelo AsyncFlow V1.0, proporcionando más de 450 voces de IA.

La plataforma cobra $ 40 por 500 minutos de texto a voz, que es más bajo que el precio del competidor.

La función de clonación de voz se ha actualizado, el tiempo de entrenamiento se ha acortado en gran medida y la experiencia del usuario se ha optimizado continuamente.