В поле подкаста Podcastle Platform недавно объявила о запуске своей новой модели Text-To Speek, Asyncflow v1.0. Эта инновационная модель предоставляет пользователям более 450 различных голосов ИИ, охватывающих несколько языков и интонаций, что значительно обогащает выбор голоса. Кроме того, Podcastle также открывает интерфейс API для разработчиков, позволяя им легко интегрировать эту функцию текста в речь в свои приложения, тем самым улучшая пользовательский опыт.

Арто Ерициан, основатель Podcastle, сказал, что компания давно хотела разработать высококачественную модель текста в речь, но эта цель не была достигнута из-за высоких затрат на обучение и требований к данным в прошлом. Тем не менее, с быстрым развитием крупномасштабных языковых модельных технологий в последние годы, подкаст, наконец, сделал серьезный прорыв в прошлом году и смог создать высококачественные голосовые модели, не требуя большого количества данных. Ерицьян также упомянул, что исследования и разработки подкаста были поддержаны финансированием серии А в 13,5 млн. Долл. США в прошлом году, что обеспечивает надежную финансовую поддержку его технологическим инновациям.
С точки зрения цены, обслуживание текста-Voice подкаста составляет около 40 долларов за 500 минут, что является более конкурентоспособным, чем 99 долларов от соперника ElevenLabs. В дополнение к модели текста в речь, функция голоса подкаста также была значительно обновлена. В прошлом пользователи должны были читать 70 различных предложений для обучения модели произношения, но теперь этот процесс был значительно сокращен до записей, которые занимают всего несколько секунд. Это улучшение является благодаря технологии подкаста Magic Dust AI, запущенной в прошлом году, что значительно улучшает качество звуки и делает голосовой клонирование более эффективным и точным.
В реальном тестировании, хотя недавно сгенерированный голос звучит немного роботизированным, он все равно хорошо имитирует тон динамика и ритм. Подкасл сказал, что с постоянным развитием технологий эта функция будет постепенно улучшена, и пользователи также могут обучать более естественные и разнообразные звуковые эффекты, предоставляя различные образцы записи.
Ерицьян отмечает, что в дополнение к преимуществам затрат Podcastle также интегрирует инструменты повествования на аудио, видео, подкасте и на основе AI в переработанный веб-сайт, что отличит подкаст от жесткой конкуренции рынка. Он упомянул, что, хотя большинство пользователей по -прежнему в основном используют подкаст для создания звукового контента, спрос на производство видео также постепенно увеличивается, что указывает на то, что подкаст расширяет свои услуги на несколько полей.
Вход: https://podcastle.ai/ai-voices
Ключевые моменты:
Подкаст запускает модель Asyncflow V1.0, предоставляя более 450 голосов AI.
Платформа взимает 40 долларов за 500 минут текста на голосование, что ниже цены конкурента.
Функция голоса клонирования была обновлена, время обучения было значительно сокращено, и пользовательский опыт был постоянно оптимизирован.