팟 캐스트 필드에서 Podcastle 플랫폼은 최근 새로운 AI 텍스트 연설 모델 인 Asyncflow v1.0의 출시를 발표했습니다. 이 혁신적인 모델은 여러 언어와 억양을 다루는 450 개가 넘는 AI 음성을 사용자에게 제공하여 음성 선택을 크게 풍부하게합니다. 또한 Podcastle은 개발자에게 API 인터페이스를 열어서이 텍스트 음성 기능을 응용 프로그램에 쉽게 통합하여 사용자 경험을 향상시킬 수 있습니다.

Podcastle의 설립자 인 Arto Yeritsyan 은이 회사가 오랫동안 고품질 텍스트 음성 연설 모델을 개발하고 싶었지만 과거의 높은 교육 비용과 데이터 요구 사항으로 인해이 목표를 달성하지 못했다고 말했다. 그러나 최근 몇 년간 대규모 언어 모델 기술의 빠른 개발로 Podcastle은 작년에 큰 획기적인 획기적인 발전을 이루었으며 많은 양의 데이터를 필요로하지 않고 고품질 음성 모델을 구축 할 수있었습니다. Yeritsyan은 또한 Podcastle의 R & D가 작년에 1,350 만 달러의 시리즈 A 파이낸싱으로 뒷받침되었으며, 이는 기술 혁신에 대한 확실한 재정 지원을 제공합니다.
가격 측면에서, Podcastle의 텍스트-투명 서비스는 500 분당 약 $ 40로 가격이 책정되며, 이는 라이벌 Elevenlabs의 $ 99보다 경쟁력이 있습니다. 텍스트 음성 연설 모델 외에도 Podcastle의 음성 복제 기능도 크게 업그레이드되었습니다. 과거에는 사용자가 발음 모델을 훈련시키기 위해 70 개의 다른 문장을 읽어야했지만 이제는이 과정이 몇 초 밖에 걸리지 않는 녹음으로 크게 단축되었습니다. 이러한 개선은 작년에 출시 된 Podcastle의 Magic Dust AI 기술 덕분에 오디오 녹음 품질을 크게 향상시키고 음성 복제를보다 효율적이고 정확하게 만듭니다.
실제 테스트에서는 새로 생성 된 목소리가 약간 로봇 소리가 들리지만 여전히 스피커의 톤과 리듬을 잘 모방합니다. Podcastle은 기술의 지속적인 발전 으로이 기능이 점차 개선 될 것이며 사용자는 다양한 녹음 샘플을 제공하여보다 자연스럽고 다양한 음향 효과를 훈련시킬 수 있다고 말했다.
Yeritsyan은 비용 장점 외에도 Podcastle은 오디오, 비디오, 팟 캐스트 및 AI 구동 서사 도구를 재 설계된 웹 사이트에 통합하여 Podcastle이 Fierce Market 경쟁과 차별화 될 것입니다. 그는 대부분의 사용자가 여전히 오디오 컨텐츠 생성을 위해 여전히 Podcastle을 사용하고 있지만 비디오 제작에 대한 수요도 점차 증가하고 있으며 Podcastle이 서비스 범위를 여러 분야로 확장하고 있음을 나타냅니다.
입구 : https://podcastle.ai/ai-voices
핵심 사항 :
Podcastle은 Asyncflow v1.0 모델을 시작하여 450 개 이상의 AI 음성을 제공합니다.
이 플랫폼은 500 분당 텍스트로 $ 40를 청구하며, 이는 경쟁 업체의 가격보다 낮습니다.
음성 복제 기능이 업그레이드되었고 교육 시간이 크게 단축되었으며 사용자 경험이 지속적으로 최적화되었습니다.