Im Podcast-Feld kündigte die Podcastle-Plattform kürzlich den Start ihres neuen AI-Text-zu-Sprach-Modells Asyncflow v1.0 an. Dieses innovative Modell bietet Benutzern über 450 verschiedene KI -Stimmen, die mehrere Sprachen und Intonationen abdecken und die Sprachauswahl stark bereichern. Darüber hinaus öffnet Podcastle den Entwicklern eine API-Schnittstelle, mit der sie diese Text-zu-Sprache-Funktion problemlos in ihre Anwendungen integrieren können, wodurch die Benutzererfahrung verbessert wird.

Arto Yeritsyan, Gründer von Podcastle, sagte, das Unternehmen wollte lange ein hochwertiges Text-zu-Sprach-Modell entwickeln. Dieses Ziel wurde jedoch aufgrund der hohen Schulungskosten und Datenanforderungen in der Vergangenheit nicht erreicht. Mit der raschen Entwicklung der groß angelegten Sprachmodell-Technologie in den letzten Jahren erzielte Podcastle im vergangenen Jahr schließlich einen großen Durchbruch und konnte hochwertige Sprachmodelle aufbauen, ohne eine große Datenmenge zu erfordern. Yeritsyan erwähnte außerdem, dass die F & E Podcastle im vergangenen Jahr durch eine Finanzierung der Serie A 13,5 Millionen US -Dollar unterstützt wurde, was seine technologische Innovation solide finanzielle Unterstützung bietet.
In Bezug auf den Preis kostet der Text-to-Voice-Service von Podcastle etwa 40 US-Dollar pro 500 Minuten, was wettbewerbsfähiger ist als die 99 US-Dollar von konkurrierenden Elevenlabs. Zusätzlich zum Text-zu-Sprach-Modell wurde die Sprachklonierungsfunktion von Podcastle erheblich verbessert. In der Vergangenheit mussten die Benutzer 70 verschiedene Sätze lesen, um das Aussprachemodell zu trainieren, aber jetzt wurde dieser Prozess stark auf Aufnahmen verkürzt, die nur wenige Sekunden dauern. Diese Verbesserung ist der im vergangenen Jahr eingeführten Magic Dust AI -Technologie von Podcastle zu verdanken, die die Qualität der Audioaufnahme erheblich verbessert und das Sprachklonen effizienter und genauer macht.
Obwohl die neu erzeugte Stimme ein bisschen roboterisch klingt, ahmt sie den Ton und den Rhythmus des Sprechers gut nach und ahmt sie gut nach. Podcastle sagte, dass diese Funktion mit der kontinuierlichen Weiterentwicklung der Technologie allmählich verbessert wird und Benutzer auch natürlichere und vielfältigere Soundeffekte schulen können, indem sie unterschiedliche Aufnahmebestimmungen bereitstellen.
Yeritsyan merkt an, dass Podcastle neben den Kostenvorteilen auch Audio-, Video-, Podcast- und KI-betriebene Erzähl-Tools in eine neu gestaltete Website integriert. Er erwähnte, dass die meisten Benutzer zwar immer noch hauptsächlich Podcastle für die Erstellung von Audioinhalten verwenden, die Nachfrage nach Videoproduktion auch allmählich zunimmt, was darauf hinweist, dass Podcastle seinen Servicebereich auf mehrere Felder erweitert.
Eingang: https://podcastle.ai/ai-Voices
Schlüsselpunkte:
Podcastle startet das Asyncflow V1.0 -Modell und bietet mehr als 450 AI -Stimmen.
Die Plattform berechnet Voice 40 US -Dollar pro 500 Minuten Text, was niedriger als die Preisgestaltung des Konkurrenten ist.
Die Sprachklonierungsfunktion wurde verbessert, die Trainingszeit wurde stark verkürzt und die Benutzererfahrung wurde kontinuierlich optimiert.