ポッドキャストフィールドでは、Podcastle Platformは最近、新しいAIテキストからスピーチモデルAsyncflow v1.0の発売を発表しました。この革新的なモデルは、ユーザーが450を超えるさまざまなAIボイスを提供し、複数の言語とイントネーションをカバーし、音声選択を大幅に濃縮します。さらに、Podcastleは開発者へのAPIインターフェイスも開き、このテキストからスピーチの機能をアプリケーションに簡単に統合できるため、ユーザーエクスペリエンスが向上します。

Podcastleの創設者であるArto Yeritsyanは、同社は長い間高品質のテキストからスピーチモデルの開発を望んでいたと述べましたが、この目標は過去のトレーニングコストとデータの要件が高いために達成されていません。しかし、近年、大規模な言語モデルテクノロジーの急速な発展に伴い、ポッドキャッスルは昨年、ついに大きなブレークスルーを行い、大量のデータを必要とせずに高品質の音声モデルを構築することができました。 Yeritsyanはまた、PodcastleのR&Dは昨年1億350万ドルのシリーズAファイナンスに支えられており、技術革新に対する堅実な財政的支援を提供していると述べました。
価格に関しては、ポッドキャッスルのテキストから声へのサービスの価格は500分あたり約40ドルで、ライバルのイレブンラブからの99ドルよりも競争力があります。テキストからスピーチへのモデルに加えて、Podcastleの音声クローン機能も大幅にアップグレードされています。過去には、ユーザーは発音モデルを訓練するために70の異なる文章を読む必要がありましたが、今では、このプロセスは数秒しかかからない録音に対して大幅に短縮されています。この改善は、昨年開始されたPodcastleのMagic Dust AIテクノロジーのおかげであり、オーディオの記録品質を大幅に向上させ、音声クローニングをより効率的かつ正確にします。
実際のテストでは、新しく生成された音声は少しロボット的に聞こえますが、スピーカーのトーンとリズムをよく模倣しています。 Podcastleは、テクノロジーの継続的な進歩により、この機能は徐々に改善され、ユーザーはさまざまな記録サンプルを提供することで、より自然で多様な効果音を訓練することもできると述べました。
Yeritsyanは、コストの利点に加えて、Podcastleはオーディオ、ビデオ、ポッドキャスト、AI駆動の物語ツールを再設計されたWebサイトに統合していることに注意してください。彼は、ほとんどのユーザーはまだ主にオーディオコンテンツの作成にPodcastleを使用していますが、ビデオ制作の需要も徐々に増加しており、Podcastleがそのサービス範囲を複数のフィールドに拡大していることを示しています。
入り口:https://podcastle.ai/ai-voices
キーポイント:
Podcastleは、Asyncflow v1.0モデルを起動し、450以上のAI声を提供します。
このプラットフォームは、500分間のテキストごとに40ドルを請求します。これは、競合他社の価格よりも低いです。
音声クローニング機能がアップグレードされ、トレーニング時間が大幅に短縮され、ユーザーエクスペリエンスが継続的に最適化されています。