Di bidang podcast, platform Podcastle baru-baru ini mengumumkan peluncuran model AI Text-to-Speech baru, Asyncflow v1.0. Model inovatif ini memberi pengguna lebih dari 450 suara AI yang berbeda, yang mencakup berbagai bahasa dan intonasi, sangat memperkaya pemilihan suara. Selain itu, Podcastle juga membuka antarmuka API untuk pengembang, memungkinkan mereka untuk dengan mudah mengintegrasikan fitur teks-ke-speech ini ke dalam aplikasi mereka, sehingga meningkatkan pengalaman pengguna.

Arto Yeritsyan, pendiri Podcastle, mengatakan perusahaan telah lama ingin mengembangkan model teks-ke-unggun berkualitas tinggi, tetapi tujuan ini belum tercapai karena biaya pelatihan yang tinggi dan persyaratan data di masa lalu. Namun, dengan perkembangan cepat teknologi model bahasa skala besar dalam beberapa tahun terakhir, Podcastle akhirnya membuat terobosan besar tahun lalu, dan mampu membangun model suara berkualitas tinggi tanpa memerlukan sejumlah besar data. Yerititsyan juga menyebutkan bahwa R&D Podcastle didukung oleh pembiayaan Seri A $ 13,5 juta tahun lalu, yang memberikan dukungan keuangan yang solid untuk inovasi teknologinya.
Dalam hal harga, layanan teks-ke-suara Podcastle dihargai sekitar $ 40 per 500 menit, yang lebih kompetitif daripada $ 99 dari saingannya sebelas lab. Selain model teks-ke-pidato, fungsi kloning suara Podcastle juga telah ditingkatkan secara signifikan. Di masa lalu, pengguna harus membaca 70 kalimat berbeda untuk melatih model pengucapan, tetapi sekarang, proses ini telah sangat dipersingkat menjadi rekaman yang hanya membutuhkan beberapa detik. Peningkatan ini berkat teknologi AI Magic Dust AI Podcastle yang diluncurkan tahun lalu, yang secara signifikan meningkatkan kualitas rekaman audio dan membuat kloning suara lebih efisien dan akurat.
Dalam pengujian yang sebenarnya, meskipun suara yang baru dihasilkan terdengar sedikit robot, itu masih meniru nada dan ritme pembicara dengan baik. Podcastle mengatakan bahwa dengan kemajuan teknologi yang berkelanjutan, fitur ini akan ditingkatkan secara bertahap, dan pengguna juga dapat melatih efek suara yang lebih alami dan beragam dengan memberikan sampel rekaman yang berbeda.
Yerititsyan mencatat bahwa selain keunggulan biaya, Podcastle juga mengintegrasikan alat audio, video, podcast, dan alat naratif bertenaga AI ke dalam situs web yang didesain ulang, sebuah langkah yang akan membedakan Podcastle dari persaingan pasar yang sengit. Dia menyebutkan bahwa meskipun sebagian besar pengguna masih menggunakan Podcastle untuk pembuatan konten audio, permintaan untuk produksi video juga secara bertahap meningkat, menunjukkan bahwa Podcastle memperluas ruang lingkup layanannya ke berbagai bidang.
Pintu masuk: https://podcastle.ai/ai-voices
Poin -Poin Kunci:
Podcastle meluncurkan model asyncflow v1.0, menyediakan lebih dari 450 suara AI.
Platform mengenakan biaya $ 40 per 500 menit teks untuk disuarakan, yang lebih rendah dari harga pesaing.
Fungsi kloning suara telah ditingkatkan, waktu pelatihan telah sangat dipersingkat, dan pengalaman pengguna telah terus dioptimalkan.