Minimania adalah aplikasi web yang menyediakan kemampuan teks-ke-pidato (TTS) dan kloning suara. Aplikasi ini menggunakan model pembelajaran yang mendalam untuk menghasilkan output ucapan berkualitas tinggi dalam berbagai bahasa, dengan opsi untuk menyesuaikan pitch, kecepatan, dan volume audio yang dihasilkan. Mesin TTS Minimania dibangun di atas model Tacotron 2 dan Waveglow, sementara kemampuan kloning suaranya didasarkan pada model FastSpeech dan Melgan.
Klik tautan mega untuk melihat demo: tautan untuk video
Sebelum Anda dapat menginstal dan menggunakan Mimicmania, Anda harus mengunduh dan menginstal yang berikut:
apt-get install ffmpeg di terminal Anda.sudo apt-get install espeak-ng di terminal Anda.sudo apt-get install espeak di terminal Anda.Selain itu, Anda juga perlu mengunduh modul yang diperlukan dan dependensi Python seperti yang dijelaskan pada bagian selanjutnya.
Untuk menginstal dan menjalankan Mimicmania, ikuti langkah -langkah ini:
git clone https://github.com/everydaycodings/MimicMania.gitcd MimicManiapython setup.py untuk mengunduh modul yang diperlukan. Proses ini mungkin memakan waktu, karena modul yang diperlukan sekitar 6 GB.pip install -r requirements.txt Untuk Mengunduh Semua Ketergantungan Python.streamlit run app.py untuk memulai aplikasi web. Jika Anda ingin berkontribusi ke Mimicmania, silakan garukan repositori dan buat permintaan tarik. Kami menyambut kontribusi dari semua jenis, termasuk perbaikan bug, fitur baru, dan peningkatan dokumentasi.
Mimicmania dikembangkan oleh Kumar Saksham (EverydayCodings) dengan bantuan berbagai sumber daya open source.
Kami ingin menyampaikan ucapan terima kasih khusus kepada Coqui-Ai/TTS karena memberikan model teks-ke-ucapan mereka sebagai sumber daya untuk proyek kami.
Mimicmania dilisensikan di bawah lisensi MIT.
Jika Anda memiliki pertanyaan atau masalah dengan Mimicmania, silakan hubungi kami di sehari [email protected] atau hubungi kami di Twitter @EverydayCodings atau Medium @EverydayCodings.
Kami selalu senang membantu!