Aplikasi Kloning Suara
Aplikasi Python/Pytorch untuk dengan mudah mensintesis suara manusia

Dokumentasi
Server Perselisihan
Panduan Video
Hub Berbagi Suara
FAQ
Persyaratan sistem
- Sistem operasi Windows 10 atau Ubuntu 20.04+
- Ruang disk 5GB+
- NVIDIA GPU dengan setidaknya 4GB Versi Memori & Driver 456.38+ (Opsional)
Fitur utama
- Pembuatan Dataset Otomatis (dengan dukungan untuk subtitle dan audioBooks)
- Dukungan bahasa tambahan
- Pelatihan lokal & jarak jauh
- Kereta Mudah Mulai/Berhenti
- Impor/Ekspor Data
- Dukungan multi GPU
Panduan Manual
- Instalasi
- Membangun dataset
- Pelatihan
- Sintesis
- Membuat perubahan
Perbaikan di masa depan
- Tambahkan dukungan untuk TalkNet
- Tambahkan perataan GTA untuk Hifi-Gan
- Estimasi ukuran batch yang ditingkatkan
- Dukungan AMD GPU
Sumber daya lainnya
- Buku catatan pelatihan jarak jauh
- Cobalah suara yang ada di uberduck.ai dan vocodes
- Fetching Data YouTube (Dibuat oleh DiskR33T#5880)
- Sintesis di Colab (Dibuat oleh Mega B#6696)
- Hasilkan Transkripsi YouTube (Dibuat oleh Mega B#6696)
- Wit.ai transkripsi
Ucapan Terima Kasih
Proyek ini menggunakan versi ulang TACOTRON2. Semua hak untuk menjadi milik Nvidia dan ikuti persyaratan lisensi BSD-3 mereka.
Selain itu, proyek ini menggunakan dsalign, silero, deepspeech & hifi.
Terima kasih kepada Dr. John Bustard di Queen's University Belfast atas dukungannya di seluruh proyek.
Didukung oleh uberduck.ai, hubungi mereka untuk hosting model langsung.
Juga terima kasih banyak kepada anggota subreddit VocalSintesis atas umpan balik mereka.
Akhirnya terima kasih kepada semua orang yang mengangkat masalah dan berkontribusi pada proyek.