Saluran pipa otonom untuk mengubah suara menggunakan model suara AI terlatih RVC v2. Alat ini dapat digunakan untuk menerapkan konversi suara ke input audio apa pun.


WebUI sedang dalam pengembangan dan pengujian terus-menerus, tetapi Anda dapat mencobanya sekarang juga di lokal!
Instal dan tarik semua persyaratan dan perubahan baru dengan membuka jendela baris perintah di direktori RVC-v2-UI dan menjalankan perintah berikut.
pip install -r requirements.txt git pull
Untuk pengguna colab, cukup klik Runtime di bilah navigasi atas notebook colab dan Disconnect and delete runtime di menu dropdown. Kemudian ikuti petunjuk di notebook untuk menjalankan webui.
(Semoga segera hadir)
Ikuti petunjuk di sini untuk menginstal Git di komputer Anda. Ikuti juga panduan ini untuk menginstal Python VERSION 3.9 jika Anda belum melakukannya. Menggunakan versi Python lain dapat mengakibatkan konflik ketergantungan.
Alternatifnya, Anda dapat menggunakan pyenv untuk mengelola versi Python:
Instal pyenv dengan mengikuti petunjuk di sini.
Instal Python 3.9:
pyenv install 3.9
Tetapkan sebagai versi Python lokal Anda:
pyenv local 3.9
Ikuti petunjuk di sini untuk menginstal ffmpeg di komputer Anda.
Buka jendela baris perintah dan jalankan perintah ini untuk mengkloning seluruh repositori ini, membuat lingkungan virtual, dan menginstal dependensi tambahan yang diperlukan.
git clone https://github.com/PseudoRAM/RVC-v2-UI cd RVC-v2-UI
pyenv exec python -m venv venv
python -m venv venv
venvScriptsactivate
source venv/bin/activate
pip install -r requirements.txt
Jalankan perintah berikut untuk mengunduh model dasar hubert yang diperlukan.
python src/download_models.py

Untuk menjalankan WebUI Pengubah Suara RVC, jalankan perintah berikut.
python src/webui.py
| Bendera | Keterangan |
|---|---|
-h , --help | Tampilkan pesan bantuan ini dan keluar. |
--share | Buat URL publik. Ini berguna untuk menjalankan UI web di Google Colab. |
--listen | Jadikan UI web dapat dijangkau dari jaringan lokal Anda. |
--listen-host LISTEN_HOST | Nama host yang akan digunakan server. |
--listen-port LISTEN_PORT | Port mendengarkan yang akan digunakan server. |
Setelah pesan keluaran berikut Running on local URL: http://127.0.0.1:7860 muncul, Anda dapat mengeklik tautan untuk membuka tab dengan WebUI.
Navigasikan ke tab Download model , dan tempel tautan unduhan ke model RVC dan beri nama unik. Anda dapat mencari AI Hub Discord di mana model suara terlatih tersedia untuk diunduh. Anda dapat merujuk pada contoh tampilan tautan unduhan. File zip yang diunduh harus berisi file model .pth dan file .index opsional.
Setelah 2 kolom masukan terisi, cukup klik Download ! Setelah pesan keluaran mengatakan [NAME] Model successfully downloaded! , Anda seharusnya dapat menggunakannya di tab Convert Voice setelah mengeklik tombol segarkan model!


Untuk orang yang telah melatih model RVC v2 secara lokal dan ingin menggunakannya untuk konversi suara. Navigasikan ke tab Upload model , dan ikuti petunjuknya. Setelah pesan keluaran mengatakan [NAME] Model successfully uploaded! , Anda seharusnya dapat menggunakannya di tab Convert Voice setelah mengeklik tombol segarkan model!


Dari menu tarik-turun Model Suara, pilih model suara yang akan digunakan. Klik Refresh Models jika Anda menambahkan file secara manual ke direktori rvc_models untuk menyegarkan daftar.
Di bidang Input Audio, unggah file audio Anda.
Sesuaikan nada sesuai kebutuhan. Ini mengubah nada suara keluaran.
Opsi lanjutan lainnya untuk Konversi suara dapat dilihat dengan mengklik panah akordeon untuk meluaskan.
Setelah semua opsi terisi, klik Convert dan suara yang dihasilkan AI akan muncul dalam beberapa saat tergantung pada GPU Anda.
Untuk menjalankan alur konversi suara menggunakan baris perintah, jalankan perintah berikut:
python src/main.py <input_audio> <rvc_model> [pitch] [f0_method] [index_rate] [filter_radius] [rms_mix_rate] [protect]
| Parameter | Keterangan |
|---|---|
input_audio | Jalur ke file audio masukan. |
rvc_model | Nama model RVC yang akan digunakan. |
pitch | (Opsional) Perubahan nada dalam seminada. Standarnya adalah 0. |
f0_method | (Opsional) Algoritme deteksi nada. Pilihan: 'rmvpe' (default) atau 'mangio-crepe'. |
index_rate | (Opsional) Tingkat indeks untuk konversi suara. Standarnya adalah 0,5. Rentang: 0 hingga 1. |
filter_radius | (Opsional) Radius filter untuk pemfilteran median. Standarnya adalah 3. Rentang: 0 hingga 7. |
rms_mix_rate | (Opsional) Tingkat campuran RMS. Standarnya adalah 0,25. Rentang: 0 hingga 1. |
protect | (Opsional) Tingkat perlindungan untuk mempertahankan beberapa karakteristik suara asli. Standarnya adalah 0,33. Kisaran: 0 hingga 0,5. |
Contoh penggunaan:
python src/main.py "path/to/input/audio.wav" "JohnDoe" 2 rmvpe 0.7 3 0.3 0.35
Perintah ini akan mengubah suara menjadi "audio.wav" menggunakan model RVC "JohnDoe", menaikkan nada sebanyak 2 seminada, menggunakan algoritma deteksi nada 'rmvpe', dengan laju indeks 0,7, radius filter 3, campuran RMS tingkat 0,3, dan tingkat perlindungan 0,35.
Buka zip (jika perlu) dan transfer file .pth dan .index ke folder baru di direktori rvc_models. Setiap folder hanya boleh berisi satu .pth dan satu file .index .
Struktur direktori akan terlihat seperti ini:
├── rvc_models │ ├── John │ │ ├── JohnV2.pth │ │ └── added_IVF2237_Flat_nprobe_1_v2.index │ ├── May │ │ ├── May.pth │ │ └── added_IVF2237_Flat_nprobe_1_v2.index │ ├── MODELS.txt │ └── hubert_base.pt ├── voice_output └── src
Penggunaan suara yang dikonversi untuk tujuan berikut ini dilarang.
Mengkritik atau menyerang individu.
Mendukung atau menentang posisi politik, agama, atau ideologi tertentu.
Menampilkan ekspresi yang sangat merangsang di depan umum tanpa zonasi yang tepat.
Penjualan model suara dan klip suara yang dihasilkan.
Peniruan identitas pemilik asli suara tersebut dengan niat jahat untuk merugikan/menyakiti orang lain.
Tujuan penipuan yang mengarah pada pencurian identitas atau panggilan telepon palsu.
Saya tidak bertanggung jawab atas kerugian langsung, tidak langsung, konsekuensial, insidental, atau khusus apa pun yang timbul dari atau dengan cara apa pun terkait dengan penggunaan/penyalahgunaan atau ketidakmampuan menggunakan perangkat lunak ini.