简体中文
Garpu so-vits-svc dengan dukungan realtime dan antarmuka yang sangat ditingkatkan . Berdasarkan Cabang 4.0 (V1) (OR 4.1 ) dan modelnya kompatibel. 4.1 Model tidak didukung. Model lain juga tidak didukung.
Selalu berhati -hati terhadap sedikit influencer yang cukup terkejut dengan proyek/teknologi baru. Anda perlu mengambil setiap posting jejaring sosial dengan semi-keraguan.
Ledakan pengubah suara yang terjadi pada tahun 2023 telah berakhir, dan banyak pengembang, bukan hanya mereka yang ada di repositori ini, tidak terlalu aktif untuk sementara waktu.
Ada terlalu banyak alternatif untuk dicantumkan di sini tetapi:
Di tempat lain, beberapa start-up telah meningkatkan dan memasarkan pengubah suara (mungkin untuk keuntungan).
Pembaruan repositori ini telah terbatas pada pemeliharaan sejak musim semi 2023.
Sulit untuk mempersempit daftar alternatif di sini, tetapi harap pertimbangkan untuk mencoba proyek lain jika Anda mencari pengubah suara dengan kinerja yang lebih baik (terutama dalam hal latensi selain kualitas).>Namun, proyek ini mungkin ideal bagi mereka yang ingin mencoba konversi suara untuk saat ini (karena mudah dipasang).
QuickVCContentVec di repositori asli. 1CREPE .pip .fairseq .File kelelawar ini akan secara otomatis melakukan langkah -langkah yang dijelaskan di bawah ini.
Windows (versi pengembangan diperlukan karena PYPA/PIPX#940):
py -3 -m pip install --user git+https://github.com/pypa/pipx.git
py -3 -m pipx ensurepathLinux/MacOS:
python -m pip install --user pipx
python -m pipx ensurepathpipx install so-vits-svc-fork --python=3.11
pipx inject so-vits-svc-fork torch torchaudio --pip-args= " --upgrade " --index-url=https://download.pytorch.org/whl/cu121 # https://download.pytorch.org/whl/nightly/cu121Windows:
py -3.11 -m venv venv
venv S cripts a ctivateLinux/MacOS:
python3.11 -m venv venv
source venv/bin/activateAnaconda:
conda create -n so-vits-svc-fork python=3.11 pip
conda activate so-vits-svc-fork Menginstal tanpa membuat lingkungan virtual dapat menyebabkan PermissionError jika Python diinstal dalam file program, dll.
Instal ini melalui PIP (atau manajer paket favorit Anda yang menggunakan PIP):
python -m pip install -U pip setuptools wheel
pip install -U torch torchaudio --index-url https://download.pytorch.org/whl/cu121 # https://download.pytorch.org/whl/nightly/cu121
pip install -U so-vits-svc-forkpip install -U torch torchaudio --index-url https://download.pytorch.org/whl/cu121 . MPS mungkin didukung.--index-url https://download.pytorch.org/whl/cu121 dengan --index-url https://download.pytorch.org/whl/nightly/rocm5.7 . AMD GPU tidak didukung di Windows (#120).Harap perbarui paket ini secara teratur untuk mendapatkan fitur terbaru dan perbaikan bug.
pip install -U so-vits-svc-fork
# pipx upgrade so-vits-svc-fork GUI diluncurkan dengan perintah berikut:
svcgsvc vcsvc infer source.wavModel pretrained tersedia untuk memeluk wajah atau civitai.
3_HP-Vocal-UVR.pth atau UVR-MDX-NET Main direkomendasikan. 3svc pre-split untuk membagi dataset menjadi beberapa file (menggunakan librosa ).svc pre-sd untuk membagi dataset menjadi beberapa file (menggunakan pyannote.audio ). Klasifikasi manual lebih lanjut mungkin diperlukan karena masalah akurasi. Jika speaker berbicara dengan berbagai gaya bicara, aturnya-penutur yang lebih besar dari jumlah speaker yang sebenarnya. Karena dependensi yang belum terselesaikan, silakan instal pyannote.audio secara manual: pip install pyannote-audio .svc pre-classify tersedia. Kunci panah atas dan bawah dapat digunakan untuk mengubah kecepatan pemutaran. 4
Jika Anda tidak memiliki akses ke GPU dengan lebih dari 10 GB VRAM, rencana gratis Google Colab direkomendasikan untuk pengguna ringan dan rencana paperspace pro/pertumbuhan direkomendasikan untuk pengguna berat. Sebaliknya, jika Anda memiliki akses ke GPU kelas atas, penggunaan layanan cloud tidak disarankan.
Tempatkan dataset Anda seperti dataset_raw/{speaker_id}/**/{wav_file}.{any_format} (subfolder dan nama file non-ASCII dapat diterima) dan jalankan:
svc pre-resample
svc pre-config
svc pre-hubert
svc train -tbatch_size sebanyak mungkin di config.json sebelum perintah train agar sesuai dengan kapasitas VRAM. Mengatur batch_size ke auto-{init_batch_size}-{max_n_trials} (atau hanya auto ) akan secara otomatis meningkatkan batch_size sampai kesalahan OOM terjadi, tetapi mungkin tidak berguna dalam beberapa kasus.CREPE , ganti svc pre-hubert dengan svc pre-hubert -fm crepe .ContentVec dengan benar, ganti svc pre-config dengan -t so-vits-svc-4.0v1 . Pelatihan mungkin memakan waktu sedikit lebih lama karena beberapa bobot diatur ulang karena menggunakan kembali bobot generator awal yang lama.MS-iSTFT Decoder , ganti svc pre-config dengan svc pre-config -t quickvc . Untuk detail lebih lanjut, jalankan svc -h atau svc <subcommand> -h .
> svc -h
Usage: svc [OPTIONS] COMMAND [ARGS]...
so-vits-svc allows any folder structure for training data.
However, the following folder structure is recommended.
When training: dataset_raw/{speaker_name}/ ** /{wav_name}.{any_format}
When inference: configs/44k/config.json, logs/44k/G_XXXX.pth
If the folder structure is followed, you DO NOT NEED TO SPECIFY model path, config path, etc.
(The latest model will be automatically loaded.)
To train a model, run pre-resample, pre-config, pre-hubert, train.
To infer a model, run infer.
Options:
-h, --help Show this message and exit.
Commands:
clean Clean up files, only useful if you are using the default file structure
infer Inference
onnx Export model to onnx (currently not working)
pre-classify Classify multiple audio files into multiple files
pre-config Preprocessing part 2: config
pre-hubert Preprocessing part 3: hubert If the HuBERT model is not found, it will be...
pre-resample Preprocessing part 1: resample
pre-sd Speech diarization using pyannote.audio
pre-split Split audio files into multiple files
train Train model If D_0.pth or G_0.pth not found, automatically download from hub.
train-cluster Train k-means clustering
vc Realtime inference from microphoneTutorial video
Terima kasih kepada orang -orang yang luar biasa ini (Kunci Emoji):
34J ? ? ? ? | Garrettconway ? ? | Blueamulet ? ? | ThrowawawawawawawoCount01 ? | 緋 ? | Lordmau5 ? ? ? ? | DL909 ? |
Kepuasan256 ? | Pierluigi Zagaria ? | Ruckusmattster ? | Desuka-art ? | heyfixit | Nerdy Rodent ? | 谢宇 |
Coldcawfee ? | Sbersier ? ? ? | Meldoner ? ? | mmodeusher ? | Alondan ? | Likkkez ? | Permainan lakban ? |
Xianglong dia ? | 75aosu ? | Tonyco82 ? | yxlllc ? | OUTHIPPED ? | Escoolioinglesias ? ? ? | Blacksingh ? |
MGS. M. Thoyib Antarnusa ? | Exosfeer ? | Guranon ? ? | Alexander Koumis | Acekagami ? | Highupech ? | Scorpi |
MAXIMXLS | Star3lord ? | Forkoz ? | Zerui Chen ? | Roee Shenberg ? ? | Justas ? | Onako2 |
4ll0w3v1l | j5y0v6b ? ️ | Marcellocirelli ? | Priyanshu Patel | Anna Gorshunova ? |
Proyek ini mengikuti spesifikasi semua-kontributor. Kontribusi apa pun yang baik!
#206 ↩
#469 ↩
https://ytpmv.info/how-to-use-uvr/ ↩
Jika Anda mendaftarkan kode rujukan dan kemudian menambahkan metode pembayaran, Anda dapat menghemat sekitar $ 5 pada penagihan bulanan bulan pertama Anda. Perhatikan bahwa kedua penghargaan rujukan adalah kredit paperspace dan bukan uang tunai. Itu adalah keputusan yang sulit tetapi dimasukkan karena men -debug dan pelatihan model awal membutuhkan sejumlah besar daya komputasi dan pengembang adalah seorang siswa. ↩
#456 ↩