Dubbing Otomatis dengan Kloning Suara dan Pengenalan Pidato
Dimungkinkan berkat OpenVoice, Melotts, Whisper lebih cepat, voicefixer, Python-Audio-Separator dan FFMPEG.

PR dipersilakan, ini sebagian besar hanya bukti konsep. Beberapa ide bagus untuk perbaikan meliputi:
Instal FFMPEG, FFProbe dan FFPlay di sistem Anda dan pastikan mereka berada di jalur. Anda dapat mengunduhnya dari sini.
Buat direktori baru dan klon repositori ini:
git clone https://github.com/igerman00/Pollyduble
cd Pollydubleconda create -n dubbing python=3.9conda activate dubbinggit clone https://github.com/myshell-ai/OpenVoicePastikan repositori OpenVoice berada di direktori yang sama dengan repositori ini, itu harus dinamai "OpenVoice".
cd OpenVoice
pip install -e .
pip install git+https://github.com/myshell-ai/MeloTTS.git
python -m unidic downloadtorch dengan Dukungan GPU (parameter indeks-URL harus opsional untuk tidak ada dukungan GPU): pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 cd .. # Go back to the root directory of the repo
pip install -r requirements-win-cu118.txtdemo.py kami, dan dinamai video.mp4 .python demo.py -i video.mp4 -s -m Output akan disimpan di direktori Pollyduble/output secara default. Ini akan berisi berbagai file termasuk video yang dijuluki, audio yang terpisah, audio yang dijuluki, dan sampel suara. Sebagian besar, itu harus satu klik.
Opsi termasuk:
-iatau--inputuntuk menentukan file video input-oatau--outputuntuk menentukan direktori output (default adalahPollyduble/output)-vatau--voiceuntuk menentukan sampel khusus untuk kloning suara. Jika tidak ditentukan, satu akan dibuat dari 15 detik pertama video-satau--separateuntuk memungkinkan pemisahan audio, yaitu mengekstraksi musik latar dan pidato dari video secara terpisah-matau--muxuntuk memungkinkan muxing audio yang terpisah kembali ke video dengan pidato yang dijuluki-fatau--fixuntuk mengaktifkan pemasangan suara, yaitu meningkatkan kualitas pidato yang dijuluki.
^ Eksperimental dan sebenarnya tidak terdengar bagus sebagian besar waktu.--helpuntuk menampilkan pesan bantuan
Proyek ini dilisensikan di bawah lisensi MIT - lihat file lisensi untuk detailnya.