Pollyduble
1.0.0
用語音克隆和語音識別的自動配音
得益於OpenVoice,Melotts,更快的耳語,VoiceFixer,Python-Audio-separator和ffmpeg,這使得成為可能。

歡迎PRS,這主要只是概念驗證。一些改進的好主意包括:
在系統上安裝FFMPEG,FFPROBE和FFPLAY,並確保它們處於路徑狀態。您可以從這裡下載它們。
製作一個新的目錄並克隆此存儲庫:
git clone https://github.com/igerman00/Pollyduble
cd Pollydubleconda create -n dubbing python=3.9conda activate dubbinggit clone https://github.com/myshell-ai/OpenVoice確保OpenVoice存儲庫與此存儲庫相同的目錄,應命名為“ OpenVoice”。
cd OpenVoice
pip install -e .
pip install git+https://github.com/myshell-ai/MeloTTS.git
python -m unidic downloadtorch (索引-URL參數應是可選的,不需要GPU支持): pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 cd .. # Go back to the root directory of the repo
pip install -r requirements-win-cu118.txtdemo.py腳本相同,並且被命名為video.mp4 。python demo.py -i video.mp4 -s -m默認情況下,輸出將存儲在Pollyduble/output目錄中。它將包含各種文件,包括配音視頻,分離的音頻,配音音頻和語音示例。通常,它應該是一鍵。
選項包括:
-i或--input以指定輸入視頻文件-o或--output指定輸出目錄(默認為Pollyduble/output)-v或--voice為語音克隆指定自定義樣本。如果未指定,將從視頻的前15秒起創建一個-s或--separate啟用音頻分離,即分別提取背景音樂和演講-m或--mux可以用配音的語音使分開的音頻恢復到視頻中-f或--fix啟用語音固定,即提高配音語音的質量。
^實驗性,實際上在大多數情況下聽起來不好。--help顯示幫助消息
該項目是根據MIT許可證獲得許可的 - 有關詳細信息,請參見許可證文件。