Pollyduble
1.0.0
음성 복제 및 음성 인식으로 자동 더빙
OpenVoice, Melotts, 더 빠른 속삭임, VoiceFixer, Python-Audio-Separator 및 FFMPEG 덕분에 가능했습니다.

PR은 환영합니다. 이것은 대부분 개념 증명 일뿐입니다. 개선을위한 몇 가지 좋은 아이디어는 다음과 같습니다.
시스템에 FFMPEG, FFPROBE 및 FFPLAY를 설치하고 경로에 있는지 확인하십시오. 여기에서 다운로드 할 수 있습니다.
새 디렉토리를 만들고이 저장소를 복제하십시오.
git clone https://github.com/igerman00/Pollyduble
cd Pollydubleconda create -n dubbing python=3.9conda activate dubbinggit clone https://github.com/myshell-ai/OpenVoiceOpenVoice 저장소 가이 저장소와 동일한 디렉토리에 있는지 확인하십시오. "OpenVoice"로 지정되어야합니다.
cd OpenVoice
pip install -e .
pip install git+https://github.com/myshell-ai/MeloTTS.git
python -m unidic downloadtorch 설치하십시오 (인덱스 -URL 매개 변수는 GPU 지원 없음을 위해 선택 사항이어야합니다) : pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 cd .. # Go back to the root directory of the repo
pip install -r requirements-win-cu118.txtdemo.py 스크립트와 동일한 디렉토리에 있다고 가정하며 video.mp4 라고합니다.python demo.py -i video.mp4 -s -m 출력은 기본적으로 Pollyduble/output 디렉토리에 저장됩니다. 여기에는 더빙 비디오, 분리 된 오디오, 더빙 오디오 및 음성 샘플을 포함한 다양한 파일이 포함됩니다. 대부분은 한 번 클릭해야합니다.
옵션은 다음과 같습니다.
-i또는--input입력 비디오 파일을 지정하려면 -입력- 출력 디렉토리를 지정하려면
-o또는--output(기본값은Pollyduble/output)-v또는--voice음성 클로닝에 대한 사용자 정의 샘플을 지정합니다. 지정되지 않으면 비디오의 첫 15 초 동안 생성됩니다.-s또는--separate오디오 분리를 활성화하기 위해, 즉 배경 음악을 추출하고 비디오에서 말을 별도로 추출합니다.-m또는--mux더빙 된 연설을 통해 분리 된 오디오를 비디오로 다시 비디오로 다시 활성화합니다.-f또는--fix음성 고정을 가능하게하는 것, 즉 더빙 된 스피치의 품질을 향상시킵니다.
^ 실험적이고 실제로는 대부분의 시간이 좋지 않습니다.--help도움말 메시지를 표시하려면 help
이 프로젝트는 MIT 라이센스에 따라 라이센스가 부여됩니다. 자세한 내용은 라이센스 파일을 참조하십시오.