text_generation_webui_xtts
1.0.0
이것은 Coqui-Ai/TTS의 XTTSV2를 사용하여 음성 복제와 함께 다국어 TTS를 가능하게하는 텍스트 생성 Webui의 간단한 확장입니다.
XTTSV2는 이제 텍스트 생성 Webui (Coqui_tts)에 내장되어 있습니다. 내레이터 기능에 대한이 확장을 계속 업데이트 할 수도 있지만, 신경 쓰지 않으면 공식 확장을 사용하십시오.
이것은 Barktts 확장에 따라 빨리 함께 던진 매우 조잡한 확장입니다. 작동하거나 작동하지 않을 수도 있습니다. 코드를 개선하고 PR을 제출하십시오.
cmd_windows.bat / cmd_linux.sh / cmd_macos.sh / cmd_wsl.bat 를 실행하여 환경을 활성화하거나 수동으로 설치 한 경우 Conda 환경을 활성화하십시오. 이 저장소를 복제하십시오.
cd extensions
git clone https://github.com/kanttouchthis/text_generation_webui_xtts
TTS의 종속성을 설치하십시오.
cd text_generation_webui_xtts
pip install -r requirements.txt
TTS 설치. 버전 요구 사항은 문제를 일으키기 때문에 버전 요구 사항없이 위의 종속성을 설치합니다.
pip install TTS --no-dependencies
위의 단계를 완료하면 Voices 폴더에 몇 가지 음성을 추가 할 수 있습니다. 이것은 누군가가 말하는 사람의 짧은 (3-6 초) 웨이브 클립 일 수 있습니다. 긴 간격이없는 고품질 오디오인지 확인하십시오. 그런 다음 --extensions text_generation_webui_xtts 로 webui를 실행하고 맨 아래에서 음성/언어 및 기타 설정을 선택하십시오. 처음 실행할 때 콘솔을 통해 이용 약관을 수락해야 할 수도 있습니다.