검색 기반 음성 생성 텍스트 to Speech System은 두 가지 핵심 부분에 의존하는 Python 기반 텍스트입니다. 음성을 생성 할 수 있으려면 타코트론에 의존하여 텍스트를 음성으로 변환 한 다음 RVC 음성 변환을 사용하여 오디오 파일을 사용할 필요없이 문자처럼 들릴 수 있습니다.
이 TTS는 Python 3.10에서 테스트되었지만 다른 버전에서는 작동 할 수 있습니다.
최신 64 비트 ESPEAK NG 릴리스가 필요합니다.
FairSeQ 의존성을 구축하려면 Visual Studio를 갖추고 "C ++"개발 패키지를 사용하여 "데스크톱 개발"을 설치해야합니다.
이를 사용하려면시 설치 (시 poetry install --no-root 를 사용하여시를 설치하고 요구 사항을 설치 한 다음 Hubert 모델, Tacotron 모델 및 RVC 모델을 다운로드하십시오. 그런 다음 해당 이름으로 모델 폴더에 배치 할 수 있습니다.
hubert_base.pt > hubert.ptforward_steps90k.pt > forward.pt(rvc .pth model name) -> rvc_model.pth(rvc .index model name) -> rvc_index.index (선택 사항) 이 모든 것이 있으면 CLI를 통해 원하는 인수로 RVG.py 파일을 실행하거나 Gradio WebUI를 시작하기 위해 인수없이 파일을 실행하거나 자체 프로젝트 에이 코드를 포함시키고 rvg_tts 기능을 RVG.py 에서 가져올 수 있습니다.
다른 언어를 사용하려면 새로운 포워드 타코트론 모델을 교육해야합니다. 이것은 데이터 세트 없이는 할 수없는 일입니다. 이곳은 커뮤니티에 도움을 요청합니다. 데이터 세트를 제공 할 수 있다면하십시오.
Tacotron은 MIT 라이센스에 따라 라이센스가 부여됩니다
RVC Webui는 MIT 라이센스에 따라 라이센스가 부여됩니다
저작권 2023 Foxify52
Apache 라이센스, 버전 2.0 ( "라이센스")에 따라 라이센스가 부여되었습니다. 라이센스를 준수하는 것 외에는이 파일을 사용할 수 없습니다. 라이센스 사본을 얻을 수 있습니다
http://www.apache.org/licenses/LICENSE-2.0
해당 법률에 의해 요구되거나 서면에 동의하지 않는 한, 라이센스에 따라 배포 된 소프트웨어는 명시 적 또는 묵시적 보증 또는 조건없이 "그대로"기준으로 배포됩니다. 라이센스에 따른 특정 언어 통치 권한 및 제한 사항에 대한 라이센스를 참조하십시오.