XphoneBert_Vits2 다운로드 XphoneBert_Vits2 소스 코드 다운로드

XphoneBert_Vits2

AI 소스 코드

1.0.0

다운로드

VITS2는 Xphonebert 인코더로 확장되었습니다

크레딧

Vits2 Repo와 Xphonebert의 위대한 작품을 기반으로 한이 리포지토리.

전제 조건

파이썬> = 3.10
Google Colab 및 Lambdalabs Cloud로 Pytorch 버전 1.13.1에서 테스트했습니다.
이 저장소를 복제하십시오
파이썬 요구 사항을 설치하십시오. 요구 사항 .txt를 참조하십시오
데이터 세트를 다운로드하십시오
1. LJ 음성 데이터 세트를 다운로드하여 추출한 다음 데이터 세트 폴더로 이름을 바꾸거나 만듭니다 ln -s /path/to/LJSpeech-1.1/wavs DUMMY
2. 참고 :이 repo는 교육 멀티 스피커 데이터 세트를 지원하지 않습니다
.txt 교육, 유효성 검사 및 테스트 파일을 FileLists 디렉토리로 이동/복사 한 다음 PrepRocess.py 파일을 실행하십시오 (예를 들어 LJSpeech DataSet의 실행과 유사).
- 자세한 내용은 Xphonebert를 참조하십시오. 그들은 원시 텍스트를 음소 시퀀스로 변환하기 위해 text2phonemesequence 사용합니다.
- 각 언어에 대한 text2phonemesequence 초기화에는 해당 ISO 639-3 코드가 필요합니다. 지원되는 언어의 ISO 639-3 코드는 여기에서 제공됩니다.
- text2phonemesequence 단어 분할 된 시퀀스를 입력으로 사용합니다. 또한 사용자는 text2phonemesequence 에 공급하기 전에 Word-segmented 시퀀스에서 텍스트 정규화를 수행 할 수 있습니다.

참고 : 중국어, 한국어, 일본어 (CJK 언어) 및 일부 동남아시아 언어와 같은 언어의 경우 단어는 공간으로 분리되지 않습니다. 이 모델에 단어를 공급하기 전에 외부 토 케이너를 사용해야합니다. 이 경우 text2phonemesequence 에 공급하기 전에 정규화하고 입력을 세분화하기 위해 스크립트를 작성하십시오 (VIE_PREPROCESS.PY는 내 경우).

 # In Case languages, words are not separated by spaces such as Vietnamese.
python vie_preprocess.py --out_extension cleaned --filelists filelists/train.txt filelists/val.txt
python preprocess.py --input_file filelists/train.txt.cleaned --output_file filelists/train.list --language vie-n --batch_size 64 --cuda
python preprocess.py --input_file filelists/val.txt.cleaned --output_file filelists/val.list --language vie-n --batch_size 64 --cuda

# In Case languages English.
python preprocess.py --input_file filelists/train.txt.cleaned --output_file filelists/train.list --language eng-us --batch_size 64 --cuda
python preprocess.py --input_file filelists/val.txt.cleaned --output_file filelists/val.list --language eng-us --batch_size 64 --cuda

자체 데이터 세트를 사용하는 경우 단조로운 정렬 검색을 구축하고 전처리를 실행하십시오.

 # Cython-version Monotonoic Alignment Search
cd monotonic_align
python setup.py build_ext --inplace

훈련 예

구성에 대한 자세한 정보는 configs/config.json 참조하십시오

 # LJ Speech
python train.py -c configs/config.json -m ljs_base

확장하다

추가 정보

버전 1.0.0
유형 AI 소스 코드
업데이트 시간 2025-08-22
크기 24.62MB
출처 Github

XphoneBert_Vits2

VITS2는 Xphonebert 인코더로 확장되었습니다

크레딧

전제 조건

훈련 예

OpenCore_NO_ACPI_Build

nspanel_pro_tools_apk

zkwork_aleo_gpu_worker

nextcloud_share_url_downloader

개_여우_토끼

리화 데이터 분석 엔진 무료 버전 3.0_search_navigation_collection_여론_순위_api

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express