BERT MB iSTFT VITS
1.0.0
16GB RAM의 Windows/Linux 시스템.12GB 이상의 VRAM을 가진 GPU.Pytorch 설치 명령 :
pip install torch==1.13.1+cu117 torchvision==0.14.1+cu117 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu117 CUDA 11.7 설치 : https://developer.nvidia.com/cuda-11-7-0-download-archive
conda create -n vits python=3.8conda activate vitsgit clone https://github.com/project-elnino/BERT-MB-iSTFT-VITS.git cd BERT-MB-iSTFT-VITSpip install -r requirements.txt path/to/audio_001.wav |<speaker_name>|<language_code>|<text_001>
../kss2/1/1_0000.wav|KR-default|KR|그는 괜찮은 척하려고 애쓰는 것 같았다.
python preprocess.py --metadata ./metadata.list --config_path ./configs/config.json 음성 파일이 Mono / PCM-16 이 아닌 경우 .wav 파일을 먼저 샘플링해야합니다.
| 모델 | 구성에서 JSON 파일을 설정하는 방법 | JSON 파일 구성 샘플 |
|---|---|---|
| istft-vits | "istft_vits": true,"upsample_rates": [8,8], | ljs_istft_vits.json |
| MB-ISTFT-VITS | "subbands": 4,"mb_istft_vits": true,"upsample_rates": [4,4], | ljs_mb_istft_vits.json |
| MS-ISTFT-VITS | "subbands": 4,"ms_istft_vits": true,"upsample_rates": [4,4], | ljs_ms_istft_vits.json |
training_files 및 validation_files 전처리 매니페스트 파일의 경로로 변경하십시오. python train.py -c < config > -m < folder >최후의 체크 포인트에서 훈련을 재개하십시오.
unference.py를 점검하십시오
python inference.py -m ./models/kss/G_64000.pth서버 추론
python inference_server.py -m ./models/kss/G_64000.pth추론을합니다
curl -X POST -H " Content-Type: application/json " -d ' {"text": "잠시 통화 괜찮으시면 전화를 끊지 말아주세요."} ' http://localhost:5000/synthesize