BERT MB iSTFT VITS ดาวน์โหลด - BERT MB iSTFT VITS ดาวน์โหลดซอร์สโค้ดดาวน์โหลด

ดาวน์โหลด

bert-mb-istft-vits

คำสั่งการติดตั้ง Pytorch:

pip install torch==1.13.1+cu117 torchvision==0.14.1+cu117 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu117

CUDA 11.7 ติดตั้ง: https://developer.nvidia.com/cuda-11-7-0-download-archive

conda create -n vits python=3.8

conda activate vits

git clone https://github.com/project-elnino/BERT-MB-iSTFT-VITS.git

 cd BERT-MB-iSTFT-VITS

pip install -r requirements.txt

 path/to/audio_001.wav |<speaker_name>|<language_code>|<text_001>

 ../kss2/1/1_0000.wav|KR-default|KR|그는 괜찮은 척하려고 애쓰는 것 같았다.

python preprocess.py --metadata ./metadata.list --config_path ./configs/config.json

หากไฟล์คำพูดของคุณไม่ใช่ Mono / PCM-16 คุณควรกลับมาใช้ใหม่ไฟล์. wav ของคุณก่อน

แบบอย่าง	วิธีตั้งค่าไฟล์ JSON ในการกำหนดค่า	ตัวอย่างของการกำหนดค่าไฟล์ JSON
istft-vits	`"istft_vits": true,` `"upsample_rates": [8,8],`	ljs_istft_vits.json
mb-istft-vits	`"subbands": 4,` `"mb_istft_vits": true,` `"upsample_rates": [4,4],`	ljs_mb_istft_vits.json
ms-istft-vits	`"subbands": 4,` `"ms_istft_vits": true,` `"upsample_rates": [4,4],`	ljs_ms_istft_vits.json

หากคุณทำการประมวลผลล่วงหน้าให้ตั้งค่า "Cleaned_Text" เป็น TRUE
เปลี่ยน training_files และ validation_files เป็นพา ธ ของไฟล์รายการที่ผ่านการประมวลผลล่วงหน้า

python train.py -c < config > -m < folder >

การฝึกอบรมประวัติย่อจากจุดตรวจครั้งสุดท้ายเป็นไปโดยอัตโนมัติ

ตรวจสอบอนุมาน.py

python inference.py -m ./models/kss/G_64000.pth

การอนุมานเซิร์ฟเวอร์

python inference_server.py -m ./models/kss/G_64000.pth

อนุมาน

curl -X POST -H " Content-Type: application/json " -d ' {"text": "잠시 통화 괜찮으시면 전화를 끊지 말아주세요."} ' http://localhost:5000/synthesize

ขยาย

ข้อมูลเพิ่มเติม

แอปที่เกี่ยวข้อง

แนะนำสำหรับคุณ

ข้อมูลที่เกี่ยวข้อง ทั้งหมด