NATSpeech
v0.1

NATSPEECH: Kerangka kerja teks-ke-kebiasaan non-otefresif
| | 中文文档
Repo ini berisi implementasi Pytorch resmi dari:
Kami mengimplementasikan fitur -fitur berikut dalam kerangka ini:
# # We tested on Linux/Ubuntu 18.04.
# # Install Python 3.6+ first (Anaconda recommended).
export PYTHONPATH=.
# build a virtual env (recommended).
python -m venv venv
source venv/bin/activate
# install requirements.
pip install -U pip
pip install Cython numpy==1.19.1
pip install torch==1.9.0 # torch >= 1.9.0 recommended
pip install -r requirements.txt
sudo apt install -y sox libsox-fmt-mp3
bash mfa_usr/install_mfa.sh # install forced alignment tool Jika Anda menemukan ini berguna untuk penelitian Anda, silakan kutip makalah berikut:
@article { ren2021portaspeech ,
title = { PortaSpeech: Portable and High-Quality Generative Text-to-Speech } ,
author = { Ren, Yi and Liu, Jinglin and Zhao, Zhou } ,
journal = { Advances in Neural Information Processing Systems } ,
volume = { 34 } ,
year = { 2021 }
} @article { liu2021diffsinger ,
title = { Diffsinger: Singing voice synthesis via shallow diffusion mechanism } ,
author = { Liu, Jinglin and Li, Chengxi and Ren, Yi and Chen, Feiyang and Liu, Peng and Zhao, Zhou } ,
journal = { arXiv preprint arXiv:2105.02446 } ,
volume = { 2 } ,
year = { 2021 }
}Kode kami dipengaruhi oleh repo berikut:
Setiap organisasi atau individu dilarang menggunakan teknologi apa pun yang disebutkan dalam makalah ini untuk menghasilkan pidato seseorang tanpa persetujuannya, termasuk tetapi tidak terbatas pada para pemimpin pemerintah, tokoh politik, dan selebriti. Jika Anda tidak mematuhi item ini, Anda bisa melanggar undang -undang hak cipta.