NATSpeech
v0.1

natspeech : 비유로가 아닌 텍스트 음성 연설 프레임 워크
| | 中文文档
이 repo에는 공식적인 Pytorch 구현이 포함됩니다.
이 프레임 워크에서 다음과 같은 기능을 구현합니다.
# # We tested on Linux/Ubuntu 18.04.
# # Install Python 3.6+ first (Anaconda recommended).
export PYTHONPATH=.
# build a virtual env (recommended).
python -m venv venv
source venv/bin/activate
# install requirements.
pip install -U pip
pip install Cython numpy==1.19.1
pip install torch==1.9.0 # torch >= 1.9.0 recommended
pip install -r requirements.txt
sudo apt install -y sox libsox-fmt-mp3
bash mfa_usr/install_mfa.sh # install forced alignment tool 이것이 귀하의 연구에 유용하다면 다음과 같은 논문을 인용하십시오.
@article { ren2021portaspeech ,
title = { PortaSpeech: Portable and High-Quality Generative Text-to-Speech } ,
author = { Ren, Yi and Liu, Jinglin and Zhao, Zhou } ,
journal = { Advances in Neural Information Processing Systems } ,
volume = { 34 } ,
year = { 2021 }
} @article { liu2021diffsinger ,
title = { Diffsinger: Singing voice synthesis via shallow diffusion mechanism } ,
author = { Liu, Jinglin and Li, Chengxi and Ren, Yi and Chen, Feiyang and Liu, Peng and Zhao, Zhou } ,
journal = { arXiv preprint arXiv:2105.02446 } ,
volume = { 2 } ,
year = { 2021 }
}당사 코드는 다음 리포지토리의 영향을받습니다.
모든 조직이나 개인은이 백서에 언급 된 기술을 사용하여 정부 지도자, 정치 인물 및 유명인을 포함하여 동의하지 않고 누군가의 연설을 생성 할 수 없습니다. 이 항목을 준수하지 않으면 저작권법을 위반할 수 있습니다.