NATSpeech
v0.1

Natspeech: Ein nicht autoregressives Text-zu-Sprach-Framework
| | 中文文档
Dieses Repo enthält die offizielle Pytorch -Implementierung von:
Wir implementieren die folgenden Funktionen in diesem Framework:
# # We tested on Linux/Ubuntu 18.04.
# # Install Python 3.6+ first (Anaconda recommended).
export PYTHONPATH=.
# build a virtual env (recommended).
python -m venv venv
source venv/bin/activate
# install requirements.
pip install -U pip
pip install Cython numpy==1.19.1
pip install torch==1.9.0 # torch >= 1.9.0 recommended
pip install -r requirements.txt
sudo apt install -y sox libsox-fmt-mp3
bash mfa_usr/install_mfa.sh # install forced alignment tool Wenn Sie dies für Ihre Forschung nützlich finden, zitieren Sie bitte die folgenden Papiere:
@article { ren2021portaspeech ,
title = { PortaSpeech: Portable and High-Quality Generative Text-to-Speech } ,
author = { Ren, Yi and Liu, Jinglin and Zhao, Zhou } ,
journal = { Advances in Neural Information Processing Systems } ,
volume = { 34 } ,
year = { 2021 }
} @article { liu2021diffsinger ,
title = { Diffsinger: Singing voice synthesis via shallow diffusion mechanism } ,
author = { Liu, Jinglin and Li, Chengxi and Ren, Yi and Chen, Feiyang and Liu, Peng and Zhao, Zhou } ,
journal = { arXiv preprint arXiv:2105.02446 } ,
volume = { 2 } ,
year = { 2021 }
}Unsere Codes werden von den folgenden Repos beeinflusst:
Jede Organisation oder Person ist es untersagt, eine in diesem Papier erwähnte Technologie zu verwenden, um die Rede von jemandem ohne seine Zustimmung zu generieren, einschließlich, aber nicht beschränkt auf Regierungschefs, politische Persönlichkeiten und Prominente. Wenn Sie diesen Artikel nicht einhalten, könnten Sie gegen Urheberrechtsgesetze verstoßen.