deepaudio tts
1.0.0
Deepaudio-TTS是培訓基於神經網絡的文本到語音(TTS)模型的框架。它夾雜著或將包括用於TTS和Vocoder模型的流行神經網絡體系結構。
為了使使用各種功能,例如混合精液,多節點訓練和TPU培訓等,我在此框架中引入了pytorch-lighting和Hydra。它仍在開發中。
$ export PYTHONPATH="${PYTHONPATH}:/dir/of/this/project/"
$ python -m deepaudio.tts.cli.train experiment=tacotron2 datamodule.train_metadata=/you/path/to/train_metadata datamodule.dev_metadata=/you/path/to/dev_metadata
這是一個個人項目。因此,我沒有足夠的GPU資源來進行很多實驗。該項目仍在開發中。感謝任何形式的反饋或貢獻。請隨時為某些小問題(例如修復錯誤,實驗結果)進行拉力重新限制。如果您有任何疑問,請打開問題。
我從Espnet和Paddle演講中藉了很多代碼