Внедрение TTS с комбинацией такотрон2 и Hifi-Gan для мандаринов.
Чтобы сделать вывод, нам необходимо загрузить модель такотраон2 предварительно обученного для мандарина и поместить в корневой путь. Затем мы можем запустить infer_tacotron2_hifigan.py , чтобы получить результат TTS. Мы можем изменить входной текст, редактируя text переменной в infer_tacotron2_hifigan.py . Затем результат будет сохранен в корневом пути, названном как output.wav .
Предварительно обученная модель Hifi-Gan была размещена в LJ_FT_T2_V3 , которая обучена LJSPPECH и настраивается с Tacotron2. Вы можете найти более предварительно обученную модель из оригинального hifi-repo с различным размером и параметрами. Если вы хотите попробовать разные модели или обучить свою собственную модель, пожалуйста, не забывайте изменить переменные в infer_tacotron2_hifigan.py , чтобы изменить путь модели Hifi-Gan.
Вход:相对论直接和间接的催生了量子力学的诞生也为研究微观世界的高速运动确立了全新的数学模型
Вывод: Tacotron2-Hifigan.wav