Примечание. Это дополнение, а также документация все еще строится. Ваши вклад приветствуются!
Помните, что Forwertacotron - это модель синтеза речи в Pytorch, которая использует предиктор продолжительности для выравнивания текста и сгенерированных спектрограмм MEL. Модель имеет преимущества, такие как устойчивость, скорость, манипуляция по высоте и энергетике и эффективность.
Таким образом, этот плагин является попыткой реализовать поддержку ForwardTacotron в считывании экрана с открытым исходным кодом NVDA через клиент/сервер, поскольку библиотеки, используемые в качестве Torch, невозможно включить в NVDA напрямую.
Это работа в процессе, и поэтому есть еще много дел.
В то же время вы можете прислушиваться к прогрессу, который был достигнут до сих пор.
| Язык | Голос | Образец |
|---|---|---|
| Английский | Ljspeech (с Griffinlim Vocoder) | |
| Английский | Ljspeech (с hifi-gan vocoder) | |
| испанский | Набор данных ALD (с Hifi-Gan Vocoder) | |
| испанский | Одал (с hifi-gan vocoder, универсальная модель) |