ForwardTacotron NVDA
1.0.0
Nota: Este complemento e a documentação ainda estão em construção. Suas contribuições são bem -vindas!
Lembre -se de que o ForwardTacotron é um modelo de síntese de fala em Pytorch que usa um preditor de duração para alinhar o texto e gerar espectrogramas MEL. O modelo tem vantagens, como robustez, velocidade, tom e manipulação de energia e eficiência.
Portanto, este plug -in é uma tentativa de implementar o suporte ao ForwardTacotron no leitor de tela de código aberto da NVDA via cliente/servidor, porque as bibliotecas usadas como tocha não são possíveis para incluir diretamente no NVDA.
Este é um trabalho em andamento e, portanto, ainda há muito o que fazer.
Enquanto isso, você pode ouvir o progresso que foi feito até agora.
| Linguagem | Voz | Amostra |
|---|---|---|
| Inglês | LJSpeech (com vocoder griffinlim) | |
| Inglês | LJSpeech (com vocoder hifi-gan) | |
| Espanhol | Conjunto de dados ALD (com vocoder hifi-gan) | |
| Espanhol | ODAL (com vocoder hifi-gan, modelo universal) |