ForwardTacotron NVDA Download - ForwardTacotron NVDA Download do código -fonte

ForwardTacotron NVDA

Código-Fonte de IA

1.0.0

Baixar

ForwardTacotron e Hifi-Gan Support para NVDA Screen Reader

Nota: Este complemento e a documentação ainda estão em construção. Suas contribuições são bem -vindas!

introdução

Lembre -se de que o ForwardTacotron é um modelo de síntese de fala em Pytorch que usa um preditor de duração para alinhar o texto e gerar espectrogramas MEL. O modelo tem vantagens, como robustez, velocidade, tom e manipulação de energia e eficiência.

Portanto, este plug -in é uma tentativa de implementar o suporte ao ForwardTacotron no leitor de tela de código aberto da NVDA via cliente/servidor, porque as bibliotecas usadas como tocha não são possíveis para incluir diretamente no NVDA.

Este é um trabalho em andamento e, portanto, ainda há muito o que fazer.

Enquanto isso, você pode ouvir o progresso que foi feito até agora.

amostras de áudio

Linguagem	Voz	Amostra
Inglês	LJSpeech (com vocoder griffinlim)
Inglês	LJSpeech (com vocoder hifi-gan)
Espanhol	Conjunto de dados ALD (com vocoder hifi-gan)
Espanhol	ODAL (com vocoder hifi-gan, modelo universal)

pendência:

Uma maneira de compilar e integrar o servidor ao complemento.
- Quando isso acontecer, permita que o servidor abra quando o sintetizador for carregado. Depois que o servidor carregar, podemos ligar para tornar o sintetizador de fala pronto para uso.
- Duas versões podem ser feitas para o complemento, com suporte à CPU e uma com suporte à GPU, pois aparentemente a síntese é gerada em tempo real em uma GPU. Enquanto isso, podemos notar desacelerações na CPU.
Suporte de mudança de voz e energia nas opções de anel de sintetizador.
No momento, o complemento usa o httplib2 para se comunicar com o servidor, mas eu poderia procurar outros métodos e, se necessário, reescrever uma parte do servidor.
Adicione suporte para carregar vozes diferentes que podem ser detectadas dentro de uma pasta "Voice_models".
- Com isso, um suporte para baixar modelos treinados pode ser adicionado. Temos um modelo LJSpeech em inglês, outro em alemão e dois em espanhol.
Para modelos de vários alto-falantes mais recentes, ele pode ler as configurações para verificar e, se assim for, pode escolher a voz das opções de anel de sintetizador com primeiro consulte os nomes dos alto-falantes no modelo.

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-08-23
tamanho 2.43MB
Vindo de Github

Aplicativos Relacionados

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub the via/releases

2024-11-01

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos