Este complemento implementa um driver de sintetizador de fala para NVDA usando modelos TTS neurais. Ele suporta Piper.
Piper é um texto neural local e rápido para o sistema de fala que soa ótimo e é otimizado para dispositivos de baixo custo, como o Raspberry Pi.
Você pode ouvir as amostras de voz de Piper aqui: Amostras de voz de Piper.
Este complemento usa Sonata: um mecanismo de ferrugem entre plataformas para modelos TTS neurais que está sendo desenvolvido por Musharraf Omer.
Você pode encontrar o pacote complementar na seção de ativos da página de liberação
O complemento é apenas um driver, ele vem sem vozes por padrão. Você precisa baixar e instalar as vozes desejadas do The Voice Manager.
Ao instalar o complemento e reiniciar o NVDA, o complemento solicitará que você faça o download e instale pelo menos uma voz e fornecerá a opção de abrir o gerenciador de voz.
Você também pode abrir o gerenciador de voz do menu principal da NVDA.
Observe que recomendamos escolher as vozes de low ou medium qualidade para o (s) idioma (s) de destino, porque elas geralmente fornecem melhor capacidade de resposta. Para uma resposta adicional, você pode optar por baixar a variante fast de uma voz a um custo de qualidade de fala um pouco mais baixa.
Você também pode instalar vozes de arquivos locais. Depois de obter o arquivo da voz, abra o Voice Manager, na guia instalada, clique no botão rotulado Install from local file . Escolha o arquivo de voz, aguarde a instalação da voz e reinicie o NVDA para atualizar a lista Voices.
As vozes atualmente disponíveis são treinadas usando conjuntos de dados TTS disponíveis gratuitamente, que geralmente são de baixa qualidade (principalmente livros de áudio de domínio público ou gravações de qualidade de pesquisa).
Além disso, esses conjuntos de dados não são abrangentes, portanto, algumas vozes podem exibir pronúncia incorreta ou estranha. Ambos os problemas podem ser resolvidos usando melhores conjuntos de dados para treinamento.
Felizmente, o desenvolvedor Piper e alguns desenvolvedores da comunidade cega e com deficiência de visão estão trabalhando no treinamento de melhores vozes.
Copyright (C) 2024, Musharraf Omer. Este software está licenciado sob a licença pública geral da GNU versão 2 (GPL V2).