Este complemento implementa un controlador del sintetizador de voz para NVDA utilizando modelos TTS neurales. Admite Piper.
Piper es un sistema de texto neuronal rápido y rápido que suena muy bien y está optimizado para dispositivos de gama baja como Raspberry Pi.
Puede escuchar las muestras de voz de Piper aquí: muestras de voz de Piper.
Este complemento utiliza Sonata: un motor de óxido multiplataforma para modelos TTS neurales que está desarrollando Musharraf Omer.
Puede encontrar el paquete de complementos en la sección de activos de la página de lanzamiento
El complemento es solo un controlador, no tiene voces de forma predeterminada. Debe descargar e instalar las voces que desea del Administrador de voz.
Al instalar el complemento y reiniciar NVDA, el complemento le pedirá que descargue e instale al menos una voz, y le dará la opción de abrir el Administrador de voz.
También puede abrir el Administrador de voz del menú principal de NVDA.
Tenga en cuenta que recomendamos elegir las voces low o medium de calidad para su (s) idioma (s) de destino, ya que generalmente proporcionan una mejor capacidad de respuesta. Para una capacidad de respuesta adicional, puede optar por descargar la variante fast de una voz a un costo de calidad del habla ligeramente más baja.
También puede instalar voces de archivos locales. Después de obtener el archivo de Voice, abra el Administrador de voz, en la pestaña instalada, haga clic en el botón etiquetado Install from local file . Elija el archivo de voz, espere a que se instale la voz y reinicie NVDA para actualizar la lista de voces.
Las voces disponibles actualmente están capacitadas utilizando conjuntos de datos TTS disponibles gratuitamente, que generalmente son de baja calidad (en su mayoría de audiolibros de dominio público o grabaciones de calidad de investigación).
Además, estos conjuntos de datos no son completos, por lo tanto, algunas voces pueden exhibir una pronunciación incorrecta o extraña. Ambos problemas podrían resolverse utilizando mejores conjuntos de datos para la capacitación.
Afortunadamente, el desarrollador Piper y algunos desarrolladores de la comunidad ciega y con discapacidad de la visión están trabajando en la capacitación de mejores voces.
Copyright (c) 2024, Musharraf Omer. Este software tiene licencia bajo la GNU General Public License versión 2 (GPL V2).