Это дополнение реализует драйвер синтезатора речи для NVDA с использованием нейронных моделей TTS. Он поддерживает Piper.
Piper-это быстрый локальный нейронный текст для речевой системы, которая звучит великолепно и оптимизирован для низкоуровневых устройств, таких как Raspberry Pi.
Вы можете послушать образцы голоса Пайпер здесь: образцы голоса Piper.
В этом дополнении используется Sonata: кроссплатформенный двигатель ржавчины для нейронных моделей TTS, который разрабатывается Мушаррафом Омером.
Вы можете найти дополнительный пакет в разделе «Активы» на странице выпуска
Дополнение-это просто драйвер, он по умолчанию без голосов. Вам нужно скачать и установить желаемые голоса от Voice Manager.
После установки дополнения и перезапуска NVDA дополнение попросит вас загрузить и установить хотя бы один голос, и это даст вам возможность открыть голосовой диспетчер.
Вы также можете открыть голосовой менеджер из главного меню NVDA.
Обратите внимание, что мы рекомендуем выбрать голоса low или medium качества для вашего целевого языка (ы), потому что они обычно обеспечивают лучшую отзывчивость. Для получения дополнительной отзывчивости вы можете загрузить fast вариант голоса по цене немного более низкого качества речи.
Вы также можете установить голоса из местных архивов. После получения голосового файла откройте Voice Manager, на вкладке «Установлен» нажмите кнопку « Install from local file . Выберите голосовой файл, дождитесь установки голоса, и перезапустите NVDA, чтобы обновить список голосов.
В настоящее время доступные голоса обучаются с использованием свободно доступных наборов данных TTS, которые, как правило, имеют низкое качество (в основном аудиокниги общественного достояния или записи качества исследований).
Кроме того, эти наборы данных не являются всеобъемлющими, следовательно, некоторые голоса могут демонстрировать неправильное или странное произношение. Обе проблемы могут быть решены с помощью лучших наборов данных для обучения.
К счастью, разработчик Piper и некоторые разработчики из сообщества Blind и с невыгодным зрением работают над обучением лучших голосам.
Авторские права (C) 2024, Мушарраф Омер. Это программное обеспечение лицензировано в соответствии с общедоступной лицензией GNU, версии 2 (GPL V2).