Скачать sonata nvda - Скачать исходный код sonata nvda

sonata nvda

AI Исходный код

v3.0

Скачать

Соната нервные голоса для NVDA

Это дополнение реализует драйвер синтезатора речи для NVDA с использованием нейронных моделей TTS. Он поддерживает Piper.

Piper-это быстрый локальный нейронный текст для речевой системы, которая звучит великолепно и оптимизирован для низкоуровневых устройств, таких как Raspberry Pi.

Вы можете послушать образцы голоса Пайпер здесь: образцы голоса Piper.

В этом дополнении используется Sonata: кроссплатформенный двигатель ржавчины для нейронных моделей TTS, который разрабатывается Мушаррафом Омером.

Установка

Загрузка дополнения

Вы можете найти дополнительный пакет в разделе «Активы» на странице выпуска

Добавление голосов

Дополнение-это просто драйвер, он по умолчанию без голосов. Вам нужно скачать и установить желаемые голоса от Voice Manager.

После установки дополнения и перезапуска NVDA дополнение попросит вас загрузить и установить хотя бы один голос, и это даст вам возможность открыть голосовой диспетчер.

Вы также можете открыть голосовой менеджер из главного меню NVDA.

Обратите внимание, что мы рекомендуем выбрать голоса low или medium качества для вашего целевого языка (ы), потому что они обычно обеспечивают лучшую отзывчивость. Для получения дополнительной отзывчивости вы можете загрузить fast вариант голоса по цене немного более низкого качества речи.

Вы также можете установить голоса из местных архивов. После получения голосового файла откройте Voice Manager, на вкладке «Установлен» нажмите кнопку « Install from local file . Выберите голосовой файл, дождитесь установки голоса, и перезапустите NVDA, чтобы обновить список голосов.

Примечание о качестве голоса

В настоящее время доступные голоса обучаются с использованием свободно доступных наборов данных TTS, которые, как правило, имеют низкое качество (в основном аудиокниги общественного достояния или записи качества исследований).

Кроме того, эти наборы данных не являются всеобъемлющими, следовательно, некоторые голоса могут демонстрировать неправильное или странное произношение. Обе проблемы могут быть решены с помощью лучших наборов данных для обучения.

К счастью, разработчик Piper и некоторые разработчики из сообщества Blind и с невыгодным зрением работают над обучением лучших голосам.