sonata nvda Download - sonata nvda Quellcode Download

sonata nvda

AI-Quellcode

v3.0

Herunterladen

Sonata Neuronale Stimmen für NVDA

Dieses Add-On implementiert einen Sprach-Synthesizer-Treiber für NVDA unter Verwendung neuronaler TTS-Modelle. Es unterstützt Piper.

Piper ist ein schneller lokaler Neuraltext zu Sprachsystem, der großartig klingt und für Low-End-Geräte wie den Raspberry Pi optimiert ist.

Hier können Sie Piper's Voice -Samples anhören: Piper -Sprachmuster.

Dieses Add-On verwendet Sonata: eine plattformübergreifende Rostmotor für neuronale TTS-Modelle, die von Musharraf Omer entwickelt wird.

Installation

Herunterladen des Add-Ons

Sie finden das Add-On-Paket im Abschnitt Assets der Release-Seite

Stimmen hinzufügen

Das Add-On ist nur ein Treiber, das standardmäßig keine Stimmen erhält. Sie müssen die gewünschten Stimmen vom Voice Manager herunterladen und installieren.

Beim Installieren des Add-On- und Neustarts von NVDA werden Sie mit dem Add-On aufgefordert, mindestens eine Stimme herunterzuladen und zu installieren. Sie können den Sprachmanager geöffnet werden.

Sie können den Sprachmanager auch aus dem Hauptmenü von NVDA öffnen.

Beachten Sie, dass wir empfehlen, die Stimmen mit low oder medium Qualität für Ihre Zielsprache auszuwählen, da sie im Allgemeinen eine bessere Reaktionsfähigkeit bieten. Für zusätzliche Reaktionsfähigkeit können Sie die fast Variante einer Stimme zu einem Preis von etwas niedrigerer Sprachqualität herunterladen.

Sie können auch Stimmen aus lokalen Archiven installieren. Nachdem Sie die Datei des Voice erhalten haben, öffnen Sie den Voice -Manager auf der Registerkarte "Installed" auf die Schaltfläche, die mit Install from local file gekennzeichnet ist. Wählen Sie die Sprachdatei aus, warten Sie, bis die Stimme installiert wird, und starten Sie die NVDA neu, um die Liste der Voices zu aktualisieren.

Eine Notiz zur Sprachqualität

Die derzeit verfügbaren Stimmen werden mit frei verfügbaren TTS -Datensätzen ausgebildet, die im Allgemeinen von geringer Qualität (hauptsächlich öffentliche Audiobücher oder Forschungsqualitätsaufzeichnungen) sind.

Darüber hinaus sind diese Datensätze nicht umfassend, daher können einige Stimmen eine falsche oder seltsame Aussprache aufweisen. Beide Probleme könnten durch die Verwendung besserer Datensätze für das Training gelöst werden.

Glücklicherweise arbeiten der Piper -Entwickler und einige Entwickler aus der Blind- und Vision-insbemäßige Gemeinschaft daran, bessere Stimmen zu trainieren.