Hinweis: Dieses Add-On sowie die Dokumentation befinden sich noch im Bau. Ihre Beiträge sind willkommen!
Denken Sie daran, dass Forwardtacotron ein Sprachsynthesemodell in Pytorch ist, das einen Dauer -Prädiktor verwendet, um Text auszurichten und MEL -Spektrogramme zu erzeugen. Das Modell hat Vorteile wie Robustheit, Geschwindigkeit, Tonhöhe und Energiemanipulation und Effizienz.
Dieses Plugin ist also ein Versuch, die Unterstützung für ForwardTacotron im Open Source -Bildschirmleser von NVDA über Client/Server zu implementieren, da die als Torch verwendeten Bibliotheken nicht in NVDA direkt aufgenommen werden können.
Dies ist eine laufende Arbeit und daher gibt es noch viel zu tun.
In der Zwischenzeit können Sie auf die bisherigen Fortschritte anhören.
| Sprache | Stimme | Probe |
|---|---|---|
| Englisch | Ljspeech (mit Griffinlim Vocoder) | |
| Englisch | Ljspeech (mit Hifi-Gan-Vokoder) | |
| Spanisch | ALD-Datensatz (mit Hifi-Gan-Vokoder) | |
| Spanisch | ODAL (mit Hifi-Gan-Vokoder, Universalmodell) |