Tensorvox ist eine Anwendung, die die benutzerfreundliche und leichte neuronale Sprachsynthese auf dem Desktop ermöglicht, um die Zugänglichkeit für solche Technologien zu verbessern.
Hauptsächlich von TensorFlowtts und auch von Coqui-TTs und Vits angetrieben, wird es in reinem C ++/QT geschrieben, wobei der Tensorflow C API zum Interagieren mit Tensorflow-Modellen (erste zwei) und LIBTORCH für Pytorch-Modelle verwendet wird. Auf diese Weise können wir Inferenz ausführen, ohne Python -Bibliotheken im Wert von Gigabyte installieren zu müssen, nur ein paar DLLs.
Detaillierte Anleitung in Google Docs
Nehmen Sie eine Kopie aus den Veröffentlichungen, extrahieren Sie den .zip und überprüfen Sie den Google Drive -Ordner auf Modelle und Installationsanweisungen
Wenn Sie Ihr eigenes Modell verwenden möchten, müssen Sie zuerst trainieren und exportieren Sie es.
Tensorvox unterstützt Modelle aus drei Repos:
Diese beiden Beispiele sollten Ihnen genügend Anleitung geben, um zu verstehen, was benötigt wird. Wenn Sie ein Modell speziell für diesen Zweck trainieren möchten, empfehle ich TensorFlowtts, da es die beste Unterstützung und Vits ist, da es die perfekte Sache ist wie bei Sprachen, außerhalb des Box-Supports für Englisch (Coqui und TFTTS, Vits), German und Spanier (nur Tensorflowtts); Das heißt, Sie müssen nichts tun. Sie können Sprachen hinzufügen, ohne den Code zu ändern, solange das Phonem -Set IPA (gestresst oder nicht gestresst), ARPA oder GlobalPhone sind (öffnen Sie ein Problem und ich werde es Ihnen erklären)
Derzeit wird nur Windows 10 x64 (obwohl ich berichtet habe, dass es auf 8.1 läuft) unterstützt.
Anforderungen:
Primed Build (mit allen bereitgestellten Bibliotheken):
deps -Ordner an der gleichen Stelle wie die Dateien .Pro und Hauptquellen befindet.Beachten Sie, dass Sie, um Ihre glänzende neue ausführbare Datei auszuprobieren, eine Veröffentlichung des Programms wie oben beschrieben herunterladen und die ausführbare Datei in dieser Version durch Ihre neue ersetzen müssen, damit Sie alle DLLs vorhanden haben.
TODO: Fügen Sie Anweisungen zum Kompilieren von Grund auf.
Libtorch : https://pytorch.org/cppdocs/installing.html
TensorFlow C API : https://www.tensorflow.org/install/lang_c
CPPFlow (TF C API -> C ++ Wrapper): https://github.com/serizba/cppflow
AudioFile (für den WAV -Export): https://github.com/adamstark/audioFile
Frameless Dark Style-Fenster : https://github.com/jorgen-vicinggod/qt-frameless-window-darkstyle
JSON für moderne C ++ : https://github.com/nlohmann/json
R8BRAIN-FREE-SRC (Resampling): https://github.com/avaneev/r8brain-free-src
rnnoise (cmake Version, Denoising-Ausgabe): https://github.com/almogh52/rnnoise-cmake
Logitech LED-Illumination SDK (Maus-RGB-Integration): https://www.logitechg.com/en-us/innovation/developer-lab.html
Qcustomplot : https://www.qcustomplot.com/index.php/Introduction
libnumbertext : https://github.com/numbertext/libnumbertext
Sie können hier ein Problem öffnen oder sich dem Discord -Server anschließen und dort alles diskutieren/fragen
Für Medien-/Lizenz-/andere formelle Anfragen senden Sie diese E -Mail an: [email protected]
Dieses Programm selbst ist MIT lizenziert, aber für die von Ihnen verwendeten Modelle gelten ihre Lizenzbedingungen. Wenn Sie beispielsweise in Vietnam sind und TensorFlowtts -Modelle verwenden, müssen Sie hier nach einigen Details nachsehen