TensorVox Téléchargement - TensorVox Source Téléchargement du code

TensorVox

Code Source AI

TensorVox V1.0.0.0

Télécharger

Tensorvox

TensorVox est une application conçue pour permettre une synthèse de la parole neuronale conviviale et légère dans le bureau, visant à accroître l'accessibilité à une telle technologie.

Propulsé par Tensorflowtts et également par Coqui-TTS et VITS, il est écrit en C ++ / Qt pur, en utilisant l'API TensorFlow C pour interagir avec les modèles TensorFlow (les deux premiers), et libtorch pour les pytorch. De cette façon, nous pouvons effectuer une inférence sans avoir à installer des gigaoctets de bibliothèques Python, juste quelques DLL.

Essayez-le

Guide détaillé dans Google Docs

Prenez une copie des versions, extraire le .zip et vérifiez le dossier Google Drive pour les modèles et les instructions d'installation

Si vous souhaitez utiliser votre propre modèle, vous devez d'abord vous entraîner, puis l'exporter.

Architectures soutenues

TensorVox prend en charge les modèles de trois dépôts:

TENSORFLOWTTS : FASTSPEECH2, TACOTRON2, à la fois Char et Phonème et Multi-Band Melgan. Voici un cahier Colab démontrant comment exporter le modèle Tacotron2 à base de LJSpeech, pré-entraîné,:
Coqui-TTS: Tacotron2 (IPA basé sur des phonèmes) et Multi-Band Melgan, après avoir converti de Pytorch en TensorFlow. Voici un cahier montrant comment exporter le modèle DDC LJSpeech:
JAYWALNUT310 / VITS: VITS, qui est un modèle entièrement E2E. (IPA stressé comme phonèmes) Note à export:

Ces deux exemples devraient vous fournir suffisamment de conseils pour comprendre ce qui est nécessaire. Si vous cherchez à former un modèle spécifiquement à cet effet, je recommande Tensorflowtts, car c'est celui qui a le meilleur support, et les vites, car c'est la chose la plus proche de perfectionner comme pour les langues, le support prêt à l'emploi est fourni pour l'anglais (Coqui et TFTTS, VITS), allemand et espagnol (seul TensorFlowTTS); Autrement dit, vous n'aurez rien à faire. Vous pouvez ajouter des langues sans modifier le code, tant que l'ensemble de phonèmes est IPA (stressé ou non étendu), ARPA ou Globalphone, (ouvrir un problème et je vous l'explique)

Construire des instructions

Actuellement, seuls Windows 10 x64 (bien que j'aie entendu des rapports de fonctionnement sur 8.1) soit pris en charge.

Exigences:

Créateur QT
Compilateur MSVC 2017 (V141)

Build amorcé (avec toutes les bibliothèques fournies):

Télécharger les dépendances binaires précompilées et comprend
Décompressez-le de sorte que le dossier deps soit au même endroit que les fichiers .pro et principaux.
Ouvrez le projet avec QT Creator, ajoutez votre compilateur et compilez

Notez que pour essayer votre nouvel exécutable brillant, vous devrez télécharger une version du programme comme décrit ci-dessus et remplacer l'exécutable dans cette version par votre nouveau, vous avez donc toutes les DLL en place.

TODO: Ajouter des instructions pour compiler à partir de zéro.

Externes (et merci)

Libtorch : https://pytorch.org/cppdocs/installing.html
API Tensorflow C : https://www.tensorflow.org/install/lang_c
CPPFLOW (API TF C -> C ++ Wrapper): https://github.com/serizba/cppflow
AudioFile (pour l'exportation de WAV): https://github.com/adamstark/audiofile
Fenêtre de style sombre sans cadre : https://github.com/jorgen-vikinggod/qt-frameless-window-darkstyle
JSON pour C ++ moderne : https://github.com/nlohmann/json
R8BRAIN-FREE-SRC (Rééchantillonnage): https://github.com/avaneev/r8brain-free-src
rnnoise (version cmake, sortie de débraillé): https://github.com/almogh52/rnnoise-cmake
Logitech LED illumination SDK (Mouse RVB Intégration): https://www.logitechg.com/en-us/innovation/developer-lab.html
QCustomPlot : https://www.qcustomplot.com/index.php/introduction
libnumbertext : https://github.com/numbertext/libnumberText

Contact

Vous pouvez ouvrir un problème ici ou rejoindre le serveur Discord et discuter / demander n'importe quoi là-bas

Pour les médias / l'octroi de licences / toute autre information officielle, envoyez à cet e-mail: [email protected]

Remarque sur les licences

Ce programme lui-même est sous licence MIT, mais pour les modèles que vous utilisez, leurs termes de licence s'appliquent. Par exemple, si vous êtes au Vietnam et que vous utilisez des modèles Tensorflowtts, vous devrez vérifier ici quelques détails

Développer

Informations supplémentaires

Version TensorVox V1.0.0.0
Type Code Source AI
Date de mise à jour 2025-08-19
taille 8.22MB
Provenant de Github

Applications connexes

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout