Voicesmith permet de s'entraîner et de déduire sur des modèles simples et multipseaker sans aucune expérience de codage. Il affine un pipeline de texte assez solide à la base d'une version modifiée de Delidfultts et Univnet sur votre ensemble de données. Les deux modèles ont été pré-entraînés sur un ensemble de données de haut-parleur propriétaire de 5000. Il fournit également quelques outils pour le prétraitement de l'ensemble de données comme la normalisation automatique du texte.
Si vous souhaitez jouer avec un modèle formé sur un ensemble de données émotionnel de 60 haut-parleurs très émotionnel en utilisant une version antérieure de ce logiciel, cliquez ici.

Assurez-vous que la dernière version de Node.js est installée
Cloner le référentiel
git clone https://github.com/dunky11/voicesmith
Installez les dépendances, cela peut prendre une minute
cd voicesmith
npm install
Cliquez ici, sélectionnez le dossier avec la dernière version, téléchargez tous les fichiers et placez-les dans le dossier des actifs des référentiels.
Démarrer le projet
npm start
Suivez les étapes 1 à 4 d'en haut.
Run Make, cela créera un dossier nommé / fait avec un installateur à l'intérieur. Le programme d'installation sera différent en fonction de votre système d'exploitation.
npm make
Voicesmith utilise actuellement un pipeline Delidfultts et UnivNet modifié en deux étapes.

Montrez votre soutien par le projet. Les demandes de traction sont toujours les bienvenues.
Ce projet est concédé sous licence APACHE-2.0 - Voir le fichier Licence.md pour plus de détails.