Voicesmith ermöglicht es, sowohl einzelne als auch Multispeaker -Modelle ohne Codierungserfahrung zu trainieren und zu schließen. Es ist ein ziemlich solider Text-zu-Sprach-Pipeline, basierend auf einer modifizierten Version von DelightfulTs und Univnet in Ihrem Datensatz. Beide Modelle wurden auf einem proprietären 5000 -Sprecher -Datensatz vorgebracht. Es bietet auch einige Tools für die Datensatzvorverarbeitung wie die automatische Textnormalisierung.
Wenn Sie mit einem Modell mit einer früheren Version dieser Software mit einem Modell mit einem hoch emotionalen emotionalen 60 -Lautsprecher -Datensatz herumspielen möchten, klicken Sie hier.

Stellen Sie sicher, dass Sie die neueste Version von node.js installiert haben
Klonen Sie das Repository
git clone https://github.com/dunky11/voicesmith
Installieren Sie Abhängigkeiten, dies kann eine Minute dauern
cd voicesmith
npm install
Klicken Sie hier, wählen Sie den Ordner mit der neuesten Version aus, laden Sie alle Dateien herunter und platzieren Sie sie im Ordner "Repositories Assets".
Starten Sie das Projekt
npm start
Befolgen Sie die Schritte 1 - 4 von oben.
Ausführen machen, so wird ein Ordner mit einem Installationsprogramm im Inneren erstellt. Der Installationsprogramm unterscheidet sich basierend auf Ihrem Betriebssystem.
npm make
Voicesmith verwendet derzeit eine zweistufige modifizierte DelightfulTts und Univnet-Pipeline.

Zeigen Sie Ihre Unterstützung durch das Projekt. Pull -Anfragen sind immer willkommen.
Dieses Projekt ist unter der Lizenz apache -2.0 lizenziert - Einzelheiten finden Sie in der lizenz.md -Datei.