Téléchargement dctts2 - Téléchargement du code source dctts2

dctts2

Code Source AI

1.0.0

Télécharger

Texte de la convolution profonde à la parole

Ceci est une mise en œuvre du document "Système de texte à dispection efficacement formable basé sur des réseaux convolutionnels profonds avec une attention guidée" https://arxiv.org/abs/1710.08969

Le code est basé sur les implémentations suivantes

https://github.com/keithito/tacotron.git
https://github.com/joisino/chainer-ettts.git
https://github.com/kyubyong/tacotron.git

Le modèle forme "text2mel" & "ssrn" séparément via TrainMel.py & Trainmag.py respectivement, vous devez télécharger l'ensemble de données LJSpeech disponible sur https://keithito.com/lj-peech-dataset/

Échantillons audio

Vous pouvez écouter des échantillons audio

Les modèles pré-formés peuvent être téléchargés ici

Préparez l'ensemble de données

Tout d'abord, vous devez préparer un ensemble de données. Si vous souhaitez utiliser l'ensemble de données LJSPEECH, vous pouvez utiliser les commandes suivantes.

 $ wget http://data.keithito.com/data/speech/LJSpeech-1.0.tar.bz2
$ tar xvf LJSpeech-1.0.tar.bz2
$ python prepro.py

former le réseau Text2Mel

 $ python trainmel.py

Pendant la formation, vous pouvez consulter la sortie (par défaut tous les 200 minibatchs), il vide les deux premiers exemples du lot dans Mel0.png & mel1.png et consultez l'attention du savant via a0.png & a1.png

Mel

Attention

former le réseau SSRN

 $ python trainmag.py

Pendant l'entraînement, vous pouvez voir la sortie via MAG0.PNG & MAG1.PNG, qui compare le spectrogramme appris à la vérité Groung.

Magazine

Synthétiser

Pour synthétiser une nouvelle utilisation de la section:

 $ python synth.py --text "sentance to synthesize" --file output.wav

Serveur Web de démonstration

Vous pouvez exécuter un serveur Web de démonstration pour faire TTS en exécutant

 $ python server.py

Cela utilise Flask Framework pour exécuter la démo

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-08-19
taille 2.11MB
Provenant de Github

Applications connexes

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout