dctts2 Скачать - dctts2 Скачать исходный код

dctts2

AI Исходный код

1.0.0

Скачать

Глубокий текст свертки в речь

Это реализация статьи «эффективно обучаемой системы текста в речь, основанная на глубоких сверточных сетях с руководством» https://arxiv.org/abs/1710.08969

Код основан на следующих реализациях

https://github.com/keithito/tacotron.git
https://github.com/joisino/chainer-ettts.git
https://github.com/kyubyong/tacotron.git

Модель обучает «text2mel» и «ssrn» отдельно через Trainmel.py & trainmag.py, соответственно, вам нужно загрузить набор данных LJSPEECH, доступный по адресу https://keithito.com/lj-peech-dataset/

Аудио Образцы

Вы можете слушать образцы звука

Предварительно обученные модели можно загрузить здесь

Подготовьте набор данных

Во -первых, вы должны подготовить набор данных. Если вы хотите использовать набор данных LJSPEECH, вы можете использовать следующие команды.

 $ wget http://data.keithito.com/data/speech/LJSpeech-1.0.tar.bz2
$ tar xvf LJSpeech-1.0.tar.bz2
$ python prepro.py

Обучить сеть Text2mel

 $ python trainmel.py

Во время обучения вы можете просмотреть вывод (по умолчанию каждые 200 minibatch). Он сбрасывает первые два примера в пакете в Mel0.png & mel1.png, а также просматривать ученый внимание через A0.png & A1.png

Мель

Внимание

Тренировать сеть SSRN

 $ python trainmag.py

Во время обучения вы можете просмотреть вывод через mag0.png & mag1.png, который сравнивает изученную спектрограмму с истиной Groung.

Маг

Синтезировать

Чтобы синтезировать новое использование предложения:

 $ python synth.py --text "sentance to synthesize" --file output.wav

Демо -веб -сервер

Вы можете запустить демонстрационный веб -сервер, чтобы сделать TTS, запустив

 $ python server.py

Это использует флот -фреймворк для запуска демонстрации

Расширять

Дополнительная информация

Версия 1.0.0
Тип AI Исходный код
Время обновления 2025-08-19
размер 2.11MB
От Github

Связанные приложения

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

dctts2

Глубокий текст свертки в речь

Аудио Образцы

Подготовьте набор данных

Обучить сеть Text2mel

Мель

Внимание

Тренировать сеть SSRN

Маг

Синтезировать

Демо -веб -сервер

ML stack

awesome free chatgpt

pywin_contextmenu

promptl

tick.chat

FastLoRAChat

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express