Скачать LightSpeech - Скачать исходный код LightSpeech

LightSpeech

AI Исходный код

1.0.0

Скачать

Lightspeech

Неофициальная внедрение пирогации Lightspeech: легкий и быстрый текст к речи с поиском нейронной архитектуры. Этот репо использует реализацию Fastspeech 2 ESPNet в качестве базы. Этот репо реализует только окончательную версию модели LightSpeech, а не поиск нейронной архитектуры, как упомянуто в бумаге.

But I am able to compress only 3x (from 27 M to 7.99 M trainable parameters) not 15x .

Требования :

Весь код, написанный в Python 3.6.2 .

Установите Pytorch

Перед установкой Pytorch, пожалуйста, проверьте свою версию CUDA, выполнив следующую команду: nvcc --version

 pip install torch torchvision

В этом репо я использовал pytorch 1.6.0 для функции torch.bucketize , которая не присутствует в предыдущих версиях Pytorch.

Установка других требований:

 pip install -r requirements.txt

Для использования Tensorboard установить tensorboard version 1.14.0 Seperatly с поддерживаемым tensorflow (1.14.0)

Для предварительной обработки:

Папка filelists содержит MFA (MotReal Force Aligner), обработанные файлы набора данных LJSPEECH, поэтому вам не нужно выравнивать текст с аудио (для продолжительности извлечения) для набора данных LJSPEECH. Для другого набора данных следуйте инструкции здесь. Для другого предварительного обработки выполнения следующей команды:

 python .nvidia_preprocessing.py -d path_of_wavs -c configs/default.yaml

За поиск мин и максимума F0 и энергии

 python .compute_statistics.py

Обновите следующее в hparams.py Min и Max of F0 и Energy

 p_min = Min F0/pitch
p_max = Max F0
e_min = Min energy
e_max = Max energy

Для обучения

 python train_lightspeech.py --outdir etc -c configs/default.yaml -n "name"

Для вывода

Пари

 python .inference.py -c .configsdefault.yaml -p .checkpointsfirst_1xyz.pyt --out output --text "ModuleList can be indexed like a regular Python list but modules it contains are properly registered."

Для экспорта TorchScript

 python export_torchscript.py -c configs/default.yaml -n fastspeech_scrip --outdir etc

Примечание :

Для получения более полного и конечного клонирования голоса или инструментария текста в речевой (TTS)? Пожалуйста, посетите технологии DeepSync.

Ссылки

Lightspeech: легкий и быстрый текст на речь с поиском нейронной архитектуры
Fastspeech 2: быстрый и высококачественный сквозной текст в речь
Fastspeech: быстрый, надежный и управляемый текст в речь
Espnet
Реализация волнового потока Nvidia
Мелган
Дуриан
Реализация FastSpeech2 TensorFlow
Другое реализация Pytorch Fastspeech 2
Уэвернн

Расширять

Дополнительная информация

Версия 1.0.0
Тип AI Исходный код
Время обновления 2025-09-14
размер 3.27MB
От Github

Связанные приложения

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

LightSpeech

Lightspeech

Требования :

Для предварительной обработки:

Для обучения

Для вывода

Для экспорта TorchScript

Примечание :

Ссылки

ML stack

awesome free chatgpt

pywin_contextmenu

promptl

tick.chat

FastLoRAChat

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express