WG WaveNet скачать - скачать исходный код WG WaveNet

WG WaveNet

AI Исходный код

1.0.0

Скачать

WG-Wavenet: синтез речи в реальном времени в реальном времени без GPU

Po-chun hsu, Hung-yi Lee

В нашей недавней статье мы предлагаем WG-Wavenet, быструю, легкую и высококачественную модель генерации сигналов. WG-Wavenet состоит из модели на основе компактного потока и постфильтера. Два компонента совместно обучаются путем максимизации вероятности обучающих данных и оптимизации функций потерь на частотных областях. Когда мы разрабатываем модель на основе потока, которая сильно сжата, предлагаемая модель требует гораздо меньше вычислительных ресурсов по сравнению с другими моделями генерации сигналов как во время обучения, так и во времени вывода; Несмотря на то, что модель сильно сжата, постфильтр поддерживает качество генерируемой формы волны. Наша реализация Pytorch может быть обучена с использованием менее 8 ГБ памяти GPU и генерирует образцы звука со скоростью более 5000 кГц на GPU NVIDIA 1080TI. Кроме того, даже если синтезируется на процессоре, мы показываем, что предлагаемый метод способен генерировать 44,1 кГц речевую форму в 1,2 раза быстрее, чем в режиме реального времени. Эксперименты также показывают, что качество генерируемого звука сопоставимо с качеством других методов.

Посетите демопаж для образцов аудио.

Тодо

Выпустить предварительную модель.
В сочетании с такотроном2.

Требования

Python> = 3.5.2
TORCH> = 1.4.0
Numpy
Scipy
маринованный
Librosa
Tensorboardx

Предварительная обработка

Обучение

Скачать речь LJ. В этом примере это в data/
Для обучения запустите следующую команду.

python3 train.py --data_dir= < dir/to/dataset > --ckpt_dir= < dir/to/models >

Для обучения, используя предварительную модель, запустите следующую команду.

python3 train.py --data_dir= < dir/to/dataset > --ckpt_dir= < dir/to/models > --ckpt_pth= < pth/to/pretrained/model >

Для использования Tensorboard (необязательно) запустите следующую команду.

python3 train.py --data_dir= < dir/to/dataset > --ckpt_dir= < dir/to/models > --log_dir= < dir/to/logs >

Вывод

Для синтеза файлов WAV запустите следующую команду.

python3 inference.py --ckpt_pth= < pth/to/model > --src_pth= < pth/to/src/wavs > --res_pth= < pth/to/save/wavs >

Предварительная модель

Работа в процессе.

ТТС

Мы будем объединить этот вокадер с такотроном2. Более подробная информация и демонстрация Colab будут опубликованы здесь.

Ссылки

Волновой хлопья NVIDIA
Параллельвейган Кан-Баяши

Расширять

Дополнительная информация

Версия 1.0.0
Тип AI Исходный код
Время обновления 2025-08-22
размер 13.71KB
От Github

Связанные приложения

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
wgcf

2024-11-02
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01

WG WaveNet

WG-Wavenet: синтез речи в реальном времени в реальном времени без GPU

Po-chun hsu, Hung-yi Lee

Тодо

Требования

Предварительная обработка

Обучение

Вывод

Предварительная модель

ТТС

Ссылки

GitHub sgrebnov/cordova plugin background download

Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

wgcf

Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express