tacotron2 tts GUI Download - tacotron2 tts GUI Sumber Code Unduh

tacotron2 tts GUI

Kode Sumber AI

[Windows] GUI Portable executable (CPU only)

Unduh

GUI Work In Progress (Update 4 Agustus 2020)

Pembungkus GUI untuk disintesis. Memungkinkan sintesis khusus CPU melalui sakelar yang dapat diaktifkan. File EXE portabel tersedia (yang hanya berjalan pada CPU).

Juga memainkan peringatan donasi TTS dari elemen aliran.

UI utama	Integrasi Elemen Stream

Ringkasan

Program Teks Berbasis Pembelajaran Mesin ke Program Bicara dengan GUI yang ramah pengguna. Target audiens termasuk streamer Twitch atau pembuat konten yang mencari program TTS open source. Tujuan dari perangkat lunak ini adalah untuk membuat sintesis TTS dapat diakses secara offline (tidak ada pengalaman pengkodean, GPU/COLAB) di EXE portabel.

Fitur

Membaca sumbangan dari elemen aliran secara otomatis
Pembungkus PYQT5 untuk NVIDIA /TACOTRON2 & /WAVEGLOW

Tautan unduh

Eksekusi portabel dapat ditemukan di halaman rilis, atau langsung di sini. Unduh model Tacotron 2 dan Waveglow pretrained dari bawah.

PERINGATAN: Portable Executable berjalan pada CPU yang mengarah ke perlambatan kecepatan> 10x dibandingkan dengan menjalankannya di GPU.

Membangun dari sumber

Persyaratan

Python> = 3.7
librosa
Numpy
Pyqt5 == 5.15.0
permintaan
TQDM
matplotlib
SCIPY
num2words
Pygame

Pytorch 1.0

Untuk berlari

 python gui.py

Lisensi

NVIDIA/TACOTRON2 & WAVEGLOW: Lisensi BSD-3-Clause

Catatan

Kode TTS dari NVIDIA/TACOTRON2
Kode GUI parsial dari https://github.com/corentinj/real-time-voice-cloning dan tata letak yang diilhami oleh U/RealStreamer's Forsen Tts https://www.youtube.com/watch?v=Kl2tglbcdco

Repo asli:

Tacotron 2 (tanpa Wavenet)

Implementasi PyTorch dari sintesis TTS alami dengan mengondisikan Wavenet pada prediksi spektrogram MEL.

Implementasi ini mencakup dukungan presisi campuran yang didistribusikan dan otomatis dan menggunakan dataset LJSPEECH.

Dukungan presisi campuran yang didistribusikan dan otomatis bergantung pada puncak dan amp NVIDIA.

Kunjungi situs web kami untuk sampel audio menggunakan model Tacotron 2 dan Waveglow yang diterbitkan.

Alignment, Predicted Mel Spectrogram, Target Mel Spectrogram

Prasyarat

Nvidia gpu + cuda cudnn

Pengaturan

Unduh dan Ekstrak Dataset Pidato LJ
Klone repo ini: git clone https://github.com/NVIDIA/tacotron2.git
CD ke repo ini: cd tacotron2
Inisialisasi Submodule: git submodule init; git submodule update
UPDATE .WAV PATHS: sed -i -- 's,DUMMY,ljs_dataset_folder/wavs,g' filelists/*.txt
- Atau, atur load_mel_from_disk=True di hparams.py dan perbarui jalur Mel-Spectrogram
Instal Pytorch 1.0
Instal Apex
Instal Persyaratan Python atau Bangun Gambar Docker
- Instal Persyaratan Python: pip install -r requirements.txt

Pelatihan

python train.py --output_directory=outdir --log_directory=logdir
(Opsional) tensorboard --logdir=outdir/logdir

Berlatih menggunakan model pra-terlatih

Pelatihan Menggunakan model pra-terlatih dapat menyebabkan konvergensi yang lebih cepat secara default, lapisan embedding teks yang bergantung pada dataset diabaikan

Unduh model Tacotron 2 kami yang diterbitkan
python train.py --output_directory=outdir --log_directory=logdir -c tacotron2_statedict.pt --warm_start

Multi-GPU (terdistribusi) dan pelatihan presisi campuran otomatis

python -m multiproc train.py --output_directory=outdir --log_directory=logdir --hparams=distributed_run=True,fp16_run=True

Demo inferensi

Unduh model Tacotron 2 kami yang diterbitkan
Unduh model Waveglow kami yang diterbitkan
jupyter notebook --ip=127.0.0.1 --port=31337
Muat inferensi.ipynb

NB Saat melakukan Mel-spectrogram ke sintesis audio, pastikan Tacotron 2 dan Decoder Mel dilatih pada representasi Mel-spectrogram yang sama.

Repo terkait

Waveglow lebih cepat dari jaringan generatif berbasis aliran waktu nyata untuk sintesis ucapan

NV-Wavenet lebih cepat dari Wavenet waktu nyata.

Ucapan Terima Kasih

Implementasi ini menggunakan kode dari repo berikut: Keith Ito, Prem Seetharaman seperti yang dijelaskan dalam kode kami.

Kami terinspirasi oleh implementasi Tacotron Pytorch Ryuchi Yamamoto.

Kami berterima kasih kepada penulis kertas Tacotron 2, khususnya Jonathan Shen, Yuxuan Wang dan Zongheng Yang.

Memperluas

Informasi Tambahan

Versi [Windows] GUI Portable executable (CPU only)
Tipe Kode Sumber AI
Waktu Pembaruan 2025-08-24
ukuran 1.13MB
Berasal dari Github

Aplikasi Terkait

PPPwn Tinker GUI

2024-11-10
Anime batch downloader gui

2024-11-06
GitHub sgrebnov/cordova plugin background download

2024-11-05
Demucs Gui

2024-11-03
F5 TTS ComfyUI

2024-11-02
Informasi bahasa Inggris tentang pengembangan suara (Panduan Pengguna TTS versi Delphi)

2009-05-28

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ML stack

Kode Sumber AI

1.0.0
awesome free chatgpt

Kode Sumber AI

1.0.0
pywin_contextmenu

Kode Sumber AI

Version update
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua