tacotron2 tts GUI 다운로드 tacotron2 tts GUI 소스 코드 다운로드

tacotron2 tts GUI

AI 소스 코드

[Windows] GUI Portable executable (CPU only)

다운로드

GUI 작업 진행 중 (2020 년 8 월 4 일 업데이트)

합성을위한 GUI 래퍼. 토글가 가능한 스위치를 통해 CPU 전용 합성을 허용합니다. 휴대용 EXE 파일을 사용할 수 있습니다 (CPU에서만 실행됨).

또한 스트림 요소에서 TTS 기부 경보를 연주합니다.

메인 UI	스트림 요소 통합

개요

사용자 친화적 인 GUI와 함께 머신 러닝 기반 텍스트 대 음성 프로그램. 대상 고객에는 오픈 소스 TTS 프로그램을 찾는 Twitch Stremer 또는 콘텐츠 제작자가 포함됩니다. 이 소프트웨어의 목적은 휴대용 EXE에서 TTS 합성에 액세스 가능한 오프라인 (코딩 경험 없음, GPU/Colab)을 만드는 것입니다.

특징

스트림 요소의 기부금을 자동으로 읽습니다
NVIDIA /TACOTRON2 및 /WAVEGLOW 용 PYQT5 래퍼

링크 다운로드

휴대용 실행 파일은 릴리스 페이지 또는 바로 여기에서 찾을 수 있습니다. 미리 가입 한 타코트론 2 와 웨이브 글로우 모델을 아래에서 다운로드하십시오.

경고 : 휴대용 실행 파일은 CPU에서 실행되며 GPU에서 실행하는 것과 비교하여 10 배 속도 속도가납니다.

소스에서 건물

요구 사항

파이썬> = 3.7
Librosa
Numpy
pyqt5 == 5.15.0
요청
TQDM
matplotlib
Scipy
num2words
피그 게임

Pytorch 1.0

달리기

 python gui.py

특허

NVIDIA/TACOTRON2 & WAVEGLOW : BSD-3-Clause 라이센스

메모

NVIDIA/TACOTRON2의 TTS 코드
https://github.com/corentinj/real-time-voice-cloning의 부분 GUI 코드 및 U/RealStreamer의 Forsen TTS https://www.youtube.com/watch?v=kl2tglbcdco에서 영감을 얻은 레이아웃.

오리지널 레포 :

타코트론 2 (Wavenet없이)

MEL 스펙트럼 예측에서 조절 마수에 의한 천연 TTS 합성의 Pytorch 구현.

이 구현에는 분산 및 자동 혼합 정밀 지원이 포함되며 LJSpeech 데이터 세트를 사용합니다.

분산 및 자동 혼합 정밀지지는 NVIDIA의 정점 및 앰프에 의존합니다.

게시 된 Tacotron 2 및 WaveGlow 모델을 사용하여 오디오 샘플을 보려면 웹 사이트를 방문하십시오.

정렬, 예측 된 MEL 스펙트럼, 대상 MEL 스펙트로 그램

사전 반품

nvidia gpu + cuda cudnn

설정

LJ 음성 데이터 세트를 다운로드하여 추출하십시오
이 repo를 복제하십시오 : git clone https://github.com/NVIDIA/tacotron2.git
이 repo에 Cd : cd tacotron2
하위 모듈 초기화 : git submodule init; git submodule update
업데이트 .wav 경로 : sed -i -- 's,DUMMY,ljs_dataset_folder/wavs,g' filelists/*.txt
- 또는 hparams.py 에서 load_mel_from_disk=True 설정하고 Mel-Spectrogram 경로를 업데이트하십시오
Pytorch 1.0을 설치하십시오
Apex를 설치하십시오
파이썬 요구 사항을 설치하거나 Docker 이미지를 빌드하십시오
- 파이썬 요구 사항 설치 : pip install -r requirements.txt

훈련

python train.py --output_directory=outdir --log_directory=logdir
(선택 사항) tensorboard --logdir=outdir/logdir

미리 훈련 된 모델을 사용한 교육

미리 훈련 된 모델을 사용하는 교육은 기본적으로 더 빠른 수렴으로 이어질 수 있으며, 데이터 세트 종속 텍스트 임베딩 레이어는 무시됩니다.

게시 된 Tacotron 2 모델을 다운로드하십시오
python train.py --output_directory=outdir --log_directory=logdir -c tacotron2_statedict.pt --warm_start

멀티 GPU (배포) 및 자동 혼합 정밀 훈련

python -m multiproc train.py --output_directory=outdir --log_directory=logdir --hparams=distributed_run=True,fp16_run=True

추론 데모

게시 된 Tacotron 2 모델을 다운로드하십시오
게시 된 WaveGlow 모델을 다운로드하십시오
jupyter notebook --ip=127.0.0.1 --port=31337
로드 추론 .ipynb

NB NB 오디오 합성에 대한 Mel-spectrogram을 수행 할 때, Tacotron 2와 Mel Decoder가 동일한 Mel-spectrogram 표현에 대해 훈련되었는지 확인하십시오.

감사의 말

이 구현은 다음 저장소의 코드를 사용합니다. Keith Ito, Prem Seetharaman은 코드에 설명 된대로 코드를 사용합니다.

우리는 Ryuchi Yamamoto의 Tacotron Pytorch 구현에서 영감을 받았습니다.

우리는 Tacotron 2 Paper Authors, 특히 Jonathan Shen, Yuxuan Wang 및 Zongheng Yang에게 감사합니다.

확장하다

추가 정보

버전 [Windows] GUI Portable executable (CPU only)
유형 AI 소스 코드
업데이트 시간 2025-08-24
크기 1.13MB
출처 Github

tacotron2 tts GUI

GUI 작업 진행 중 (2020 년 8 월 4 일 업데이트)

개요

특징

링크 다운로드

소스에서 건물

요구 사항

달리기

특허

메모

오리지널 레포 :

타코트론 2 (Wavenet없이)

사전 반품

설정

훈련

미리 훈련 된 모델을 사용한 교육

멀티 GPU (배포) 및 자동 혼합 정밀 훈련

추론 데모

관련 저장소

감사의 말

PPPwn Tinker GUI

Anime batch downloader gui

GitHub sgrebnov/cordova plugin background download

Demucs Gui

F5 TTS ComfyUI

음성 개발에 대한 영어 정보(TTS 사용자 가이드 Delphi 버전)

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express