dctts2 다운로드 dctts2 소스 코드 다운로드

dctts2

AI 소스 코드

1.0.0

다운로드

깊은 컨볼 루션 텍스트 연설

이 논문의 구현은 "https://arxiv.org/abs/1710.08969를 안내하는 깊은 컨볼 루션 네트워크를 기반으로 효율적으로 훈련 가능한 텍스트 음성 음성 시스템을 구현 한 것입니다.

코드는 다음 구현을 기반으로합니다

https://github.com/keithito/tacotron.git
https://github.com/joisino/chainer-ettts.git
https://github.com/kyubyong/tacotron.git

이 모델은 Trainmel.py & Trainmag.py를 통해 "Text2mel"및 "SSRN"을 각각 별도로 진행합니다.

오디오 샘플

오디오 샘플 을들을 수 있습니다

미리 훈련 된 모델은 여기에서 다운로드 할 수 있습니다

데이터 세트를 준비하십시오

먼저 데이터 세트를 준비해야합니다. ljspeech 데이터 세트를 사용하려면 다음 명령을 사용할 수 있습니다.

 $ wget http://data.keithito.com/data/speech/LJSpeech-1.0.tar.bz2
$ tar xvf LJSpeech-1.0.tar.bz2
$ python prepro.py

Text2mel 네트워크를 훈련시킵니다

 $ python trainmel.py

훈련 중에 출력을 검토 할 수 있습니다 (기본적으로 200 개의 미니 디바치마다) 배치에 처음 두 예제를 Mel0.png & Mel1.png에 버리고 A0.png & A1.png를 통해 학습 된 관심을보십시오.

멜

주목

SSRN 네트워크를 훈련하십시오

 $ python trainmag.py

훈련 중에 MAG0.png & MAG1.png를 통해 출력을 볼 수 있으며, 이는 학습 된 스펙트로 그램을 groung 진실과 비교합니다.

잡지

합성

새로운 선고 사용을 종합하기 위해 :

 $ python synth.py --text "sentance to synthesize" --file output.wav

데모 웹 서버

데모 웹 서버를 실행하여 실행하여 TTS를 수행 할 수 있습니다.

 $ python server.py

이것은 플라스크 프레임 워크를 사용하여 데모를 실행합니다

확장하다

추가 정보

버전 1.0.0
유형 AI 소스 코드
업데이트 시간 2025-08-19
크기 2.11MB
출처 Github

dctts2

깊은 컨볼 루션 텍스트 연설

오디오 샘플

데이터 세트를 준비하십시오

Text2mel 네트워크를 훈련시킵니다

멜

주목

SSRN 네트워크를 훈련하십시오

잡지

합성

데모 웹 서버

ML stack

awesome free chatgpt

pywin_contextmenu

promptl

tick.chat

FastLoRAChat

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express