AdaSpeech 다운로드 AdaSpeech 소스 코드 다운로드

AdaSpeech

AI 소스 코드

1.0.0

다운로드

Adaspeech : 맞춤형 음성을위한 연설에 대한 적응 텍스트 [WIP]

adaspeech의 비공식 pytorch 구현.

메모:

나는 멀티 스피커 사용 사례를 고려하지 않고 IAM은 단일 스피커에만 훨씬 더 중점을 둡니다.
나는 Utterance level encoder 와 Phoneme level encoder 만 사용하지 않으며 조건 층 표준 (Adaspeech 종이의 영혼)이 Adaspeech의 적응 특성을 제한하지만 내 초점은 적응보다는 FastSpeech 2 음향 일반화를 향상시키는 것입니다.

인용

 @misc { chen2021adaspeech ,
      title = { AdaSpeech: Adaptive Text to Speech for Custom Voice } , 
      author = { Mingjian Chen and Xu Tan and Bohan Li and Yanqing Liu and Tao Qin and Sheng Zhao and Tie-Yan Liu } ,
      year = { 2021 } ,
      eprint = { 2103.00993 } ,
      archivePrefix = { arXiv } ,
      primaryClass = { eess.AS }
}

요구 사항 :

Python 3.6.2 로 작성된 모든 코드.

Pytorch를 설치하십시오

Pytorch를 설치하기 전에 다음 명령을 실행하여 Cuda 버전을 확인하십시오 : nvcc --version

 pip install torch torchvision

이 repo에서 나는 이전 버전의 Pytorch에 존재하지 않는 torch.bucketize 기능에 Pytorch 1.6.0을 사용했습니다.

다른 요구 사항 설치 :

 pip install -r requirements.txt

Tensorboard를 사용하려면 tensorboard version 1.14.0 지원되는 tensorflow (1.14.0) 사용하여 Seperatly

전처리 용 :

filelists 폴더에는 MFA (Motreal Force Aligner) 가공 된 LJSpeech 데이터 세트 파일이 포함되어 있으므로 LJSpeech DataSet의 오디오 (추출 기간 동안)와 텍스트를 정렬 할 필요가 없습니다. 다른 데이터 세트는 여기에서 지침을 따르십시오. 다음 명령을 따르는 다른 사전 처리 실행 :

 python nvidia_preprocessing.py -d path_of_wavs

F0의 최소와 최대 및 에너지를 찾기 위해

 python compute_statistics.py

최소 및 최대 F0 및 Energy의 hparams.py 에서 다음을 업데이트하십시오.

 p_min = Min F0/pitch
p_max = Max F0
e_min = Min energy
e_max = Max energy

훈련을 위해

 python train_fastspeech.py --outdir etc -c configs/default.yaml -n "name"

메모

보다 완전하고 끝까지 끝까지 음성 복제 또는 TTS (Text to Speech) 도구 상자를 보려면 DeepSync Technologies를 방문하십시오.

확장하다

추가 정보

버전 1.0.0
유형 AI 소스 코드
업데이트 시간 2025-08-21
크기 4.13MB
출처 Github

AdaSpeech

Adaspeech : 맞춤형 음성을위한 연설에 대한 적응 텍스트 [WIP]

메모:

인용

요구 사항 :

전처리 용 :

훈련을 위해

메모

ML stack

awesome free chatgpt

pywin_contextmenu

promptl

tick.chat

FastLoRAChat

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express