Transformer Text To Speech 다운로드 - Transformer Text To Speech 소스 코드 다운로드

한국어

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

홈페이지>프로그래밍 관련>AI 소스 코드

Transformer Text To Speech

AI 소스 코드

1.0.0

다운로드

트랜스포머 텍스트 연설

TTS (Text-To-Steeech) 시스템은 일반 언어 텍스트를 음성으로 변환합니다. 다른 시스템은 발음 전사와 같은 상징적 언어 적 표현을 음성으로 만듭니다. 이제 딥 러닝의 최근 발전으로 텍스트를 인간의 이해할 수있는 목소리로 변환 할 수 있습니다. 이를 위해 텍스트는 인코더 디코더 유형 신경망으로 공급되어 Mel-spectrogram을 출력합니다. 이 Mel-spectrogram은 이제 "Griffin-LIM 알고리즘"을 사용하여 오디오를 생성하는 데 사용될 수 있습니다. 그러나 인간과 같은 언어 품질을 생산할 수 없다는 단점으로 인해 Wavenet이라는 이름의 또 다른 신경망이 사용됩니다. 이는 Mel-Spectrogram에 의해 공급되어 인간조차도 차별화 할 수없는 오디오를 생산합니다.

모델 아키텍처

1. 변압기 tts

타코트론 -2의 SEQ2SEQ 훈련을위한 병렬 훈련을위한 인코더 디코더 변압기 아키텍처.
텍스트는 입력으로 전송되며 모델은 Mel-Spectrogram을 출력합니다.
디코더 쪽에만 인과 적 마스크를 사용하여 다목적주의가 사용됩니다.
종이 : 변압기 네트워크를 통한 신경 음성 합성.

2. Wavenet

*

변압기 TTS (Mel-Spectrogram)의 출력을 파동으로 공급하여 오디오 샘플을 생성합니다.
SEQ2SEQ 모델과 달리 Wavenet은 병렬 교육을 허용합니다.
종이 : Wavenet : 원시 오디오를위한 생성 모델.

데이터 세트 정보

이 모델은 WMT-2014 English-German 데이터 세트의 하위 집합에서 교육을 받았습니다. 모델을 훈련하기 전에 전처리를 수행 하였다.
데이터 세트 : https://keithito.com/lj-speech-dataset/

확장하다

추가 정보

버전 1.0.0
유형 AI 소스 코드
업데이트 시간 2025-08-22
크기 151.95KB
출처 Github

관련 애플리케이션

How to download hydrax abyss.to

2024-11-11
몬스터 트랜스포머 모바일 버전

2023-09-07
예수님과 함께하는 문자 중국어

2023-08-23
예수님과 문자를 보내세요

2023-08-17
예수님과 함께하는 문자 중국어 버전

2023-08-17
텍스트 아니면 다이

2023-07-03

추천

chat.petals.dev

기타 소스코드

1.0.0
GPT Prompt Templates

기타 소스코드

1.0.0
GPTyped

기타 소스코드

GPTyped 1.0.5
ML stack

AI 소스 코드

1.0.0
awesome free chatgpt

AI 소스 코드

1.0.0
pywin_contextmenu

AI 소스 코드

Version update
Google Dorks

기타 소스코드

1.0
shepherd

기타 소스코드

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

기타 소스코드

v1.1.0-rc-3

관련 정보 전체