zhtts
1.0.0
중국어 발음 합성을 수행하기 위해 패들링 스피치를 사용하는 것이 좋습니다.
중국인
CPU에서 실시간으로 실행되는 ZH/중국어 텍스트 데모. (FastSpeech2 + mbmelgan)
RTF (실시간 계수) : CPU를 사용한 0.2 : 인텔 (R) 코어 (TM) I5-7200U CPU @ 2.50GHz 24KHz 오디오 사용 FastSpeech2, Tacotron2 용 RTF1.6
이 저장소는 주로 개선이 거의없는 텐서 플로트를 기반으로합니다 .
Text = "2020 년에는 오픈 소스 엔드 투 엔드 중국어 음성 합성 시스템입니다."
zhtts 합성 mp3
pip install zhtts
또는이 repo를 복제 한 다음 pip install .
import zhtts
text = "2020年,这是一个开源的端到端中文语音合成系统"
tts = zhtts . TTS () # use fastspeech2 by default
tts . text2wav ( text , "demo.wav" )
> >> Save wav to demo . wav
tts . frontend ( text )
> >> ( '二零二零年,这是一个开源的端到端中文语音合成系统' , 'sil ^ er4 #0 l ing2 #0 ^ er4 #0 l ing2 #0 n ian2 #0 #3 zh e4 #0 sh iii4 #0 ^ i2 #0 g e4 #0 k ai1 #0 ^ van2 #0 d e5 #0 d uan1 #0 d ao4 #0 d uan1 #0 zh ong1 #0 ^ uen2 #0 ^ v3 #0 ^ in1 #0 h e2 #0 ch eng2 #0 x i4 #0 t ong3 sil' )
tts . synthesis ( text )
> >> array ([ 0. , 0. , 0. , ..., 0. , 0. , 0. ], dtype = float32 ) 이 repo를 복제하고 pip install flask
python app.py
$ curl -o " helloworld.wav " " http://localhost:5000/api/tts?text=%E4%BD%A0%E5%A5%BD%E4%B8%96%E7%95%8C " %E4%BD%A0%E5%A5%BD%E4%B8%96%E7%95%8C 는 "Hello, The World!"의 URL 코드입니다.
Tacotron 모델에서 WAV 생성은 빠른 음성보다 낫지 만 타코트론은 타코트론을 사용하여 코드를 변경하는 것이 훨씬 느립니다.
import zhtts
tts = zhtts . TTS ( text2mel_name = "TACOTRON" )
# tts = zhtts.TTS(text2mel_name="FASTSPEECH2")