shanghainese tts
2023.06.06
Para construir um sistema de texto em fala (TTS) para Shanghainese a partir do zero, buscando melhorar a produção de tons Sandhi em comparação com os modelos existentes, prestando atenção especial ao pré-processamento do texto.
Consulte WriteUp/main.pdf.
pip install -r phonemisation/requirements.txt
pip install -r speech_synthesis/requirements.txt
pip install -r comparison_questionnaire/requirements.txt # for analysis of questionnaire results Veja speech_synthesis/README.md .
phonemisation/ : contém o módulo de fonemizaçãophonemisation/__init__.pypython -m phonemisation "text to phonemise"jieba é usado para segmentação de palavrasQieyun para adicionar o tom número 1 às sílabas de "tom de yinping / inbin ; Outros tons são fonologicamente não marcadosromanisation_to_ipa em romanisation.py contém a função de fonemizaçãomake_metadata.py : usa o módulo phonemisation para converter a transcrição em IPA e gerar metadados para treinamentodata/data/ : contém o conjunto de dados usado para treinamentoshh.dict.cn/ é usado para treinamento*/metadata.txt são gerados por make_metadata.pytraining/coqui-ai/TTS reposwriteup/ : The Write-Upspeech_synthesis/ : contém o modelo de síntese de falaspeech_synthesis/README.md para mais detalhescomparison_questionnaire/ : contém o questionário e os arquivos de áudio usados para comparar a fala produzida por este modelo, o modelo Apple e um falante humano*-1.wav : produzido por este modelo*-2.wav : produzido pela Apple VoiceOver (MacBook Pro 14 polegadas, 2021; MacOS Ventura 13.0.1)*-3.wav : falado sozinhostats.ipynb : Notebook Jupyter para analisar os resultados do questionário