shanghainese ttsダウンロード-ShanghaineseTTS shanghainese ttsコードのダウンロード

shanghainese tts

AI ソースコード

2023.06.06

ダウンロード

シャンガインTTS

Dartmouth Ling 48最終プロジェクト： ShanghaineseのTTSの改善
Yuanhao Chen [email protected] 2023年春

ゴール

テキストの前処理に特別な注意を払うことにより、既存のモデルと比較して、トーンサンディの生産を改善しようとするために、上から上から語り直す（TTS）システムをゼロから構築します。

説明

writeup/main.pdfを参照してください。

依存関係

pip install -r phonemisation/requirements.txt
pip install -r speech_synthesis/requirements.txt
pip install -r comparison_questionnaire/requirements.txt  # for analysis of questionnaire results

使用法

speech_synthesis/README.mdを参照してください。

構造

phonemisation/ ：Phonemisationモジュールが含まれています
- phonemisation/__init__.pyの出力の説明を参照してください
- 使用法： python -m phonemisation "text to phonemise"
- メカニズム：中国語の文-単語セグメンテーション⟶中国語の単語-ローマイネーション⟶シャンガインピンイン-音素⟶シャンガイン音素
  - jiebaは単語セグメンテーションに使用されます
  - 私が以前に作った上海の辞書は、ローマイゼーションに使用されています
    - Qieyunモジュールを使用して、トーン番号1 Yinping / Inbinトーンの音節に追加します。他のトーンは音韻的にマークされていません
  - romanisation.pyのromanisation_to_ipa関数には、音素関数が含まれています
make_metadata.py ： phonemisationモジュールを使用して、転写をIPAに変換し、トレーニング用のメタデータを生成します
- data/で以下を参照してください/
data/ ：トレーニングに使用されるデータセットが含まれています
- トランプションとオーディオファイルはこのレポで採用されています
  - トレーニングのために16kHzにダウンサンプリングされました
  - 現在、 shh.dict.cn/のみがトレーニングに使用されています
- */metadata.txtファイルは、 make_metadata.pyによって生成されます
training/
- モデルをトレーニングするためのJuptyerノートブック
- Google Colab環境でアップロードして実行することを目的としています。ローカルで使用するために変更する必要があります
- coqui-ai/TTSリポジトリを使用します。
writeup/ ：書き込み
speech_synthesis/ ：音声合成モデルが含まれています
- 詳細については、 speech_synthesis/README.mdを参照してください
comparison_questionnaire/ ：このモデル、Appleモデル、および人間のスピーカーによって作成された音声を比較するために使用されるアンケートとオーディオファイルが含まれています
- *-1.wav ：このモデルによって作成されました
- *-2.wav ：Apple VoiceOverがプロデュース（MacBook Pro 14-Inch、2021; Macos Ventura 13.0.1）
- *-3.wav ：自分で話されています
- stats.ipynb ：アンケートの結果を分析するためのJupyterノートブック