Non English Tacotron 2 Training Notebook
1.0.0
日本語、フランス語、マンダリンをサポートするタコトロン2トレーニングノートブック
このノートブックは、英語以外の言語でタコトロン2モデルをトレーニングするための簡単なアクセスを提供することを目的としています。現在、日本語(TalqueおよびNeteralk Phonetics)、フランス語、およびマンダリンの前提条件モデルが含まれていますが、計画にはドイツ語などの将来をより多く含めることが計画されています。日本語の場合、中性音声と前処理されたモデルを使用することをお勧めします。
トレーニング用のオーディオは、16ビット22050HzモノWAVファイルでなければなりません。ファイル名にスペースを含めないでください。ファイルには、アルファナメリック(半幅)、ダッシュ、およびアンダースコアのみを含める必要があります。これは、日本語または中国のファイル名、またはディークリティクスがないことを意味します。学習を促進するために、オーディオクリップは10秒以下でなければなりません。私のテストに基づいて、少なくとも15分のオーディオを使用することをお勧めします。
Transcriptionファイルは、次の形式を持つ各行を持つテキストドキュメントである必要があります: wavs/{name_of_file}.wav|{text} 。含まれているG2Pのいずれかを使用して、転写を適切な音声入力に変換します。
ノートブックの手順は、かなり自己認識でなければなりません。トレーニングを開始する前に、オーディオをWAV/フォルダーにアップロードします。ここに留意すべきメモがいくつかあります: