Conditional SpecGAN Tensorflow
1.0.0
(条件付き)オーディオ統合生成的敵対的なネットワークは、生の波形、Tensorflowの実装を合成するSpectrogramを生成します。 
生成的敵対的ネットワークを使用してスペクトログラムを生成することによるテキスト間合成。この作業は、Specganの元の実装に基づいています。Specganは、Specganトレーニングのコンディショニングで探索しています。さらに、エネルギーベースのデータ前処理スキームが適用され、オーディオ品質が向上します。
プリプロースの結果は、次の視覚化によって実証できます。 
トレーニングデータのダウンロード:こちら
'./src/utils/preprocess_data.py'を実行するか、データを処理するか、処理されたデータをダウンロードしてください:ここで
'./src/utils/visualize_wav.py'を実行するには、処理されたクリーンデータを視覚化するか、結果をダウンロードしてください。
'./src/utils/make_tfrecord.py'を実行して.wavファイルを.tfrecordトレーニング準備完了ファイルに処理するか、処理されたデータをダウンロードします。
Step.4で.tgzファイルを抽出し、args.data_dirの./src/config.pyに従って関連するパスにそれらを配置します:
data_dir='../data/sc09_preprocess_energy'
このデフォルトのパスは、 './src/config.py'の '-data_dirオプションを変更することで変更できます。
python3 ./src/runner.py train
python3 ./src/runner.py generate
python3 ./src/runner.py train --conditional
python3 ./src/runner.py generate --conditional