Conditional SpecGAN Tensorflow
1.0.0
A(條件)音頻合成生成對抗網絡,生成頻譜圖,該頻譜圖在張力流中實現了原始波形。 
通過使用生成對抗網絡生成頻譜圖,文本到語音綜合。這項工作基於Specgan的原始實施,在該實施情況下,我在這裡探索了條件Specgan培訓。此外,還採用了基於能量的數據預處理方案,從而改善了音頻質量。
預處理結果可以通過以下可視化來證明: 
下載培訓數據:此處
運行'./src/utils/preprocess_data.py'處理數據或下載處理的數據:此處
運行'./src/utils/visualize_wav.py'以可視化處理後的清潔數據或下載結果:此處
運行'./ src/utils/make_tfrecord.py'以處理.wav文件中的.tfrecord培訓準備就緒文件,或下載已處理的數據:此處
在步驟4中提取.tgz文件,然後根據args.data_dir在./src/config.py:Data_dir:
data_dir='../data/sc09_preprocess_energy'
可以通過更改“ -data_dir選項”中的“ ./src/config.py”來修改此默認路徑。
python3 ./src/runner.py train
python3 ./src/runner.py generate
python3 ./src/runner.py train --conditional
python3 ./src/runner.py generate --conditional