Conditional SpecGAN Tensorflow
1.0.0
A(条件)音频合成生成对抗网络,生成频谱图,该频谱图在张力流中实现了原始波形。 
通过使用生成对抗网络生成频谱图,文本到语音综合。这项工作基于Specgan的原始实施,在该实施情况下,我在这里探索了条件Specgan培训。此外,还采用了基于能量的数据预处理方案,从而改善了音频质量。
预处理结果可以通过以下可视化来证明: 
下载培训数据:此处
运行'./src/utils/preprocess_data.py'处理数据或下载处理的数据:此处
运行'./src/utils/visualize_wav.py'以可视化处理后的清洁数据或下载结果:此处
运行'./ src/utils/make_tfrecord.py'以处理.wav文件中的.tfrecord培训准备就绪文件,或下载已处理的数据:此处
在步骤4中提取.tgz文件,然后根据args.data_dir在./src/config.py:Data_dir:
data_dir='../data/sc09_preprocess_energy'
可以通过更改“ -data_dir选项”中的“ ./src/config.py”来修改此默认路径。
python3 ./src/runner.py train
python3 ./src/runner.py generate
python3 ./src/runner.py train --conditional
python3 ./src/runner.py generate --conditional