MimicMania
1.0.0
Minimania是一个Web应用程序,可提供文本到语音(TTS)和语音克隆功能。该应用程序利用深度学习模型以多种语言生成高质量的语音输出,并可以自定义生成音频的音调,速度和音量。 Minimania的TTS发动机建立在Tacotron 2和Wavellow型号的顶部,而其语音克隆功能则基于FastSpeech和Melgan型号。
单击Mega链接以查看演示:视频的链接
在安装和使用Mimicmania之前,您需要下载并安装以下内容:
apt-get install ffmpeg 。sudo apt-get install espeak-ng 。sudo apt-get install espeak 。此外,您还需要按照下一节中所述下载所需的模块和Python依赖项。
要安装和运行Mimicmania,请执行以下步骤:
git clone https://github.com/everydaycodings/MimicMania.git克隆该存储库到本地机器cd MimicMania导航到项目目录python setup.py以下载所需的模块。此过程可能需要一些时间,因为所需的模块约为6 GB。pip install -r requirements.txt下载所有python依赖性。streamlit run app.py以启动Web应用程序。 如果您想为Mimicmania做出贡献,请派遣存储库并创建一个拉请请求。我们欢迎各种贡献,包括错误修复,新功能和文档改进。
Mimicmania是由Kumar Saksham(日常编码)在各种开源资源的帮助下开发的。
我们要特别感谢Coqui-ai/TTS将其文本到语音模型作为我们项目的资源。
Mimicmania已获得MIT许可证的许可。
如果您对Mimicmania有任何疑问或问题,请通过[email protected]与我们联系,或通过Twitter @everydaycodings或Medium @everydayCodings与我们联系。
我们总是很乐意提供帮助!