OpenVoice
1.0.0

纸|网站
正如我们在论文和网站上详细介绍的那样,OpenVoice的优势是三个方面:
1。准确的色调颜色克隆。 OpenVoice可以准确克隆参考色调,并以多种语言和口音生成语音。
2。灵活的语音风格控制。 OpenVoice可以对语音样式(例如情感和口音)以及其他样式参数(包括节奏,暂停和语调)进行粒状控制。
3。零射击的跨语性语音克隆。在大规模的多语言培训数据集中,均不需要介绍生成的语音的语言和参考语音的语言。
2024年4月,我们发布了OpenVoice V2,其中包括V1中的所有功能,并具有:
1。更好的音频质量。 OpenVoice V2采用了另一种培训策略,可提供更好的音频质量。
2。本地多语言支持。 OpenVoice V2在本地支持英语,西班牙语,法语,中文,日语和韩语。
3。免费商业用途。从2024年4月开始,V2和V1均根据MIT许可发布。免费用于商业用途。
自2023年5月以来,OpenVoice一直在为Myshell.AI的即时语音克隆能力提供动力。直到2023年11月,全球用户使用了数千万次的语音克隆模型,并见证了平台上爆炸性的用户增长。
请参阅用法以获取详细说明。
有关常见的问题和答案,请参见质量保证。我们将定期更新问题和答案列表。
@article{qin2023openvoice,
title={OpenVoice: Versatile Instant Voice Cloning},
author={Qin, Zengyi and Zhao, Wenliang and Yu, Xumin and Sun, Xin},
journal={arXiv preprint arXiv:2312.01479},
year={2023}
}
OpenVoice V1和V2已获得MIT许可。免费用于商业和研究用途。
该实现基于几个出色的项目,TTS,VIT和VITS2。感谢他们的出色工作!