OpenVoice
1.0.0

紙|網站
正如我們在論文和網站上詳細介紹的那樣,OpenVoice的優勢是三個方面:
1。準確的色調顏色克隆。 OpenVoice可以準確克隆參考色調,並以多種語言和口音生成語音。
2。靈活的語音風格控制。 OpenVoice可以對語音樣式(例如情感和口音)以及其他樣式參數(包括節奏,暫停和語調)進行粒狀控制。
3。零射擊的跨語性語音克隆。在大規模的多語言培訓數據集中,均不需要介紹生成的語音的語言和參考語音的語言。
2024年4月,我們發布了OpenVoice V2,其中包括V1中的所有功能,並具有:
1。更好的音頻質量。 OpenVoice V2採用了另一種培訓策略,可提供更好的音頻質量。
2。本地多語言支持。 OpenVoice V2在本地支持英語,西班牙語,法語,中文,日語和韓語。
3。免費商業用途。從2024年4月開始,V2和V1均根據MIT許可發布。免費用於商業用途。
自2023年5月以來,OpenVoice一直在為Myshell.AI的即時語音克隆能力提供動力。直到2023年11月,全球用戶使用了數千萬次的語音克隆模型,並見證了平台上爆炸性的用戶增長。
請參閱用法以獲取詳細說明。
有關常見的問題和答案,請參見質量保證。我們將定期更新問題和答案列表。
@article{qin2023openvoice,
title={OpenVoice: Versatile Instant Voice Cloning},
author={Qin, Zengyi and Zhao, Wenliang and Yu, Xumin and Sun, Xin},
journal={arXiv preprint arXiv:2312.01479},
year={2023}
}
OpenVoice V1和V2已獲得MIT許可。免費用於商業和研究用途。
該實現基於幾個出色的項目,TTS,VIT和VITS2。感謝他們的出色工作!