
論文| Webサイト
私たちの論文とウェブサイトで詳述したように、OpenVoiceの利点は3つあります。
1。正確なトーンカラークローニング。 OpenVoiceは、参照トーンの色を正確にクローンし、複数の言語とアクセントで音声を生成できます。
2。柔軟な音声スタイルコントロール。 OpenVoiceは、感情やアクセントなどの音声スタイル、およびリズム、ポーズ、イントネーションなどの他のスタイルパラメーターを粒状に制御できるようにします。
3。ゼロショットクロスリング音声クローニング。生成されたスピーチの言語も参照スピーチの言語も、大規模なスピーカー多言語トレーニングデータセットで提示する必要はありません。
2024年4月に、V1のすべての機能を含むOpenVoice V2をリリースし、次のことがあります。
1.より良いオーディオ品質。 OpenVoice V2は、より良いオーディオ品質を提供する別のトレーニング戦略を採用しています。
2。ネイティブの多言語サポート。英語、スペイン語、フランス語、中国語、日本、韓国語は、OpenVoice V2でネイティブにサポートされています。
3。無料の商業用。 2024年4月から、V2とV1の両方がMITライセンスの下でリリースされます。商業用に無料。
OpenVoiceは、2023年5月からMyShell.AIのインスタント音声クローニング機能に動力を供給しています。2023年11月まで、音声クローニングモデルは世界中のユーザーによって何千回も使用されており、プラットフォームでの爆発的なユーザーの成長を目撃しました。
詳細な手順については、使用法をご覧ください。
一般的な質問と回答については、QAをご覧ください。質問と回答リストを定期的に更新します。
@article{qin2023openvoice,
title={OpenVoice: Versatile Instant Voice Cloning},
author={Qin, Zengyi and Zhao, Wenliang and Yu, Xumin and Sun, Xin},
journal={arXiv preprint arXiv:2312.01479},
year={2023}
}
OpenVoice V1とV2はMITライセンスです。商業用と研究の両方で無料。
この実装は、いくつかの優れたプロジェクト、TTS、VITS、およびVITS2に基づいています2。彼らの素晴らしい仕事をありがとう!