OpenVoiceダウンロードOpenVoiceソースコードのダウンロード

OpenVoice

AI ソースコード

1.0.0

ダウンロード

論文| Webサイト

導入

OpenVoice V1

私たちの論文とウェブサイトで詳述したように、OpenVoiceの利点は3つあります。

1。正確なトーンカラークローニング。 OpenVoiceは、参照トーンの色を正確にクローンし、複数の言語とアクセントで音声を生成できます。

2。柔軟な音声スタイルコントロール。 OpenVoiceは、感情やアクセントなどの音声スタイル、およびリズム、ポーズ、イントネーションなどの他のスタイルパラメーターを粒状に制御できるようにします。

3。ゼロショットクロスリング音声クローニング。生成されたスピーチの言語も参照スピーチの言語も、大規模なスピーカー多言語トレーニングデータセットで提示する必要はありません。

OpenVoice V2

2024年4月に、V1のすべての機能を含むOpenVoice V2をリリースし、次のことがあります。

1.より良いオーディオ品質。 OpenVoice V2は、より良いオーディオ品質を提供する別のトレーニング戦略を採用しています。

2。ネイティブの多言語サポート。英語、スペイン語、フランス語、中国語、日本、韓国語は、OpenVoice V2でネイティブにサポートされています。

3。無料の商業用。 2024年4月から、V2とV1の両方がMITライセンスの下でリリースされます。商業用に無料。

openvoice.mp4

OpenVoiceは、2023年5月からMyShell.AIのインスタント音声クローニング機能に動力を供給しています。2023年11月まで、音声クローニングモデルは世界中のユーザーによって何千回も使用されており、プラットフォームでの爆発的なユーザーの成長を目撃しました。

主な貢献者

MITのZengyi Qin
ツリンゥア大学のウェンリアン・チャオ
ツミンYUツミン大学
マイシェルのイーサン・サン

使い方

詳細な手順については、使用法をご覧ください。

一般的な問題

一般的な質問と回答については、QAをご覧ください。質問と回答リストを定期的に更新します。

引用

 @article{qin2023openvoice,
  title={OpenVoice: Versatile Instant Voice Cloning},
  author={Qin, Zengyi and Zhao, Wenliang and Yu, Xumin and Sun, Xin},
  journal={arXiv preprint arXiv:2312.01479},
  year={2023}
}

ライセンス

OpenVoice V1とV2はMITライセンスです。商業用と研究の両方で無料。

謝辞

この実装は、いくつかの優れたプロジェクト、TTS、VITS、およびVITS2に基づいています2。彼らの素晴らしい仕事をありがとう！

拡大する

追加情報

バージョン 1.0.0
タイプ AI ソースコード
更新時間 2025-08-19
サイズ 3.05MB
から Github

OpenVoice

導入

OpenVoice V1

OpenVoice V2

主な貢献者

使い方

一般的な問題

引用

ライセンス

謝辞

ML stack

awesome free chatgpt

pywin_contextmenu

promptl

tick.chat

FastLoRAChat

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express