AICoverGenダウンロードAICoverGenソースコードのダウンロード

AICoverGen

その他のソースコード

1.0.0

ダウンロード

Aicovergen

YouTubeビデオまたはローカルオーディオファイルからRVC V2トレーニングされたAI音声とカバーを作成するための自律パイプライン。 AIアシスタント/チャットボット/vtuberに歌機能を追加したい開発者、またはお気に入りのキャラクターがお気に入りの曲を歌っているのを聞きたい人のために。

ショーケース：https：//www.youtube.com/watch?v=2qzue4wm7cm

セットアップガイド：https：//www.youtube.com/watch?v=pdlhk4vvhqk

WebUIは絶え間ない開発とテストを受けていますが、ローカルとコラブの両方で今すぐ試してみることができます！

Changelog

コンバージョンと音声モデルのダウンロードを容易にするためのWebUI
ローカルオーディオファイルからのカバー世代のサポート
中間ファイルを生成するオプション。たとえば、孤立したボーカル/インストゥルメンタル
検索/タグフィルターを使用して、テーブルから提案されたパブリックボイスモデルをダウンロード
音声モデルのPixelDrainダウンロードリンクのサポート
より速く高品質のボーカル変換のために新しいRMVPEピッチ抽出技術を実装する
AIメインボーカル、バックアップボーカル、インストゥルメンタルのボリュームコントロール
音声変換のインデックスレート
AIメインボーカルのリバーブコントロール
WebUIのローカルネットワーク共有オプション
追加のRVCオプション-filter_radius、rms_mix_rate、保護
ファイルブラウザオプションを介してローカルファイルアップロード
WebUIを介してローカルトレーニングされたRVC V2モデルをアップロードします
ピッチ検出方法制御、例：RMVPE/Mangio-Crepe
ボーカルとインストゥルメンタルのピッチ変更。カラオケの曲のキーを変更することと同じ効果。
オーディオ出力形式オプション：WAVまたはMP3。

Aicovergenを最新バージョンに更新します

AICoverGenディレクトリにコマンドラインウィンドウを開き、次のコマンドを実行することにより、新しい要件と変更をインストールして引き出します。

 pip install -r requirements.txt
git pull

コラブユーザーの場合は、コラブノートブックの上部ナビゲーションバーのRuntimeをクリックして、ドロップダウンメニューでDisconnect and delete runtime 。次に、ノートブックの指示に従ってWebUIを実行します。

コラブノートブック

十分な強力なNvidia GPUのない人のために、Google Colabを使用してAicovergenを試してみることができます。

数分後にGoogle Colabノートブックが切断されることに直面している人のために、WebUIを使用しない代替手段があります。

これをローカルに実行したい人は、以下のセットアップガイドに従ってください。

設定

GitとPythonをインストールします

ここで指示に従って、コンピューターにGitをインストールしてください。また、このガイドに従って、Pythonバージョン3.9をまだインストールしていない場合は、インストールしてください。 Pythonの他のバージョンを使用すると、依存関係の競合が発生する場合があります。

ffmpegをインストールします

ここで指示に従って、コンピューターにFFMPEGをインストールしてください。

Soxをインストールします

ここで指示に従ってSOXをインストールし、Windows Path環境に追加します。

クローンアイコバーゲンリポジトリ

コマンドラインウィンドウを開き、これらのコマンドを実行してこのリポジトリ全体をクローンし、必要な追加の依存関係をインストールします。

 git clone https://github.com/SociallyIneptWeeb/AICoverGen
cd AICoverGen
pip install -r requirements.txt

必要なモデルをダウンロードします

次のコマンドを実行して、必要なMDXNETボーカル分離モデルとHubertベースモデルをダウンロードします。

 python src/download_models.py

WebUIでの使用

Aicovergen WebUIを実行するには、次のコマンドを実行します。

 python src/webui.py

フラグ	説明
`-h` 、 `--help`	このヘルプメッセージと出口を表示します。
`--share`	パブリックURLを作成します。これは、Google ColabでWeb UIを実行するのに役立ちます。
`--listen`	あなたのローカルネットワークからWeb UIに到達可能にします。
`--listen-host LISTEN_HOST`	サーバーが使用するホスト名。
`--listen-port LISTEN_PORT`	サーバーが使用するリスニングポート。

Running on local URL: http://127.0.0.1:7860が表示されたら、リンクをクリックしてWebUIでタブを開くことができます。

WebUI経由でRVCモデルをダウンロードします

Download modelタブに移動し、ダウンロードリンクをRVCモデルに貼り付けて、一意の名前を付けます。既に訓練された音声モデルがダウンロードできるAIハブの不一致を検索できます。ダウンロードリンクがどのように見えるかについての例を参照できます。ダウンロードされたzipファイルには、.pthモデルファイルとオプションの.indexファイルが含まれている必要があります。

2つの入力フィールドが入力されたら、 Downloadをクリックするだけです！出力メッセージが[NAME] Model successfully downloaded! 、リフレッシュモデルボタンをクリックした後、 Generateタブで使用できるはずです。

WebUI経由でRVCモデルをアップロードします

RVC V2モデルをローカルで訓練し、AIカバー世代に使用したい人向け。 Upload modelタブに移動し、手順に従ってください。出力メッセージに[NAME] Model successfully uploaded! 、リフレッシュモデルボタンをクリックした後、 Generateタブで使用できるはずです。

WebUI経由でパイプラインを実行します

Voice Modelsドロップダウンメニューから、使用する音声モデルを選択します。 [RVC_Modelsディレクトリに手動でファイルを追加した場合は、 Updateをクリックしてリストを更新します。
曲の入力フィールドで、YouTubeの任意の曲へのリンクまたはローカルオーディオファイルへのフルパスをコピーして貼り付けます。
ピッチは、元のボーカルとRVC AIモーダルに応じて、-12、0、または12に設定する必要があります。これにより、声が調整されていないことが保証されます。
音声変換とオーディオミキシングのその他の高度なオプションは、アコーディオンの矢印をクリックして拡張することで表示できます。

すべてのメインオプションが入力されたら、 Generateをクリックすると、GPUに応じてAI生成カバーが数分以内に表示されます。

CLIでの使用

RVCモデルの手動ダウンロード

UNZIP（必要に応じて）、. .pthおよび.indexファイルをrvc_modelsディレクトリの新しいフォルダーに転送します。各フォルダーには、1つの.pthと1つの.indexファイルのみが含まれている必要があります。

ディレクトリ構造は次のようになります。

 ├── rvc_models
│   ├── John
│   │   ├── JohnV2.pth
│   │   └── added_IVF2237_Flat_nprobe_1_v2.index
│   ├── May
│   │   ├── May.pth
│   │   └── added_IVF2237_Flat_nprobe_1_v2.index
│   ├── MODELS.txt
│   └── hubert_base.pt
├── mdxnet_models
├── song_output
└── src

パイプラインを実行します

コマンドラインを使用してAIカバー生成パイプラインを実行するには、次のコマンドを実行します。

 python src/main.py [-h] -i SONG_INPUT -dir RVC_DIRNAME -p PITCH_CHANGE [-k | --keep-files | --no-keep-files] [-ir INDEX_RATE] [-fr FILTER_RADIUS] [-rms RMS_MIX_RATE] [-palgo PITCH_DETECTION_ALGO] [-hop CREPE_HOP_LENGTH] [-pro PROTECT] [-mv MAIN_VOL] [-bv BACKUP_VOL] [-iv INST_VOL] [-pall PITCH_CHANGE_ALL] [-rsize REVERB_SIZE] [-rwet REVERB_WETNESS] [-rdry REVERB_DRYNESS] [-rdamp REVERB_DAMPING] [-oformat OUTPUT_FORMAT]

フラグ	説明
`-h` 、 `--help`	このヘルプメッセージと出口を表示します。
`-i SONG_INPUT`	YouTubeの曲へのリンクまたはローカルオーディオファイルへのパス。 Windowsの二重引用符と、Unixのようなシステムの単一引用符で囲む必要があります。
`-dir MODEL_DIR_NAME`	特定の音声用の`.pth`および`.index`ファイルを含むRVC_Modelsディレクトリのフォルダーの名前。
`-p PITCH_CHANGE`	オクターブでAIボーカルのピッチを変更します。変更なしで0に設定します。一般に、男性から女性の変換に1を使用し、その逆に-1を使用します。
`-k`	オプション。すべての中間オーディオファイルを生成するために追加できます。たとえば、孤立したAIボーカル/インストゥルメンタル。スペースを節約するために除外してください。
`-ir INDEX_RATE`	オプション。デフォルト0.5。ボーカルに残るAIのアクセントのどれだけを制御します。 0 <= index_rate <= 1。
`-fr FILTER_RADIUS`	オプション。デフォルト3。> = 3：収穫されたピッチの結果に中央値フィルタリングの中央値フィルタリングを適用します。 0 <= filter_radius <= 7。
`-rms RMS_MIX_RATE`	オプション。デフォルト0.25。オリジナルのボーカルのラウドネス（0）または固定のラウドネス（1）を使用する量を制御します。 0 <= rms_mix_rate <= 1。
`-palgo PITCH_DETECTION_ALGO`	オプション。デフォルトのrmvpe。最良のオプションは、RMVPE（ボーカルの明確さ）、次にMangio-Crepe（よりスムーズなボーカル）です。
`-hop CREPE_HOP_LENGTH`	オプション。デフォルト128。Mangio-Crepe Algoを具体的に使用する際に、ミリ秒のピッチの変化をチェックする頻度を制御します。値が低いと、変換が長くなり、音声亀裂のリスクが高くなりますが、ピッチの精度が向上します。
`-pro PROTECT`	オプション。デフォルト0.33。元のボーカルの息と声のない子音のどれだけが、AIボーカルに残るかを制御します。無効になるように0.5を設定します。 0 <=保護<= 0.5。
`-mv MAIN_VOCALS_VOLUME_CHANGE`	オプション。デフォルト0。メインAIボーカルのコントロールボリューム。 -3を使用してボリュームを3デシベルまたは3つ減らして、ボリュームを3デシベルに増やします。
`-bv BACKUP_VOCALS_VOLUME_CHANGE`	オプション。デフォルト0。バックアップAIボーカルのコントロールボリューム。
`-iv INSTRUMENTAL_VOLUME_CHANGE`	オプション。デフォルト0。バックグラウンドミュージック/インストゥルメンタルのコントロールボリューム。
`-pall PITCH_CHANGE_ALL`	オプション。デフォルト0。セミトーンのバックグラウンドミュージック、バックアップボーカル、AIボーカルのピッチ/キーを変更します。音質をわずかに低下させます。
`-rsize REVERB_SIZE`	オプション。デフォルト0.15。部屋が大きいほど、リバーブ時間が長くなります。 0 <= reverb_size <= 1。
`-rwet REVERB_WETNESS`	オプション。デフォルト0.2。リバーブを使用したAIボーカルのレベル。 0 <= reverb_wetness <= 1。
`-rdry REVERB_DRYNESS`	オプション。デフォルト0.8。リバーブなしのAIボーカルのレベル。 0 <= reverb_dryness <= 1。
`-rdamp REVERB_DAMPING`	オプション。デフォルト0.7。リバーブの高周波数の吸収。 0 <= reverb_damping <= 1。
`-oformat OUTPUT_FORMAT`	オプション。デフォルトMP3。最高の品質と大きなファイルサイズのWAV、まともな品質と小さなファイルサイズのMP3。

利用規約

次の目的で変換された音声の使用は禁止されています。

個人を批判または攻撃する。
特定の政治的地位、宗教、またはイデオロギーを擁護する、または反対する。
適切なゾーニングなしで強く刺激的な表現を公開します。
音声モデルと生成された音声クリップの販売。
他の人を傷つけたり傷つけたりするという悪意のある意図を持って、声の元の所有者のなりすまし。
個人情報の盗難や不正な電話につながる詐欺目的。

免責事項

私は、このソフトウェアの使用/誤用または使用不能に関連する、または何らかの形で発生する、または何らかの形で発生する、直接的、間接的、結果的、偶発的、または特別な損害について責任を負いません。

拡大する

追加情報

バージョン 1.0.0
タイプその他のソースコード
更新時間 2025-02-23
サイズ 474.27KB
から Github

AICoverGen

Aicovergen

Changelog

Aicovergenを最新バージョンに更新します

コラブノートブック

設定

GitとPythonをインストールします

ffmpegをインストールします

Soxをインストールします

クローンアイコバーゲンリポジトリ

必要なモデルをダウンロードします

WebUIでの使用

WebUI経由でRVCモデルをダウンロードします

WebUI経由でRVCモデルをアップロードします

WebUI経由でパイプラインを実行します

CLIでの使用

RVCモデルの手動ダウンロード

パイプラインを実行します

利用規約

免責事項

Google Dorks

shepherd

hidusbf

mongo express

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

hidusbf

Google Dorks

shepherd

hidusbf