bark voice cloning HuBERT quantizerダウンロード - bark voice cloning HuBERT quantizerソースコードダウンロード

bark voice cloning HuBERT quantizer

その他のソースコード

1.0.0

ダウンロード

樹皮の音声クローニング

読んでください

このコードはPython 3.10で動作しますが、他のバージョンではテストしていません。一部の古いバージョンには問題があります。

高品質の樹皮との音声クローニング？

今は可能です。

Examples_biden_example.mov

音声をクローンするにはどうすればよいですか？

開発者向け：

Huggingfaceモデルページのコード例

みんなのために：

樹皮と音声クローニングを備えたオーディオウェブイ
オンラインハギングフェイスボイスクローニングスペース
インタラクティブなPythonノートブック

クローンされた声はあまり説得力がありません、なぜ他の人のクローンされた声が私のものよりも優れているのですか？

これらのものがあなたの音声入力にないことを確認してください：（具体的には）

ノイズ（以前にノイズリムーバーを使用できます）
音楽（音楽リムーバーツールもあります）（バックグラウンドで音楽が必要でない限り）
最後のカットオフ（これにより、世代を継続しようとします）
トレーニングデータの1秒未満（私は個人的には約10秒間、良い可能性があることをお勧めしますが、5秒でも素晴らしい結果が得られました。）

何が良い迅速なオーディオを作るのですか？（順不同）

明らかに話されています
奇妙なバックグラウンドノイズはありません
スピーカーは1人だけです
文が終了した後に終了するオーディオ
通常の/一般的な声（彼らは通常より多くの成功を収めていますが、それはまだ複雑な声をクローンすることができますが、それほど得意ではありません）
約10秒のデータ

前処理されたモデル

正式

名前	ヒューバートモデル	量子版	エポック	言語	データセット
Quantifier_hubert_base_ls960.pth	ヒューバートベース	0	3	Eng	Gitmylo/Bark-Semantic-Training
Quantifier_hubert_base_ls960_14.pth	ヒューバートベース	0	14	Eng	Gitmylo/Bark-Semantic-Training
Quantifier_v1_hubert_base_ls960_23.pth	ヒューバートベース	1	23	Eng	Gitmylo/Bark-Semantic-Training

コミュニティ

著者	名前	ヒューバートモデル	量子版	エポック	言語	データセット
hobispl	ポーランド - ハーバーティザー_8_EPOCH.PTH	ヒューバートベース	1	8	pol	ホビス/バークポーリッシュセマンティックワブトレーニング
C0untfloyd	German-Hubert-Quantizer_14_epoch.pth	ヒューバートベース	1	14	ger	Countfloyd/Bark-German-Semantic-Wav-Training

開発者向け：樹皮プロジェクトで音声クローニングを実装します

このディレクトリからプロジェクトにファイルをコピーするだけです。
Hubert Managerには、HubertおよびCustom Amulizerモデルをダウンロードする方法が含まれています。
Customhubertをロードすることは非常に簡単です
ノートブックには、CUDAまたはCPUで使用するコードが含まれています。ただのCPUの代わりに。

 from hubert . pre_kmeans_hubert import CustomHubert
import torchaudio

# Load the HuBERT model,
# checkpoint_path should work fine with data/models/hubert/hubert.pt for the default config
hubert_model = CustomHubert ( checkpoint_path = 'path/to/checkpoint' )

# Run the model to extract semantic features from an audio file, where wav is your audio file
wav , sr = torchaudio . load ( 'path/to/wav' ) # This is where you load your wav, with soundfile or torchaudio for example

if wav . shape [ 0 ] == 2 :  # Stereo to mono if needed
    wav = wav . mean ( 0 , keepdim = True )

semantic_vectors = hubert_model . forward ( wav , input_sample_hz = sr )

カスタムKmeansのロードと実行

 import torch
from hubert . customtokenizer import CustomTokenizer

# Load the CustomTokenizer model from a checkpoint
# With default config, you can use the pretrained model from huggingface
# With the default setup from HuBERTManager, this will be in data/models/hubert/tokenizer.pth
tokenizer = CustomTokenizer . load_from_checkpoint ( 'data/models/hubert/tokenizer.pth' )  # Automatically uses the right layers

# Process the semantic vectors from the previous HuBERT run (This works in batches, so you can send the entire HuBERT output)
semantic_tokens = tokenizer . get_token ( semantic_vectors )

# Congratulations! You now have semantic tokens which can be used inside of a speaker prompt file.

自分で訓練するにはどうすればよいですか？

トレーニングコマンドを実行するだけです。

トレーニング用のセマンティックデータとWAVを作成する簡単な方法は、私のスクリプトであるBark-Data-Genです。しかし、波の作成には、セマンティクスの作成よりも長くないにしても、ほぼ同じ時間がかかることを忘れないでください。そのために生成するのに時間がかかる場合があります。

たとえば、ZIPがオーディオファイルを含むデータセットがある場合は、セマンティクス用のZIP、WAVファイル用のZIP。「文学」と呼ばれるフォルダーの内部

process.py --path Literature --mode prepare

process.py --path Literature --mode prepare2

process.py --path Literature --mode trainを実行する必要があります

モデルが十分にトレーニングされている場合は、 process.py --path Literature --mode testを実行して最新のモデルをテストできます。

免責事項

このモデルによって作成されたセマンティクスを使用して生成されたオーディオについては責任を負いません。違法な目的で使用しないでください。

拡大する

追加情報

バージョン 1.0.0
タイプその他のソースコード
更新時間 2025-02-25
サイズ 88.29KB
から Github

bark voice cloning HuBERT quantizer

樹皮の音声クローニング

読んでください

高品質の樹皮との音声クローニング？

音声をクローンするにはどうすればよいですか？

クローンされた声はあまり説得力がありません、なぜ他の人のクローンされた声が私のものよりも優れているのですか？

前処理されたモデル

正式

コミュニティ

開発者向け：樹皮プロジェクトで音声クローニングを実装します

自分で訓練するにはどうすればよいですか？

免責事項

BARK

GitHub sgrebnov/cordova plugin background download

GLM 4 Voice

wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

Retrieval based Voice Conversion WebUI

GOOGLE VOICE 無制限の SMS インターフェース

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

hidusbf

Google Dorks

shepherd

hidusbf