detail_ttsダウンロードdetail_ttsソースコードのダウンロード

detail_tts

AI ソースコード

1.0.0

ダウンロード

詳細TTS

このモデルは、AR TTSのベストプラクティスになるための3つの重要な重要な方法を新たに提案しました。

RVQが使用されていますが、実際のトレーニングは継続的な機能を採用していますが、偽の離散化と呼びます。
すべて1つのモデル。このモデルには、GPT、拡散、vqvae、gan、およびflowvaeがすべて1つに含まれています。 1つの列車1つの推論。
プレフィックスされたSPK EMBとプロンプトの両方を使用して、Valleタイプの推論とカメ型トレーニングの両方から利益を得ることができます。

モデルが10000時間の非常に汚れたデータでトレーニングされた後に得られた結果を次に示します。モデルは、多くの低品質のデータで簡単に拡大できます。

プロンプト0

PROMPT00.MOV

生成0

PROMPT01.MOV

プロンプト1

PROMPT10.MOV

生成1

PROMPT12.MOV

プロンプト2

PRONT20.MOV

生成2

PROMPT21.MOV

推論

api.pyを確認してください

データセットの準備

パスを変更して、スクリプトにオーディオを含み、実行します

 python prepare/0_vad_asr_save_to_jsonl.py

電車と微調整

 accelerate launch train.py

微調整のために、プレインモデルのロードパスを変更します。

謝辞

GSVからのVQおよびVIT

カメからの拡散とGPT

拡大する

追加情報

バージョン 1.0.0
タイプ AI ソースコード
更新時間 2025-08-24
サイズ 2.2MB
から Github

detail_tts

詳細TTS

推論

データセットの準備

電車と微調整

謝辞

OpenCore_NO_ACPI_Build

nspanel_pro_tools_apk

zkwork_aleo_gpu_worker

F5 TTS ComfyUI

nextcloud_share_url_downloader

Lihua データ分析エンジン無料版 3.0_検索_ナビゲーション_コレクション_世論_ランキング_api

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express