Transformer Text To Speechダウンロード - Transformer Text To Speechソースコードダウンロード

日本語

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

ホーム>プログラミング関連>AI ソースコード

Transformer Text To Speech

AI ソースコード

1.0.0

ダウンロード

トランステキストから音声

テキストからスピーチ（TTS）システムは、通常の言語テキストを音声に変換します。他のシステムは、音声転写などの象徴的な言語表現を音声に変えます。現在、深い学習の最近の開発により、テキストを人間に理解できない声に変換することが可能です。このため、テキストはエンコーダーデコーダータイプのニューラルネットワークに供給され、メルスペクトルグラムを出力します。このメルスペクトルグラムを使用して、「Griffin-Limアルゴリズム」を使用してオーディオを生成できるようになりました。しかし、人間のような音声品質を生成できないという不利な点のため、Wavenetという名前の別のニューラルネットが採用されています。これは、人間でさえ区別できないオーディオを生成するためにメルスペクトルで供給されます。

モデルアーキテクチャ

1。トランスTTS

タコトロン-2の場合、SEQ2SEQトレーニング用の代わりに代わりに並列トレーニング用のエンコーダーデコーダートランスアーキテクチャ。
テキストは入力として送信され、モデルはメルスペクトルグラムを出力します。
デコーダー側にのみ因果マスキングがあり、多目的注意が採用されています。
論文：トランスネットワークを使用したニューラル音声合成。

2。Wavenet

*

トランスTTS（Mel-Spectrogram）の出力はWavenetに供給され、オーディオサンプルを生成します。
SEQ2SEQモデルとは異なり、Wavenetは並列トレーニングも許可します。
論文：Wavenet：生のオーディオの生成モデル。

データセット情報

このモデルは、WMT-2014 English-German Datasetのサブセットでトレーニングされました。前処理は、モデルをトレーニングする前に実行されました。
データセット：https：//keithito.com/lj-sweech-dataset/

拡大する

追加情報

バージョン 1.0.0
タイプ AI ソースコード
更新時間 2025-08-22
サイズ 151.95KB
から Github

関連アプリ

How to download hydrax abyss.to

2024-11-11
モンスタートランスフォーマーモバイル版

2023-09-07
イエスとのテキストメッセージ中国語

2023-08-23
イエスとのテキストメッセージ

2023-08-17
イエスとテキストメッセージ中国語版

2023-08-17
テキスト・オア・ダイ

2023-07-03

おすすめ

chat.petals.dev

その他のソースコード

1.0.0
GPT Prompt Templates

その他のソースコード

1.0.0
GPTyped

その他のソースコード

GPTyped 1.0.5
ML stack

AI ソースコード

1.0.0
awesome free chatgpt

AI ソースコード

1.0.0
pywin_contextmenu

AI ソースコード

Version update
Google Dorks

その他のソースコード

1.0
shepherd

その他のソースコード

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

その他のソースコード

v1.1.0-rc-3

関連情報すべて