Thorsten Voice下載 - Thorsten Voice源代碼下載

Thorsten Voice

Ai源碼

1.0.0

下載

Thorsten-Voice徽標

項目動機
個人筆記
Thorsten語音數據集
- Thorsten-Voice數據集2021.02（中性）
- Thorsten-Voice數據集2021.06（情感）
- Thorsten-Voice數據集2022.10（中性）
- Thorsten-Voice數據集2023.09（Hessisch）
- Thorsten-Voice數據集完整44KHz
Thorsten TTS模型
Thorsten-Voice YouTube頻道
公眾會談和會議演講者

Thorsten-Voice項目的動機

免費使用，離線工作，高質量的德國TTS語音應適用於每個項目，而無需任何許可證。

索斯滕·穆勒（ThorstenMüller）的個人話語

我作為一個相信一個人平等的世界的人做出了貢獻。無論性別，性取向，宗教，膚色和出生地的地理符號。一個全球世界，每個人都在這個星球上的任何地方受到熱烈歡迎，每個人都可以接受開放，自由的知識和教育。？（ ThorstenMüller ）

請記住，我不是專業的語音才能。我只是一個普通的人，與世界分享他的聲音。

社交媒體

隨時在社交媒體上與我聯繫嗎？

平台	關聯
Youtube	YouTube上的Thorstenvoice
LinkedIn	ThorstenMüller在LinkedIn上
嘰嘰喳喳	Twitter上的Thorstenvoice
擁抱面	thorstenvoice在擁抱面上
Instagram	Instagram上的Thorstenvoice

語音數據

我所有的“ Thorsten-Voice”數據集均在Zenodo上列出並下載。 Qoutation在您的項目，產品或論文中使用Qoutation。

數據集	doi鏈接
Thorsten-Voice數據集2021.02（中性）
Thorsten-Voice數據集2021.06（情感）
Thorsten-Voice數據集2022.10（中性）
Thorsten-Voice數據集2023.09（Hessisch）

Thorsten-Voice數據集2021.02（中性）

 @dataset{muller_2021_5525342,
  author       = {Müller, Thorsten and
                  Kreutz, Dominik},
  title        = {Thorsten-Voice Dataset 2021.02},
  month        = sep,
  year         = 2021,
  note         = {{Please use it to make the world a better place for 
                   whole humankind.}},
  publisher    = {Zenodo},
  version      = {3.0},
  doi          = {10.5281/zenodo.5525342},
  url          = {https://doi.org/10.5281/zenodo.5525342}
}

數據集摘要

由ThorstenMüller錄製
由Dominik Kreutz優化
ljspeech文件和目錄結構
22.668記錄的短語（ WAV文件）
超過23小時的純音頻
採樣22.050Hz
單核白血球增多症
標準化為-24dB
短語長度（最小 / avg / max）：2/52/180炭
開始/結束時沒有沉默
AVG口語每秒：14
帶問號的句子：2.780
帶有感嘆號的句子：1.840

數據集的演變

如PDF文檔（Thorsten數據集的演變）中所述，該數據集由三個記錄階段組成。

階段1 ：用便宜的USB麥克風（低質量）錄製
階段2 ：用良好的麥克風記錄（質量高）
第3階段：以相同的麥克風相同但更長的短語（> 100個字符）（質量高）記錄

如果要使用數據集子集，則可以在記錄質量CSV文件中查看哪個文件屬於哪個記錄階段。

Thorsten-Voice數據集2021.06（情感）

 @dataset{muller_2021_5525023,
  author       = {Müller, Thorsten and
                  Kreutz, Dominik},
  title        = {Thorsten-Voice Dataset 2021.06 emotional},
  month        = sep,
  year         = 2021,
  note         = {{Please use it to make the world a better place for 
                   whole humankind.}},
  publisher    = {Zenodo},
  version      = {2.0},
  doi          = {10.5281/zenodo.5525023},
  url          = {https://doi.org/10.5281/zenodo.5525023}
}

我和我自己記錄的所有情感記錄即使短語上下文不符合這種情感，我也試圖感受到並發音。示例：我在入睡前不久就宣布了昏昏欲睡的錄音。

數據集摘要

由ThorstenMüller錄製
由Dominik Kreutz優化
300句 * 8情緒= 2.400錄音
單核白血球增多症
採樣22.050Hz
標準化為-24dB
開始/結束時沒有沉默
句子長度：59-148個字符

Thorsten-Voice數據集2022.10（中性）

在此處收聽此數據集中的一些錄音。

 @dataset{muller_2022_7265581,
  author       = {Müller, Thorsten and
                  Kreutz, Dominik},
  title        = {Thorsten-Voice Dataset 2022.10},
  month        = nov,
  year         = 2022,
  publisher    = {Zenodo},
  version      = {1.0},
  doi          = {10.5281/zenodo.7265581},
  url          = {https://doi.org/10.5281/zenodo.7265581}
}

Thorsten-Voice數據集2023.09（Hessisch）

 @dataset{muller_2024_10511260,
  author       = {Müller, Thorsten and
                  Kreutz, Dominik},
  title        = {Thorsten-Voice Dataset 2023.09 Hessisch},
  month        = jan,
  year         = 2024,
  publisher    = {Zenodo},
  doi          = {10.5281/zenodo.10511260},
  url          = {https://doi.org/10.5281/zenodo.10511260}
}

Thorsten-Voice數據集完整44KHz

慶祝？ 5年的Thorsten-Voice項目（2019年10月），我在“ Huggingface”上的一個多合一數據集中以完整的採樣（44KHz）發布了所有錄音！顯然再次獲得CC0許可證！

https://huggingface.co/datasets/thorsten-voice/tv-44khz-full

 @misc {thorsten_müller_2024,
    author       = { {Thorsten Müller} },
    title        = { TV-44kHz-Full (Revision ff427ec) },
    year         = 2024,
    url          = { https://huggingface.co/datasets/Thorsten-Voice/TV-44kHz-Full },
    doi          = { 10.57967/hf/3290 },
    publisher    = { Hugging Face }
}

TTS模型

基於這些OpenSource語音數據集，已經使用AI /機器學習技術對幾個TT（文本到語音）模型進行了培訓。

有多種由Coqui AI ， Piper TTS和家庭助理項目培訓和使用的德國型號。您可以在Thorsten-Voice Project網站上找到有關如何使用它們，音頻樣本和視頻教程的更多信息。

在此處收聽音頻樣本和安裝 /用法說明（??）：

中性TT
情感TT
Hessisches tts
Smarthome /家庭助理

此外，Silero，Monatis和Zdisket也將我的語音數據集也用於模型培訓。可以在Silero Thorsten-Voice音頻樣本上找到更多樣品和細節。有關更多詳細信息，請參見此COLAB筆記本。

Zdisket製作了一種稱為Tensorvox的工具，用於在Windows上設置TTS環境，並包括由Monatis訓練的德國TTS模型。感謝您分享。在YouTube上看到它。

支持和謝謝

如果您喜歡我的語音貢獻，並希望支持我為開放的語音技術未來的努力，那麼您可以支持我，如果您願意：

訂閱並分享我的Thorsten-Voice YouTube頻道，然後在我的社交媒體資料上關注我
使用KO-FI或GitHub贊助商給我買一杯茶

我要感謝您在這次旅程中支持我的偉大人物，以善意的話，支持和計算力量：感謝El-Tocino，ErenGölge，Gras64，Kris Gesling，Kris Gesling，Nmstoker，Othiele，Othiele，Repodiac，Repodiac，Sanjaesc，Sanjaesc，Synesthesiam。

特別感謝我親愛的同事塞巴斯蒂安·克勞斯（Sebastian Kraus）為我提供了錄音設備的支持，並成為徽標設計背後的創意策劃者，當然是Dear Dominik （@domcross），因為他在這段令人驚嘆的旅程中在我身邊是如此。