
項目動機
個人筆記
Thorsten語音數據集
Thorsten TTS模型
Thorsten-Voice YouTube頻道
公眾會談和會議演講者
免費使用,離線工作,高質量的德國TTS語音應適用於每個項目,而無需任何許可證。
我作為一個相信一個人平等的世界的人做出了貢獻。無論性別,性取向,宗教,膚色和出生地的地理符號。一個全球世界,每個人都在這個星球上的任何地方受到熱烈歡迎,每個人都可以接受開放,自由的知識和教育。 ? ( ThorstenMüller )
請記住,我不是專業的語音才能。我只是一個普通的人,與世界分享他的聲音。
隨時在社交媒體上與我聯繫嗎?
| 平台 | 關聯 |
|---|---|
| Youtube | YouTube上的Thorstenvoice |
| ThorstenMüller在LinkedIn上 | |
| 嘰嘰喳喳 | Twitter上的Thorstenvoice |
| 擁抱面 | thorstenvoice在擁抱面上 |
| Instagram上的Thorstenvoice |
我所有的“ Thorsten-Voice”數據集均在Zenodo上列出並下載。 Qoutation在您的項目,產品或論文中使用Qoutation。
| 數據集 | doi鏈接 |
|---|---|
| Thorsten-Voice數據集2021.02(中性) | |
| Thorsten-Voice數據集2021.06(情感) | |
| Thorsten-Voice數據集2022.10(中性) | |
| Thorsten-Voice數據集2023.09(Hessisch) |
@dataset{muller_2021_5525342,
author = {Müller, Thorsten and
Kreutz, Dominik},
title = {Thorsten-Voice Dataset 2021.02},
month = sep,
year = 2021,
note = {{Please use it to make the world a better place for
whole humankind.}},
publisher = {Zenodo},
version = {3.0},
doi = {10.5281/zenodo.5525342},
url = {https://doi.org/10.5281/zenodo.5525342}
}
如PDF文檔(Thorsten數據集的演變)中所述,該數據集由三個記錄階段組成。
如果要使用數據集子集,則可以在記錄質量CSV文件中查看哪個文件屬於哪個記錄階段。
@dataset{muller_2021_5525023,
author = {Müller, Thorsten and
Kreutz, Dominik},
title = {Thorsten-Voice Dataset 2021.06 emotional},
month = sep,
year = 2021,
note = {{Please use it to make the world a better place for
whole humankind.}},
publisher = {Zenodo},
version = {2.0},
doi = {10.5281/zenodo.5525023},
url = {https://doi.org/10.5281/zenodo.5525023}
}
我和我自己記錄的所有情感記錄即使短語上下文不符合這種情感,我也試圖感受到並發音。示例:我在入睡前不久就宣布了昏昏欲睡的錄音。
在此處收聽此數據集中的一些錄音。
@dataset{muller_2022_7265581,
author = {Müller, Thorsten and
Kreutz, Dominik},
title = {Thorsten-Voice Dataset 2022.10},
month = nov,
year = 2022,
publisher = {Zenodo},
version = {1.0},
doi = {10.5281/zenodo.7265581},
url = {https://doi.org/10.5281/zenodo.7265581}
}
@dataset{muller_2024_10511260,
author = {Müller, Thorsten and
Kreutz, Dominik},
title = {Thorsten-Voice Dataset 2023.09 Hessisch},
month = jan,
year = 2024,
publisher = {Zenodo},
doi = {10.5281/zenodo.10511260},
url = {https://doi.org/10.5281/zenodo.10511260}
}
慶祝? 5年的Thorsten-Voice項目(2019年10月),我在“ Huggingface”上的一個多合一數據集中以完整的採樣(44KHz)發布了所有錄音!顯然再次獲得CC0許可證!
@misc {thorsten_müller_2024,
author = { {Thorsten Müller} },
title = { TV-44kHz-Full (Revision ff427ec) },
year = 2024,
url = { https://huggingface.co/datasets/Thorsten-Voice/TV-44kHz-Full },
doi = { 10.57967/hf/3290 },
publisher = { Hugging Face }
}
基於這些OpenSource語音數據集,已經使用AI /機器學習技術對幾個TT(文本到語音)模型進行了培訓。
有多種由Coqui AI , Piper TTS和家庭助理項目培訓和使用的德國型號。您可以在Thorsten-Voice Project網站上找到有關如何使用它們,音頻樣本和視頻教程的更多信息。
在此處收聽音頻樣本和安裝 /用法說明(??):
此外,Silero,Monatis和Zdisket也將我的語音數據集也用於模型培訓。可以在Silero Thorsten-Voice音頻樣本上找到更多樣品和細節。有關更多詳細信息,請參見此COLAB筆記本。
Zdisket製作了一種稱為Tensorvox的工具,用於在Windows上設置TTS環境,並包括由Monatis訓練的德國TTS模型。感謝您分享。在YouTube上看到它。
如果您喜歡我的語音貢獻,並希望支持我為開放的語音技術未來的努力,那麼您可以支持我,如果您願意:
我要感謝您在這次旅程中支持我的偉大人物,以善意的話,支持和計算力量:感謝El-Tocino,ErenGölge,Gras64,Kris Gesling,Kris Gesling,Nmstoker,Othiele,Othiele,Repodiac,Repodiac,Sanjaesc,Sanjaesc,Synesthesiam。
特別感謝我親愛的同事塞巴斯蒂安·克勞斯(Sebastian Kraus)為我提供了錄音設備的支持,並成為徽標設計背後的創意策劃者,當然是Dear Dominik (@domcross),因為他在這段令人驚嘆的旅程中在我身邊是如此。
在我的Thorsten-Voice YouTube頻道上,您可以逐步找到有關OpenSource語音技術的逐步(烹飪食譜)教程。如果您有興趣,我很樂意歡迎您在我的YouTube Community.ts **上作為新訂戶的新訂戶。
我真的很喜歡談論OpenSource語音技術未來的重要性。如果您希望我成為會議或活動的演講者,我很高興使用Thorsten-Voice網站聯繫表與您聯繫。在Thorsten-Voice網站上查看我的一些演講者參考。