
项目动机
个人笔记
Thorsten语音数据集
Thorsten TTS模型
Thorsten-Voice YouTube频道
公众会谈和会议演讲者
免费使用,离线工作,高质量的德国TTS语音应适用于每个项目,而无需任何许可证。
我作为一个相信一个人平等的世界的人做出了贡献。无论性别,性取向,宗教,肤色和出生地的地理符号。一个全球世界,每个人都在这个星球上的任何地方受到热烈欢迎,每个人都可以接受开放,自由的知识和教育。 ? ( ThorstenMüller )
请记住,我不是专业的语音才能。我只是一个普通的人,与世界分享他的声音。
随时在社交媒体上与我联系吗?
| 平台 | 关联 |
|---|---|
| YouTube | YouTube上的Thorstenvoice |
| ThorstenMüller在LinkedIn上 | |
| 叽叽喳喳 | Twitter上的Thorstenvoice |
| 拥抱面 | thorstenvoice在拥抱面上 |
| Instagram上的Thorstenvoice |
我所有的“ Thorsten-Voice”数据集均在Zenodo上列出并下载。 Qoutation在您的项目,产品或论文中使用Qoutation。
| 数据集 | doi链接 |
|---|---|
| Thorsten-Voice数据集2021.02(中性) | |
| Thorsten-Voice数据集2021.06(情感) | |
| Thorsten-Voice数据集2022.10(中性) | |
| Thorsten-Voice数据集2023.09(Hessisch) |
@dataset{muller_2021_5525342,
author = {Müller, Thorsten and
Kreutz, Dominik},
title = {Thorsten-Voice Dataset 2021.02},
month = sep,
year = 2021,
note = {{Please use it to make the world a better place for
whole humankind.}},
publisher = {Zenodo},
version = {3.0},
doi = {10.5281/zenodo.5525342},
url = {https://doi.org/10.5281/zenodo.5525342}
}
如PDF文档(Thorsten数据集的演变)中所述,该数据集由三个记录阶段组成。
如果要使用数据集子集,则可以在记录质量CSV文件中查看哪个文件属于哪个记录阶段。
@dataset{muller_2021_5525023,
author = {Müller, Thorsten and
Kreutz, Dominik},
title = {Thorsten-Voice Dataset 2021.06 emotional},
month = sep,
year = 2021,
note = {{Please use it to make the world a better place for
whole humankind.}},
publisher = {Zenodo},
version = {2.0},
doi = {10.5281/zenodo.5525023},
url = {https://doi.org/10.5281/zenodo.5525023}
}
我和我自己记录的所有情感记录即使短语上下文不符合这种情感,我也试图感受到并发音。示例:我在入睡前不久就宣布了昏昏欲睡的录音。
在此处收听此数据集中的一些录音。
@dataset{muller_2022_7265581,
author = {Müller, Thorsten and
Kreutz, Dominik},
title = {Thorsten-Voice Dataset 2022.10},
month = nov,
year = 2022,
publisher = {Zenodo},
version = {1.0},
doi = {10.5281/zenodo.7265581},
url = {https://doi.org/10.5281/zenodo.7265581}
}
@dataset{muller_2024_10511260,
author = {Müller, Thorsten and
Kreutz, Dominik},
title = {Thorsten-Voice Dataset 2023.09 Hessisch},
month = jan,
year = 2024,
publisher = {Zenodo},
doi = {10.5281/zenodo.10511260},
url = {https://doi.org/10.5281/zenodo.10511260}
}
庆祝? 5年的Thorsten-Voice项目(2019年10月),我在“ Huggingface”上的一个多合一数据集中以完整的采样(44KHz)发布了所有录音!显然再次获得CC0许可证!
@misc {thorsten_müller_2024,
author = { {Thorsten Müller} },
title = { TV-44kHz-Full (Revision ff427ec) },
year = 2024,
url = { https://huggingface.co/datasets/Thorsten-Voice/TV-44kHz-Full },
doi = { 10.57967/hf/3290 },
publisher = { Hugging Face }
}
基于这些OpenSource语音数据集,已经使用AI /机器学习技术对几个TT(文本到语音)模型进行了培训。
有多种由Coqui AI , Piper TTS和家庭助理项目培训和使用的德国型号。您可以在Thorsten-Voice Project网站上找到有关如何使用它们,音频样本和视频教程的更多信息。
在此处收听音频样本和安装 /用法说明(??):
此外,Silero,Monatis和Zdisket也将我的语音数据集也用于模型培训。可以在Silero Thorsten-Voice音频样本上找到更多样品和细节。有关更多详细信息,请参见此COLAB笔记本。
Zdisket制作了一种称为Tensorvox的工具,用于在Windows上设置TTS环境,并包括由Monatis训练的德国TTS模型。感谢您分享。在YouTube上看到它。
如果您喜欢我的语音贡献,并希望支持我为开放的语音技术未来的努力,那么您可以支持我,如果您愿意:
我要感谢您在这次旅程中支持我的伟大人物,以善意的话,支持和计算力量:感谢El-Tocino,ErenGölge,Gras64,Kris Gesling,Kris Gesling,Nmstoker,Othiele,Othiele,Repodiac,Repodiac,Sanjaesc,Sanjaesc,Synesthesiam。
特别感谢我亲爱的同事塞巴斯蒂安·克劳斯(Sebastian Kraus)为我提供了录音设备的支持,并成为徽标设计背后的创意策划者,当然是Dear Dominik (@domcross),因为他在这段令人惊叹的旅程中在我身边是如此。
在我的Thorsten-Voice YouTube频道上,您可以逐步找到有关OpenSource语音技术的逐步(烹饪食谱)教程。如果您有兴趣,我很乐意欢迎您在我的YouTube Community.ts **上作为新订户的新订户。
我真的很喜欢谈论OpenSource语音技术未来的重要性。如果您希望我成为会议或活动的演讲者,我很高兴使用Thorsten-Voice网站联系表与您联系。在Thorsten-Voice网站上查看我的一些演讲者参考。