Thorsten Voice下载 - Thorsten Voice源代码下载

Thorsten Voice

Ai源码

1.0.0

下载

Thorsten-Voice徽标

项目动机
个人笔记
Thorsten语音数据集
- Thorsten-Voice数据集2021.02（中性）
- Thorsten-Voice数据集2021.06（情感）
- Thorsten-Voice数据集2022.10（中性）
- Thorsten-Voice数据集2023.09（Hessisch）
- Thorsten-Voice数据集完整44KHz
Thorsten TTS模型
Thorsten-Voice YouTube频道
公众会谈和会议演讲者

Thorsten-Voice项目的动机

免费使用，离线工作，高质量的德国TTS语音应适用于每个项目，而无需任何许可证。

索斯滕·穆勒（ThorstenMüller）的个人话语

我作为一个相信一个人平等的世界的人做出了贡献。无论性别，性取向，宗教，肤色和出生地的地理符号。一个全球世界，每个人都在这个星球上的任何地方受到热烈欢迎，每个人都可以接受开放，自由的知识和教育。？（ ThorstenMüller ）

请记住，我不是专业的语音才能。我只是一个普通的人，与世界分享他的声音。

社交媒体

随时在社交媒体上与我联系吗？

平台	关联
YouTube	YouTube上的Thorstenvoice
LinkedIn	ThorstenMüller在LinkedIn上
叽叽喳喳	Twitter上的Thorstenvoice
拥抱面	thorstenvoice在拥抱面上
Instagram	Instagram上的Thorstenvoice

语音数据

我所有的“ Thorsten-Voice”数据集均在Zenodo上列出并下载。 Qoutation在您的项目，产品或论文中使用Qoutation。

数据集	doi链接
Thorsten-Voice数据集2021.02（中性）
Thorsten-Voice数据集2021.06（情感）
Thorsten-Voice数据集2022.10（中性）
Thorsten-Voice数据集2023.09（Hessisch）

Thorsten-Voice数据集2021.02（中性）

 @dataset{muller_2021_5525342,
  author       = {Müller, Thorsten and
                  Kreutz, Dominik},
  title        = {Thorsten-Voice Dataset 2021.02},
  month        = sep,
  year         = 2021,
  note         = {{Please use it to make the world a better place for 
                   whole humankind.}},
  publisher    = {Zenodo},
  version      = {3.0},
  doi          = {10.5281/zenodo.5525342},
  url          = {https://doi.org/10.5281/zenodo.5525342}
}

数据集摘要

由ThorstenMüller录制
由Dominik Kreutz优化
ljspeech文件和目录结构
22.668记录的短语（ WAV文件）
超过23小时的纯音频
采样22.050Hz
单核细胞增多症
标准化为-24dB
短语长度（最小 / avg / max）：2/52/180炭
开始/结束时没有沉默
AVG口语每秒：14
带问号的句子：2.780
带有感叹号的句子：1.840

数据集的演变

如PDF文档（Thorsten数据集的演变）中所述，该数据集由三个记录阶段组成。

阶段1 ：用便宜的USB麦克风（低质量）录制
阶段2 ：用良好的麦克风记录（质量高）
第3阶段：以相同的麦克风相同但更长的短语（> 100个字符）（质量高）记录

如果要使用数据集子集，则可以在记录质量CSV文件中查看哪个文件属于哪个记录阶段。

Thorsten-Voice数据集2021.06（情感）

 @dataset{muller_2021_5525023,
  author       = {Müller, Thorsten and
                  Kreutz, Dominik},
  title        = {Thorsten-Voice Dataset 2021.06 emotional},
  month        = sep,
  year         = 2021,
  note         = {{Please use it to make the world a better place for 
                   whole humankind.}},
  publisher    = {Zenodo},
  version      = {2.0},
  doi          = {10.5281/zenodo.5525023},
  url          = {https://doi.org/10.5281/zenodo.5525023}
}

我和我自己记录的所有情感记录即使短语上下文不符合这种情感，我也试图感受到并发音。示例：我在入睡前不久就宣布了昏昏欲睡的录音。

数据集摘要

由ThorstenMüller录制
由Dominik Kreutz优化
300句 * 8情绪= 2.400录音
单核细胞增多症
采样22.050Hz
标准化为-24dB
开始/结束时没有沉默
句子长度：59-148个字符

Thorsten-Voice数据集2022.10（中性）

在此处收听此数据集中的一些录音。

 @dataset{muller_2022_7265581,
  author       = {Müller, Thorsten and
                  Kreutz, Dominik},
  title        = {Thorsten-Voice Dataset 2022.10},
  month        = nov,
  year         = 2022,
  publisher    = {Zenodo},
  version      = {1.0},
  doi          = {10.5281/zenodo.7265581},
  url          = {https://doi.org/10.5281/zenodo.7265581}
}

Thorsten-Voice数据集2023.09（Hessisch）

 @dataset{muller_2024_10511260,
  author       = {Müller, Thorsten and
                  Kreutz, Dominik},
  title        = {Thorsten-Voice Dataset 2023.09 Hessisch},
  month        = jan,
  year         = 2024,
  publisher    = {Zenodo},
  doi          = {10.5281/zenodo.10511260},
  url          = {https://doi.org/10.5281/zenodo.10511260}
}

Thorsten-Voice数据集完整44KHz

庆祝？ 5年的Thorsten-Voice项目（2019年10月），我在“ Huggingface”上的一个多合一数据集中以完整的采样（44KHz）发布了所有录音！显然再次获得CC0许可证！

https://huggingface.co/datasets/thorsten-voice/tv-44khz-full

 @misc {thorsten_müller_2024,
    author       = { {Thorsten Müller} },
    title        = { TV-44kHz-Full (Revision ff427ec) },
    year         = 2024,
    url          = { https://huggingface.co/datasets/Thorsten-Voice/TV-44kHz-Full },
    doi          = { 10.57967/hf/3290 },
    publisher    = { Hugging Face }
}

TTS模型

基于这些OpenSource语音数据集，已经使用AI /机器学习技术对几个TT（文本到语音）模型进行了培训。

有多种由Coqui AI ， Piper TTS和家庭助理项目培训和使用的德国型号。您可以在Thorsten-Voice Project网站上找到有关如何使用它们，音频样本和视频教程的更多信息。

在此处收听音频样本和安装 /用法说明（??）：

中性TT
情感TT
Hessisches tts
Smarthome /家庭助理

此外，Silero，Monatis和Zdisket也将我的语音数据集也用于模型培训。可以在Silero Thorsten-Voice音频样本上找到更多样品和细节。有关更多详细信息，请参见此COLAB笔记本。

Zdisket制作了一种称为Tensorvox的工具，用于在Windows上设置TTS环境，并包括由Monatis训练的德国TTS模型。感谢您分享。在YouTube上看到它。

支持和谢谢

如果您喜欢我的语音贡献，并希望支持我为开放的语音技术未来的努力，那么您可以支持我，如果您愿意：

订阅并分享我的Thorsten-Voice YouTube频道，然后在我的社交媒体资料上关注我
使用KO-FI或GitHub赞助商给我买一杯茶

我要感谢您在这次旅程中支持我的伟大人物，以善意的话，支持和计算力量：感谢El-Tocino，ErenGölge，Gras64，Kris Gesling，Kris Gesling，Nmstoker，Othiele，Othiele，Repodiac，Repodiac，Sanjaesc，Sanjaesc，Synesthesiam。

特别感谢我亲爱的同事塞巴斯蒂安·克劳斯（Sebastian Kraus）为我提供了录音设备的支持，并成为徽标设计背后的创意策划者，当然是Dear Dominik （@domcross），因为他在这段令人惊叹的旅程中在我身边是如此。