tts dataset prompts下载tts dataset prompts源代码下载

中文(简体)

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

首页>编程相关>Ai源码

tts dataset prompts

Ai源码

1.0.0

下载

tts-dataset-prompts

[很大程度上被遗弃了，对不起！]

该存储库的目的是为希望克隆自己的声音的人们（例如使用Tacotron 2）成为一组体面的句子。

每组50行旨在满足以下标准：

根据cmudict（元音的不同版本，元音的不同版本），每个音素至少代表一次；元素算作单独的音素；需要两次辅音）
每个音素大致与常规语音一样频繁（除非音素在批处理中仅存在4或更少的时间）
说话时，每一行的长度大致相等（14-18个音节 +非最终标点符号）
具有上下文依赖的发音的单词（避免使用非常常见的the ）以便于处理
至少10行包含逗号
至少有10行由多个较短的句子组成（以便AI学会自然停顿）

按照相同的规则，将提供其他文本文件以提问和感叹号。它们之所以分开，是因为某些文本到语音体系结构在影响整个句子的语调的结束标点符号方面很差。按照塔尔克（Talqu）的建议，使用它们来训练单独的模型并为Mekatron服务中的某些声音（已删除）中的某些声音训练可能是有益的。

该回购使用G2P-EN库来确定音素计数，以匹配Uberduck的声音化。

其他好的提示套装

（多语言！）Microsoft CustomVoice示例脚本（并非所有提示列表都是精心设计的，例如，EN-US聊天提示仅包括 /ʒ /作为“印度尼西亚”一词的一部分）
彩虹通道和祖父通过（语音完成）
CMU北极提示列表（语音平衡，但每行只有一个句子）
Mocha-Timit（“旨在包括英语中的主要连接语音过程（例如，同化，弱形式..）”）
TIMIT（大部分是随机句子）
（多语言！）常见的语音句子（根本不是语音平衡，也很短）
ljspeech成绩单（句子片段比比皆是，我个人认为是有用的）
哈佛句子（语音平衡，但每行只有一个句子，它们都相等）
vits-fast-fi-fining uning列表（英语和中文，但句子很短，语法并不完美）

展开

附加信息

版本 1.0.0
类型 Ai源码
更新时间 2025-08-20
大小 9.45KB
来自于 Github

相关应用

ears_dataset

2024-11-14
glaucoma dataset metadata

2024-11-09
ffhq wrinkle dataset

2024-11-07
GitHub sgrebnov/cordova plugin background download

2024-11-05
F5 TTS ComfyUI

2024-11-02
语音开发英文资料(TTS使用指南Delphi版)

2009-05-28

为您推荐

chat.petals.dev

其他源码

1.0.0
GPT Prompt Templates

其他源码

1.0.0
GPTyped

其他源码

GPTyped 1.0.5
ML stack

Ai源码

1.0.0
awesome free chatgpt

Ai源码

1.0.0
pywin_contextmenu

Ai源码

Version update
Google Dorks

其他源码

1.0
shepherd

其他源码

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

其他源码

v1.1.0-rc-3

相关资讯全部