TTSTextNormalization
1.0.0
这个存储库将我解决了Google的文本归一化挑战 - 英语的解决方案。大多数魔术发生在转换器目录中,该目录负责从输入到输出令牌的实际转换。与我的解决方案一起写了一篇论文。本文的摘要如下:
本文提出了一种解决文本到语音归一化问题的方法以及解决方案,该方法的重点是将文本从书面表达式转换为口语形式。该方法通过梯度提升决策树模型解析输入令牌,该模型将令牌分类为16种不同类型的令牌之一。然后根据预测的令牌类型对令牌进行转换,从而导致口语形式的归一化输出。进入相关的文本到语音归一化竞争后,该解决方案的准确度为99.590% ,在260支团队中或所有提交的前5%以下。
为了运行任何Python文件, data/raw文件夹必须包含来自比赛本身的原始培训和测试数据。由于竞争的条款和条件,该数据不能在此存储库上共享。
该存储库充当档案,不打算更新。
我没有为此存储库做贡献,因为它被设计为档案。
此项目已获得MIT许可证的许可 - 有关详细信息,请参见许可证文件。