项目:零
- 位于卡尔迪的韩国ASR开源项目
- 立即外食谱(https://github.com/kaldi-asr/kaldi/tree/master/master/egs/zeroth_korean/s5)
- 许可证:Apache 2.0
- 论坛:https://groups.google.com/forum/#!forum/zeroth-help
Zeroth是使用Kaldi工具包实施的韩国语音识别的开源项目。
该项目是作为Atlas Labs(https://www.atlaslabs.ai)语言AI平台的一部分开发的,该平台使企业能够在其B2C通信中添加智能。
通过介绍官方的韩国卡尔迪食谱,零项目旨在使韩国言语认可更广泛地访问所有人。
正如Zeroth的名称(或0th)所暗示的那样,该项目的目的是成为起点和基础作品,任何人都可以使用语音识别来构建新产品和服务。
我们希望您发现这个项目有用,并欢迎任何讨论或共同努力的机会。
联系人:Lucas Jo([email protected])
特别感谢
- Zeroth是在[GridSpace Inc.](https://www.gridspace.com)上与Wonkyum Lee([email protected])合作开发的。
提到的链接
- [openslr](http://www.openslr.org/40/)
- [数据科学研讨会](http://www.fastcampus.co.kr/data_camp_lab/) @ fastcampus
- 研讨会 @ kmobile
- [访谈](http://blog.naver.com/fastcampus/221181060609)与FastCampus
- [深度学习 - 语音识别营](http://www.fastcampus.co.kr/data_camp_dsr/) @ fastcampus
0。概述

1。音频数据
- 2018年7月16日:95.7小时(46,347个话语,181位发言人,27,330 Uniq。句子)
- 2018年4月9日:76.6小时(35,139个话语,137个发言人,16,472个Uniq。句子)
- 2018年2月3日:51.6小时抄录的韩国音频用于培训数据(22,263次言论,105位发言人,3000个句子)
- 许可证:[CC BY 4.0](https://creativecommons.org/licenses/by/4.0/)
- 现在可以在OpenSLR上获得51.6小时的音频和LM数据
- Morecoin的音频众包正在增长。 70小时的开源音频数据库将在2018年4月左右开放。您可以通过语音录音应用捐赠您
- [Morecoin(Android)](https://play.google.com/store/apps/details?id=com.goodatlas.morecoin)。
- [Morecoin(IOX)](https://apps.apple.com/ph/app/morecoin/id1351621392?ign-mpt=UO%3D2)
我们提供了一个语音录制应用程序[Morecoin(Android)](https://play.google.com/store/store/papps/details?id=com.goodatlas.morecoin),您可以参与构建我们的开放量数据的韩国培训数据库。
2。要求
- [要求]运行零项目所需的包装说明:https://github.com/goodatlas/zeroth/wiki/requirements)
- [需求2]其他软件包执行语言模型和语音词典的代码:( https://github.com/goodatlas/zeroth/wiki/requirement-2)
声学模型
最新的Kaldi食谱应用于Zeroth的声学模型:
- TDNN(分解) / TDNN + LSTM / TDNN + OPGRU
- 链模型
- 回响语音的数据增强
语言模型和词典
零语言模型和语音词典使用端到端数据驱动的方法。对我们的开源音频数据库的任何贡献都将自动纳入最新的语言模型和语音词典中。
创建自定义语言模型和语音词典:[S5/data/local/lm/readme.md](https://github.com/goodatlas/zeroth/zeroth/blob/master/master/s5/data/data/local/local/lm/readme.md)。
语料库(语料库)
- 训练句子:109,037,699
- 测试句子:12,115,208
- 总计:121,152,907
语音词典
- 唯一单词:30,064,143
- 频率最高的独特单词:8,069,252
- 独特的词素:465,253
- 语音词典的大小考虑发音多样性:686,839
语言模型
- 困惑测试3-gram:ppl = 221.2969(12,115,208句,194,940,635个单词,0 OOV)
- 困惑测试4-gram:ppl = 187.2058(12,115,208句,194,940,635个单词,0 OOV)
项目:零
- 칼디를칼디를구축하는한국어음성인식
- 이제(https://github.com/kaldi-asr/kaldi/tree/master/master/egs/zeroth_korean/s5)
- 许可证:Apache 2.0
- 포럼:https://groups.google.com/forum/#!forum/zeroth-help
Zeroth프로젝트는kaldi开源工具kit을을음성인식기를입니다프로젝트입니다。 이기업이ai를를서비스에추가하는데데(주)아틀라스가이드의语言ai플랫폼플랫폼일부로서일부로서。 kaldi官方食谱에한국어소개하는것을,많은사람들의통해사용할수있는만들어나갈수있도록하는프로젝트입니다것을목표로하는목표로하는목표로하는목표로하는목표로하는。 제로스라는제로스라는제로스라는0-th,즉0번째를번째를。 이름이의미하는이음성인식기를음성인식기를위해필요한처음부터끝까지함께해보고수수있기를있기를。
联系人:Lucas Jo([email protected])
特别感谢
- GridSpace Inc.사에서사에서일하고wonkyum lee님과의共同工作。
提到的链接
- Openslr
- 데이터데이터 @ @ fastcampus
- 워크샵 @ kmobile
- FastCampus的访谈
- 딥러닝-음성인식营地 @ fastcampus
0。概述

1。音频数据
- 2018.07.16:95.7시간(46,347발화,181명,27,330문장)
- 2018.04.09:76.6시간(35,139발화,137명,16,472문장)
- 2018.02.03:51.6시간한국어(22,263발화,105명,3000문장)
- 许可证:CC由4.0
- 현재openslr에서51.6시간lm데이터를데이터를수수수。
- 모어코인을모어코인을오픈소스오디오가커지고。 4월에는1시간70시간시간받아보실수있습니다。 모어코인앱을모어코인앱을기부해주세요。
현재제로스상기와같은포함되어있습니다。 db db구축에구축에참여할(android)을을을(ios)제공하고제공하고제공하고제공하고제공하고제공하고제공하고제공하고제공하고제공하고제공하고녹음앱(ios)제공하고,해당해당제공하고,해당해당제공하고제공하고앱앱앱녹음녹음녹음녹음녹음녹음녹음앱앱앱앱앱녹음녹음녹음녹음녹음앱앱앱앱녹음앱녹음 sudmential은발급된은시간시간동안유효합니다유효합니다。 더자세한자세한aws-temporary-Credential페이지를페이지를바랍니다
2。要求
- 要求要求위키위키위키참조하시기페이지를참조하시기참조하시기참조하시기바랍니다。
- 언어모델과언어모델과구현하는코드를직접실행하기실행하기실행하기실행하기직접위키위키위키패키지를설치하시기설치하시기。
3。声学模型
Kaldi食谱가가가가가적용되어적용되어있습니다적용되어있습니다
- TDNN(分解) / TDNN + LSTM / TDNN + OPGRU
- 链模型
- 回响语音的数据增强
4。语言模型和词典
数据驱动的방식으로방식으로방식으로방식으로만들어집니다。 아래는aws-temporary-Credential을을경우함께자동으로언어모델과발음사전의발음사전의발음사전의。 개인적으로개인적으로특화된발음사전을만들고자하는경우에는세부적인
s5/data/local/lm/readme.md에기술되어참조하시기。
말뭉치(语料库)
- 훈련된문장의:109,037,699
- 테스트:12,115,208
- 전:121,152,907
발음사전(词典)
- 고유한고유한:30,064,143
- 98%빈도빈도보이는고유한단어의단어의:8,069,252
- 数据驱动방식으로방식으로고유한:465,253
- 발음다양성을고려한:686,839
언어모델(语言模型)
- 困惑测试3-gram:ppl = 221.2969(12,115,208句,194,940,635个单词,0 OOV)
- 困惑测试4-gram:ppl = 187.2058(12,115,208句,194,940,635个单词,0 OOV)