使用DeepSpeech的训练语音识别模型的速成课程。
从这里开始。本节将设定您对DeepSpeech Playbook可以实现的期望,以及您需要开始训练自己的语音识别模型所需的先决条件。
一旦知道了DeepSpeech Playbook可以实现的目标,本节就可以概述DeepSpeech本身,其组件部分以及与过去可能使用的其他语音识别引擎的不同之处。
在训练模型之前,您需要收集和格式化数据库。本节概述了DeepSpeech所需的数据格式,并详细介绍了从共同语音中准备数据集的示例。
如果您正在训练使用其他字母对英语的模型,例如具有变节标记的语言,则需要修改alphabet.txt文件。
了解得分手的工作,以及如何建立自己的工作。
了解DeepSpeech的声学模型和语言模型之间的差异,以及它们如何结合以提供端到端的语音识别。
本节将带您浏览构建Docker图像,并在具有持久存储的Docker容器中产生DeepSpeech。这种方法避免了tensorflow等依赖性的复杂性。
一旦您设定了培训数据,并建立了培训环境,本节将向您展示如何培训模型,并为克服常见的陷阱提供指导。
一旦训练了模型,您将需要验证它是否适用于其设计的上下文。本节将带您完成此过程。
经过培训和测试后,您的模型就会部署。本节概述了如何部署模型。
本节涵盖了可以将深层语应用于真实世界问题的特定用例,例如转录,关键字搜索和语音控制的应用程序。
了解如何为自己的深层叉子设置连续集成(CI)。旨在用于将DeepSpeech用于自己的特定用例的开发人员。
Howevever对机器学习和深度学习概念的了解将有助于您在使用DeepSpeech的培训语音识别模型方面的努力。
在这里,我们已经链接到您可能会发现有用的几个资源;它们按照我们建议阅读的顺序列出。
Digital Ocean的入门机器学习教程提供了不同类型的机器学习的概述。本教程中的图是解释关键概念的好方法。
Google的机器学习速效课程对机器学习的主要概念进行了轻柔的介绍,包括梯度下降,学习率,培训,测试和验证集以及过度拟合。
如果机器学习是引发您兴趣的东西,那么您可以享受MIT Open Learning图书馆对机器学习课程的介绍,13周的大学课程涵盖了知名度,神经网络,支持向量机和卷积神经网络。
您可以通过GitHub问题提供帮助,使DeepSpeech Playbook更好
请尝试这些说明,特别是用于在Linux的多个发行版上构建Docker映像并运行Docker容器,以便我们可以识别角落案例。
请贡献您的隐性知识- 例如:
请确定文本中的错误 - 有很多眼睛,虫子很浅:-)