使用DeepSpeech的訓練語音識別模型的速成課程。
從這裡開始。本節將設定您對DeepSpeech Playbook可以實現的期望,以及您需要開始訓練自己的語音識別模型所需的先決條件。
一旦知道了DeepSpeech Playbook可以實現的目標,本節就可以概述DeepSpeech本身,其組件部分以及與過去可能使用的其他語音識別引擎的不同之處。
在訓練模型之前,您需要收集和格式化數據庫。本節概述了DeepSpeech所需的數據格式,並詳細介紹了從共同語音中準備數據集的示例。
如果您正在訓練使用其他字母對英語的模型,例如具有變節標記的語言,則需要修改alphabet.txt文件。
了解得分手的工作,以及如何建立自己的工作。
了解DeepSpeech的聲學模型和語言模型之間的差異,以及它們如何結合以提供端到端的語音識別。
本節將帶您瀏覽構建Docker圖像,並在具有持久存儲的Docker容器中產生DeepSpeech。這種方法避免了tensorflow等依賴性的複雜性。
一旦您設定了培訓數據,並建立了培訓環境,本節將向您展示如何培訓模型,並為克服常見的陷阱提供指導。
一旦訓練了模型,您將需要驗證它是否適用於其設計的上下文。本節將帶您完成此過程。
經過培訓和測試後,您的模型就會部署。本節概述瞭如何部署模型。
本節涵蓋了可以將深層語應用於真實世界問題的特定用例,例如轉錄,關鍵字搜索和語音控制的應用程序。
了解如何為自己的深層叉子設置連續集成(CI)。旨在用於將DeepSpeech用於自己的特定用例的開發人員。
Howevever對機器學習和深度學習概念的了解將有助於您在使用DeepSpeech的培訓語音識別模型方面的努力。
在這裡,我們已經鏈接到您可能會發現有用的幾個資源;它們按照我們建議閱讀的順序列出。
Digital Ocean的入門機器學習教程提供了不同類型的機器學習的概述。本教程中的圖是解釋關鍵概念的好方法。
Google的機器學習速效課程對機器學習的主要概念進行了輕柔的介紹,包括梯度下降,學習率,培訓,測試和驗證集以及過度擬合。
如果機器學習是引發您興趣的東西,那麼您可以享受MIT Open Learning圖書館對機器學習課程的介紹,13週的大學課程涵蓋了知名度,神經網絡,支持向量機和卷積神經網絡。
您可以通過GitHub問題提供幫助,使DeepSpeech Playbook更好
請嘗試這些說明,特別是用於在Linux的多個發行版上構建Docker映像並運行Docker容器,以便我們可以識別角落案例。
請貢獻您的隱性知識- 例如:
請確定文本中的錯誤 - 有很多眼睛,蟲子很淺:-)