Краш курс по тренировочной моделям распознавания речи с использованием Deepspeech.
Начните здесь. Этот раздел установит ваши ожидания в отношении того, чего вы можете достичь с помощью пьесы Deepspeech, и о предпосылках, которые вам необходимы, чтобы начать обучать ваши собственные модели распознавания речи.
Как только вы узнаете, чего вы можете достичь с помощью пьесы Deepspeech, в этом разделе представлен обзор самого Deepspeech, его компонентных частей и того, как он отличается от других двигателей распознавания речи, которые вы, возможно, использовали в прошлом.
Прежде чем вы сможете тренировать модель, вам нужно будет собирать и отформатировать свой корпус данных. В этом разделе представлен обзор формата данных, необходимого для Deepspeech, и проходит пример при подготовке набора данных из Common Voice.
Если вы тренируете модель, которая использует другой алфавит для английского языка, например, язык с диаклитическими оценками, вам необходимо будет изменить файл alphabet.txt .
Узнайте, что делает бомбардир, и как вы можете построить свой собственный.
Узнайте о различиях между акустической моделью Deepspeech и моделью языка , а также о том, как они объединяются, чтобы обеспечить распознавание речи с конечным до конца.
Этот раздел проходит через создание изображения Docker, и нерестится в глупости в контейнере Docker с постоянным хранилищем. Этот подход позволяет избежать сложностей зависимостей, таких как tensorflow .
После того, как вы отформатированы ваши учебные данные, и ваша учебная среда создана, этот раздел покажет вам, как обучить модель, и предоставит руководство по преодолению общих ловушек.
После того, как вы обучили модель, вам нужно будет подтвердить, что она работает для контекста, для которого он был разработан. Этот раздел проводит вас через этот процесс.
После обучения и проверки ваша модель развернута. В этом разделе представлен обзор того, как вы можете развернуть свою модель.
В этом разделе охватывают конкретные варианты использования, когда DeepSpeechEght может быть применен к проблемам реального мира, таких как транскрипция, поиск ключевых слов и приложения, контролируемые голосом.
Узнайте, как установить непрерывную интеграцию (CI) для своей собственной вилки Deepspeech. Предназначен для разработчиков, которые используют Deepspeechech для своих собственных конкретных вариантов использования.
Предоставление введения в машинное обучение выходит за рамки этого пьесы, Howevever понимает машинное обучение и концепции глубокого обучения, поможет вашим усилиям по обучению моделей распознавания речи с Deepspeech.
Здесь мы связались с несколькими ресурсами, которые вы можете найти полезными; Они перечислены в порядке, в котором мы рекомендуем прочитать их.
Вводной учебник Digital Ocean по машинному обучению содержит обзор различных типов машинного обучения. Диаграммы в этом уроке - отличный способ объяснить ключевые понятия.
Курс Crash Machine Learning Google обеспечивает мягкое введение в основные концепции машинного обучения, включая градиентный спуск , скорость обучения , обучение, наборы тестирования и валидации и переосмысление .
Если машинное обучение-это то, что вызывает ваш интерес, то вы можете насладиться введением библиотеки MIT открытого обучения в курс машинного обучения, 13-недельный курс на уровне колледжа, охватывающий персептроны, нейронные сети, поддержку векторных машин и сверточные нейронные сети.
Вы можете помочь сделать книгу Deepspeech Playing еще лучше, предоставив через проблему GitHub
Пожалуйста, попробуйте эти инструкции , особенно для создания изображения Docker и запуска контейнера Docker, на нескольких распределениях Linux, чтобы мы могли идентифицировать угловые чехлы.
Пожалуйста, внесите свои молчаливые знания - например:
Пожалуйста, определите ошибки в тексте - со многими глазами, ошибки мелкие :-)