Un cours intensif sur la formation des modèles de reconnaissance vocale à l'aide de DeepSpeech.
Commencez ici. Cette section définira vos attentes sur ce que vous pouvez réaliser avec le livre de jeu DeepSpeech et les conditions préalables dont vous devrez commencer à former vos propres modèles de reconnaissance vocale.
Une fois que vous savez ce que vous pouvez réaliser avec le livre de jeu DeepSpeech, cette section fournit un aperçu de DeepSpeech lui-même, de ses composants et de la façon dont il diffère des autres moteurs de reconnaissance vocale que vous avez peut-être utilisés dans le passé.
Avant de pouvoir former un modèle, vous devrez collecter et formater votre corpus de données. Cette section fournit un aperçu du format de données requis pour DeepSpeech et parcourt un exemple de préparation d'un ensemble de données à partir de la voix commune.
Si vous formez un modèle qui utilise un alphabet différent en anglais, par exemple une langue avec des marques diacritiques, vous devrez modifier le fichier alphabet.txt .
Apprenez ce que fait le buteur et comment vous pouvez vous procéder à la construction de la vôtre.
Découvrez les différences entre le modèle acoustique de DeepSpeech et le modèle de langue et comment ils se combinent pour fournir la reconnaissance de la parole de bout en bout.
Cette section vous guide à travers la construction d'une image Docker et engendrant DeepSpeech dans un conteneur Docker avec un stockage persistant. Cette approche évite les complexités des dépendances telles que tensorflow .
Une fois que vous avez formaté vos données de formation et votre environnement de formation établi, cette section vous montrera comment former un modèle et fournir des conseils pour surmonter les pièges communs.
Une fois que vous avez formé un modèle, vous devrez valider qu'il fonctionne pour le contexte pour lequel il a été conçu. Cette section vous guide à travers ce processus.
Une fois formé et testé, votre modèle est déployé. Cette section donne un aperçu de la façon dont vous pouvez déployer votre modèle.
Cette section couvre des cas d'utilisation spécifiques où DeepSpeech peut être appliqué à des problèmes du monde réel, tels que la transcription, la recherche de mots clés et les applications contrôlées par voix.
Apprenez à mettre en place une intégration continue (CI) pour votre propre fourche de profondeur. Destinés aux développeurs qui utilisent DeepSpeech pour leurs propres cas d'utilisation spécifiques.
Fournir une introduction à l'apprentissage automatique dépasse le champ d'application de ce manuel, Howevever ayant une compréhension de l'apprentissage automatique et des concepts d'apprentissage en profondeur aidera vos efforts à former des modèles de reconnaissance vocale avec DeepSpeech.
Ici, nous avons lié à plusieurs ressources que vous pourriez trouver utiles; Ils sont répertoriés dans l'ordre dans lequel nous vous recommandons de les lire.
Le tutoriel d'introduction à l'apprentissage automatique de Digital Ocean offre un aperçu des différents types d'apprentissage automatique. Les diagrammes de ce tutoriel sont un excellent moyen d'expliquer les concepts clés.
Le cours accidentel de l'apprentissage automatique de Google offre une introduction douce aux principaux concepts de l'apprentissage automatique, notamment la descente de gradient , le taux d'apprentissage , la formation, le test et les ensembles de validation et le sur-ajustement .
Si l'apprentissage automatique est quelque chose qui suscite votre intérêt, vous pouvez profiter du cours d'introduction à l'apprentissage automatique de la bibliothèque du MIT Open Learning, un cours de niveau collégial de 13 semaines couvrant les perceptrons, les réseaux de neurones, les machines vectorielles de soutien et les réseaux neuronaux convolutionnaux.
Vous pouvez aider à rendre le livre de jeu DeepSpeech encore mieux en fournissant via un problème GitHub
Veuillez essayer ces instructions , en particulier pour la création d'une image Docker et l'exécution d'un conteneur Docker, sur plusieurs distributions de Linux afin que nous puissions identifier les cas d'angle.
Veuillez contribuer vos connaissances tacites - comme:
Veuillez identifier les erreurs dans le texte - avec de nombreux yeux, les bugs sont superficiels :-)