Ein Crash -Kurs zu Trainingsspracherkennungsmodellen mit DeepSpeech.
Beginnen Sie hier. In diesem Abschnitt werden Ihre Erwartungen an das festgelegt, was Sie mit dem Deepspeech -Spielbuch erreichen können, und die Voraussetzungen, die Sie benötigen, um Ihre eigenen Spracherkennungsmodelle zu trainieren.
Sobald Sie wissen, was Sie mit dem Deepspeech -Playbook erreichen können, bietet dieser Abschnitt einen Überblick über Deepspeech selbst, seine Komponententeile und wie es sich von anderen Spracherkennungsmotoren unterscheidet, die Sie in der Vergangenheit möglicherweise verwendet haben.
Bevor Sie ein Modell trainieren können, müssen Sie Ihr Datenkorpus sammeln und formatieren. Dieser Abschnitt bietet einen Überblick über das für Deepspeech erforderliche Datenformat und geht ein Beispiel bei der Vorbereitung eines Datensatzes aus der gemeinsamen Stimme.
Wenn Sie ein Modell trainieren, das ein anderes Alphabet als Englisch verwendet, beispielsweise eine Sprache mit diakritischen Markierungen, müssen Sie die Datei alphabet.txt ändern.
Erfahren Sie, was der Torschütze tut und wie Sie Ihre eigenen bauen können.
Erfahren Sie mehr über die Unterschiede zwischen dem akustischen Modell von Deepspeech und dem Sprachmodell und dem Kombination, um eine Spracherkennung von End -to -End -Sprach zu erzielen.
Dieser Abschnitt führt Sie durch den Aufbau eines Docker -Images und das Laichen von DeepSpeech in einem Docker -Container mit anhaltendem Speicher. Dieser Ansatz vermeidet die Komplexität von Abhängigkeiten wie tensorflow .
Sobald Sie Ihre Trainingsdaten formatiert haben und Ihre Schulungsumgebung festgelegt haben, zeigt Ihnen dieser Abschnitt, wie Sie ein Modell trainieren und Anleitung für die Überwindung gemeinsamer Fallstricke geben.
Sobald Sie ein Modell trainiert haben, müssen Sie bestätigen, dass es für den Kontext funktioniert, für den es konzipiert wurde. Dieser Abschnitt führt Sie durch diesen Prozess.
Sobald Sie trainiert und getestet haben, wird Ihr Modell bereitgestellt. Dieser Abschnitt bietet einen Überblick darüber, wie Sie Ihr Modell bereitstellen können.
Dieser Abschnitt deckt spezifische Anwendungsfälle ab, in denen Deepspeech auf reale Probleme wie Transkription, Schlüsselwortsuche und Sprachkontrollanwendungen angewendet werden kann.
Erfahren Sie, wie Sie eine kontinuierliche Integration (CI) für Ihre eigene Deep -Speech -Gabel einrichten. Für Entwickler bestimmt, die Deepspeech für ihre eigenen spezifischen Anwendungsfälle verwenden.
Die Einführung in das maschinelle Lernen liegt außerhalb des Rahmens dieses Spielbuchs. Howevever, das ein Verständnis für maschinelles Lernen und Deep -Lern -Konzepte hat, hilft Ihre Bemühungen bei der Schulung von Spracherkennungsmodellen mit Deepspeech.
Hier haben wir mit mehreren Ressourcen verbunden, die Sie möglicherweise hilfreich finden. Sie werden in der Reihenfolge aufgeführt, in der wir sie lesen.
Das Tutorial für einführende maschinelles Lernen von Digital Ocean bietet einen Überblick über verschiedene Arten des maschinellen Lernens. Die Diagramme in diesem Tutorial sind eine großartige Möglichkeit, Schlüsselkonzepte zu erklären.
Der Crashkurs für maschinelles Lernen von Google bietet eine sanfte Einführung in die Hauptkonzepte des maschinellen Lernens, einschließlich Gradientenabstieg , Lernrate , Training, Test- und Validierungssätzen und Überanpassung .
Wenn maschinelles Lernen etwas ist, das Ihr Interesse weckt, können Sie die Einführung der MIT Open Learning Library in den Kurs für maschinelles Lernen, einen 13-wöchigen Kurs auf College-Ebene, über Perzeptrons, neuronale Netzwerke, Support Vector-Maschinen und Faltungsnetzwerke mit Faltungsverkehrsnetzen genießen.
Sie können helfen, das Deepspeech -Playbook noch besser zu machen, indem Sie über ein Github -Problem bereitstellen
Bitte versuchen Sie diese Anweisungen , insbesondere zum Erstellen eines Docker -Images und zum Ausführen eines Docker -Containers, unter mehreren Verteilungen von Linux, damit wir Eckfälle identifizieren können.
Bitte tragen Sie Ihr stillschweigendes Wissen bei, z. B.:
Bitte identifizieren Sie Fehler im Text - Mit vielen Augen sind Fehler flach :-)