Formation d'un système de reconnaissance de la parole avec TensorFlow 1.3 qui est compatible avec l'université de traitement neuronal sur les derniers smartphones de Huaweis.
Ceci est le communiqué de code pour Huawei TechChallenge. Ce code forme un réseau de reconnaissance vocale compatible avec le NPU sur les derniers appareils Huawei. Afin de commencer, veuillez télécharger LibRispeECH (http://www.opensenslr.org/12/) ou tout autre ensemble de données vocaux et effectuer un prétraitement similaire à l'exemple de prerocess_data.ipynb. Après avoir les données correctement prétraitées dans la structure du dossier correspondant, on est capable de suivre Huawei_Compatible_Model.ipynb.
En raison du caractère bêta de NPU, nous n'avons pu utiliser qu'un amout limité d'opérations TensorFlow. Nous avons fini par utiliser l'architecture suivante car elle a suffisamment fonctionné pour la première version de notre application. Nous appliquons d'abord une convolution 1D simulée par une couche dense distribuée dans le temps. Ensuite, nous avons une connexion résiduelle en contournant un LSTM unique. La couche filnale est la couche dense distribuée en temps avec activation Softmax.