تدريب نظام التعرف على الكلام مع TensorFlow 1.3 متوافق مع المعالجة العصبية UNI على أحدث الهواتف الذكية Huaweis.
هذا هو إصدار الكود لـ Huawei TechChallenge. يدرب هذا الرمز شبكة التعرف على الكلام المتوافقة مع NPU على أحدث أجهزة Huawei. من أجل البدء ، يرجى تنزيل Librispeech (http://www.openslr.org/12/) أو أي مجموعة بيانات خطاب أخرى وإجراء المعالجة المسبقة على غرار المثال في preprocess_data.ipynb. بعد أن يكون لدى المرء البيانات المسبقة بشكل صحيح في بنية المجلد المقابلة ، يمكن للمرء متابعة Huawei_compatible_model.ipynb.
بسبب الطابع التجريبي في NPU ، تمكنا فقط من استخدام مجموعة محدودة من عمليات TensorFlow. لقد انتهى الأمر باستخدام الهندسة المعمارية التالية حيث كان أداءها جيدًا بما يكفي للإصدار الأول من تطبيقنا. أولاً ، نطبق الالتفاف 1D المحاكاة بواسطة طبقة كثيفة موزعة للوقت. ثم لدينا اتصال متبقي يتخطى LSTM اتجاه واحد. طبقة FileNal هي طبقة كثيفة موزعة الوقت مع تنشيط softmax.