Обучение системы распознавания речи с Tensorflow 1.3, которая совместима с университетом нейронной обработки на последних смартфонах Huaweis.
Это выпуск кода для Huawei Techchallenge. Этот код обучает сеть распознавания речи, которая совместима с NPU на последних устройствах Huawei. Чтобы начать, пожалуйста, скачать librispeech (http://www.openslr.org/12/) или любой другой набор данных речевых данных и выполните предварительную обработку, аналогичную примеру в preprocess_data.ipynb. После того, как один имеет правильные предварительно обработанные данные в соответствующей структуре папок, можно следовать Huawei_compatible_model.ipynb.
Благодаря бета -характеру NPU мы смогли использовать только ограниченные операции по тензодару. В итоге мы использовали следующую архитектуру, так как она работала достаточно хорошо для первой версии нашего приложения. Сначала мы применяем 1D свертки, моделируемой по времени, раздавленным по времени плотным слоем. Тогда у нас есть остаточная связь, обходящая одно направление LSTM. Фильнальный слой - это разданный плотный слой с активацией Softmax.