Treinando um sistema de reconhecimento de fala com o TensorFlow 1.3 que é compatível com o processamento neural UNI nos mais recentes smartphones da Huaweis.
Esta é a versão do código para a Huawei TechChallenge. Este código treina uma rede de reconhecimento de fala que é compatível com a NPU nos mais recentes dispositivos Huawei. Para começar, faça o download do LibriSpeech (http://www.openslr.org/12/) ou qualquer outro conjunto de dados de fala e execute pré -processamento semelhante ao exemplo em preprocess_data.ipynb. Depois de ter os dados pré -processados corretamente na estrutura da pasta correspondente, é possível seguir o huawei_compatible_model.ipynb.
Devido ao caráter beta da NPU, só conseguimos usar uma amouta limitada de operações de tensorflow. Acabamos usando a seguinte arquitetura, pois ela teve um bom desempenho para a primeira versão do nosso aplicativo. Primeiro, aplicamos a convolução 1D simulada por uma camada densa distribuída no tempo. Então, temos uma conexão residual ignorando um LSTM One Direcional. A camada filnal é o tempo distribuído camada densa com ativação do softmax.