Speech recognition on Huawei NPU
1.0.0
用Tensorflow 1.3培訓與華為最新智能手機上的神經處理Uni兼容的張力型識別系統。
這是華為TechChallenge的代碼發布。該代碼訓練與最新華為設備上NPU兼容的語音識別網絡。為了開始,請下載LibrisPeech(http://www.openslr.org/12/)或任何其他語音數據集,並執行與Preprocess_data.ipynb中示例相似的預處理。在相應的文件夾結構中具有正確預處理的數據後,人們可以遵循huawei_compatible_model.ipynb。
由於NPU的beta特徵,我們只能使用有限的張曲流操作。我們最終使用了以下架構,因為它在我們的應用程序的第一個版本中表現出色。首先,我們應用了由時間分佈的密度層模擬的1D卷積。然後,我們A具有剩餘的連接,繞過一個方向LSTM。 filnal層是帶有軟磁性激活的時間分佈的密集層。