Speech recognition on Huawei NPU
1.0.0
Huaweis最新のスマートフォンでのニューラル処理UNIと互換性のあるTensorflow 1.3で音声認識システムをトレーニングします。
これは、Huawei TechChallengeのコードリリースです。このコードは、最新のHuaweiデバイスでNPUと互換性のある音声認識ネットワークをトレーニングします。開始するために、Librispeech(http://www.openslr.org/12/)またはその他の音声データセットをダウンロードして、preprocess_data.ipynbの例と同様の前処理を実行してください。対応するフォルダー構造に正しく前処理されたデータがあると、huawei_compatible_model.ipynbに従うことができます。
NPUのベータキャラクターにより、Tensorflow操作の限られたアムートのみを使用することができました。アプリの最初のバージョンにとって十分に機能したため、次のアーキテクチャを使用することになりました。最初に、時間分散型密度層によってシミュレートされた1D畳み込みを適用します。次に、1つの方向LSTMをバイパスする残留接続があります。フィラル層は、ソフトマックスの活性化を備えた時間分布密度層です。