Speech recognition on Huawei NPU
1.0.0
Huaweis 최신 스마트 폰의 Neural Processing Uni와 호환되는 Tensorflow 1.3으로 음성 인식 시스템을 교육합니다.
이것은 Huawei TechChallenge의 코드 릴리스입니다. 이 코드는 최신 화웨이 장치의 NPU와 호환되는 음성 인식 네트워크를 훈련시킵니다. 시작하려면 LibrisPeech (http://www.openslr.org/12/) 또는 기타 음성 데이터 세트를 다운로드하고 preprocess_data.ipynb의 예와 유사한 전처리를 수행하십시오. 해당 폴더 구조에 올바르게 전처리 된 데이터가 있으면 huawei_compatible_model.ipynb를 따라갈 수 있습니다.
NPU의 베타 문자로 인해 우리는 제한된 텐서 플로우 작업 만 사용할 수있었습니다. 우리는 앱의 첫 번째 버전에 대해 충분히 성능을 발휘할 때 다음 아키텍처를 사용했습니다. 먼저 시간 분포 밀도 층으로 시뮬레이션 된 1D 컨볼 루션을 적용합니다. 그런 다음 우리는 하나의 방향 LSTM을 우회하는 잔류 연결이 있습니다. Filnal 층은 SoftMax 활성화를 갖는 시간 분포 밀도 층이다.