speech aligner
1.0.0
Speech-Aligner는 "Vocal Voice"및 "언어 텍스트"에서 음소 수준의 시간 정렬 주석을 생성하는 도구입니다.
# 调用 bin,输入语音列表和文本、输出对齐结果
cd egs/cn_phn
speech-aligner --config=conf/align.conf data/wav.scp data/text data/out.ali
# 查看输出对齐结果,包含: 文件名,音素时间起点(秒) 音素时间终点(秒) 音素
cat data/text data/out.ali
BAC009S0002W0122 而对楼市成交抑制作用最大的限购
BAC009S0002W0122
0.000 0.535 sil
0.535 0.540 $0
0.540 0.745 er_2
0.745 0.850 d
0.850 0.895 ui_4
0.895 1.305 l
1.305 1.435 ou_2
...
4.955 5.055 x
5.055 5.525 ian_4
5.525 5.745 g
5.745 5.930 ou_4
5.930 5.975 sil
.준비하다:
cmake> = 3.1
다음 BLAS 인터페이스 수학 라이브러리 중 하나가 있습니다.
제안 : MKL
conda install mkl 설치하십시오 (MKL은 기본적으로 Conda와 함께 설치됩니다)conda 실행 가능한지 확인하십시오 ( which conda 출력이 있습니다)아틀라스
우분투 설치 : sudo apt-get install libatlas3-base
많은 Linux 분포가 있으며 수학 라이브러리의 경로는 다르고 변경되므로 다음 명령을 통해 경로를 지정할 수 있습니다.
cmake -DBLAS_VENDORS=ATLAS -DBLAS_ATLAS_LIB_DIRS=[/path/to/atlas/lib ..OSX System (Darwin)은 Accelerate 프레임 워크와 함께 제공되며 조정할 수 있습니다.
… 기타 수학 라이브러리, cmake/Modules/FindBLAS.cmake 보고 지원되는 수학 라이브러리에 대해 알아볼 수 있습니다.
cmake 컴파일
git clone .../speech-aligner.git
cd speech-aligner
mkdir build && cd build
cmake ..
make -j컴파일 결과
--config=egs/cn_phn/conf/align.conf 지원합니다Speech-Aligner는 인간 음성과 전사 사이의 음소 수준 정렬을 생성하는 도구입니다.
# call the bin,with speech and transcript as inputs
./bin/speech-aligner --config=egs/cn_phn/conf/align.conf egs/cn_phn/data/wav.scp egs/cn_phn/data/text egs/cn_phn/data/out.ali
# check the output alignment, include: filename, phoneme and its start/end time
cat egs/cn_phn/data/text egs/cn_phn/data/out.ali
BAC009S0002W0123
0.000 0.025 y
0.025 0.460 e_3
0.460 0.850 sil
0.850 0.985 ch
0.985 1.095 eng_2
...
2.655 2.735 zh
2.735 2.900 ong_1
2.900 2.960 d
2.960 3.665 ing_1
3.665 3.845 sil
.요구 사항
cmake> = 3.1
BLAS 수학 lib 중 하나 :
MKL (권장)
conda install mkl (MKL은 기본적으로 Conda로 설치됩니다).conda 당신의 길에 있어야합니다아틀라스
우분투 : sudo apt-get install libatlas3-base
cmake가있을 때는 Atlas를 자동으로 찾을 수 없으므로 다음과 같이 수학 lib 경로를 설정해야합니다.
cmake -DBLAS_VENDORS=ATLAS -DBLAS_ATLAS_LIB_DIRS=[/path/to/atlas/lib ..프레임 워크 가속화 ( "MacOS/Darwin"을 위해 아무것도 할 필요가 없습니다)
...
cmake
git clone .../speech-aligner.git
cd speech-aligner
mkdir build && cd build
cmake ..
make -j결과