Speech-Agener เป็นเครื่องมือที่สร้างคำอธิบายประกอบการจัดตำแหน่งระดับเสียงจาก "Vocal Voice" และ "ข้อความภาษา"
# 调用 bin,输入语音列表和文本、输出对齐结果
cd egs/cn_phn
speech-aligner --config=conf/align.conf data/wav.scp data/text data/out.ali
# 查看输出对齐结果,包含: 文件名,音素时间起点(秒) 音素时间终点(秒) 音素
cat data/text data/out.ali
BAC009S0002W0122 而对楼市成交抑制作用最大的限购
BAC009S0002W0122
0.000 0.535 sil
0.535 0.540 $0
0.540 0.745 er_2
0.745 0.850 d
0.850 0.895 ui_4
0.895 1.305 l
1.305 1.435 ou_2
...
4.955 5.055 x
5.055 5.525 ian_4
5.525 5.745 g
5.745 5.930 ou_4
5.930 5.975 sil
.เตรียมตัว:
cmake> = 3.1
มีหนึ่งในไลบรารีคณิตศาสตร์อินเตอร์เฟส BLAS ต่อไปนี้:
ข้อเสนอแนะ: MKL
conda install mkl (MKL จะติดตั้งด้วย conda โดยค่าเริ่มต้น)conda สามารถดำเนินการได้ ( which conda มีเอาท์พุท)แอตลาส
การติดตั้ง Ubuntu: sudo apt-get install libatlas3-base
มีการแจกแจง Linux จำนวนมากและเส้นทางของไลบรารีคณิตศาสตร์นั้นแตกต่างกันและเปลี่ยนแปลงดังนั้นคุณสามารถระบุเส้นทางผ่านคำสั่งต่อไปนี้:
cmake -DBLAS_VENDORS=ATLAS -DBLAS_ATLAS_LIB_DIRS=[/path/to/atlas/lib ..ระบบ OSX (ดาร์วิน) มาพร้อมกับเฟรมเวิร์กเร่งความเร็วซึ่งสามารถปรับได้
…ห้องสมุดคณิตศาสตร์อื่น ๆ คุณสามารถดู cmake/Modules/FindBLAS.cmake เพื่อเรียนรู้เกี่ยวกับไลบรารีคณิตศาสตร์ที่รองรับ
การรวบรวม cmake
git clone .../speech-aligner.git
cd speech-aligner
mkdir build && cd build
cmake ..
make -jผลการรวบรวม
--config=egs/cn_phn/conf/align.confคำพูด-ตัวแทนเป็นเครื่องมือที่สร้างการจัดตำแหน่งระดับเสียงระหว่างคำพูดของมนุษย์และการถอดความของมัน
# call the bin,with speech and transcript as inputs
./bin/speech-aligner --config=egs/cn_phn/conf/align.conf egs/cn_phn/data/wav.scp egs/cn_phn/data/text egs/cn_phn/data/out.ali
# check the output alignment, include: filename, phoneme and its start/end time
cat egs/cn_phn/data/text egs/cn_phn/data/out.ali
BAC009S0002W0123
0.000 0.025 y
0.025 0.460 e_3
0.460 0.850 sil
0.850 0.985 ch
0.985 1.095 eng_2
...
2.655 2.735 zh
2.735 2.900 ong_1
2.900 2.960 d
2.960 3.665 ing_1
3.665 3.845 sil
.ความต้องการ
cmake> = 3.1
หนึ่งใน Blas Math Lib:
MKL (แนะนำ)
conda install mkl (MKL ติดตั้งด้วย conda โดยค่าเริ่มต้น)conda ควรอยู่ในเส้นทางของคุณแอตลาส
Ubuntu: sudo apt-get install libatlas3-base
เมื่อ CMake อาจไม่พบ Atlas ของคุณโดยอัตโนมัติดังนั้นคุณต้องตั้งค่าเส้นทาง Math Lib ตามด้านล่าง:
cmake -DBLAS_VENDORS=ATLAS -DBLAS_ATLAS_LIB_DIRS=[/path/to/atlas/lib ..Accelerate Framework (ไม่จำเป็นต้องทำอะไรเพื่อ "MacOS/Darwin")
-
cmake
git clone .../speech-aligner.git
cd speech-aligner
mkdir build && cd build
cmake ..
make -jผลลัพธ์