ROADMAP เอกสาร | เอกสาร รันไทม์ แบบจำลองที่ผ่านการฝึกอบรม Huggingface | ถาม Wenet Guru
เรา แบ่งปัน สุทธิ ร่วมกัน
pip install git+https://github.com/wenet-e2e/wenet.git การใช้บรรทัดคำสั่ง (ใช้ -h สำหรับพารามิเตอร์):
wenet --language chinese audio.wavการใช้โปรแกรม Python :
import wenet
model = wenet . load_model ( 'chinese' )
result = model . transcribe ( 'audio.wav' )
print ( result [ 'text' ])โปรดอ้างอิงการใช้ Python สำหรับบรรทัดคำสั่งเพิ่มเติมและการใช้โปรแกรม Python
git clone https://github.com/wenet-e2e/wenet.gitconda create -n wenet python=3.10
conda activate wenet
conda install conda-forge::soxpip install torch==2.2.2+cu121 torchaudio==2.2.2+cu121 -f https://download.pytorch.org/whl/torch_stable.htmlติดตั้ง CANN: โปรดไปที่ลิงค์นี้เพื่อติดตั้ง Cann Toolkit และ Kernels
ติดตั้ง Wenet ด้วยการพึ่งพา Torch-NPU:
pip install -e .[torch-npu]| ความต้องการ | ขั้นต่ำสุด | แนะนำ |
|---|---|---|
| การทำไม่ได้ | 8.0.rc2.alpha003 | ล่าสุด |
| คบเพลิง | 2.1.0 | 2.2.0 |
| Torch-NPU | 2.1.0 | 2.2.0 |
| ทอร์ชูดิโอ | 2.1.0 | 2.2.0 |
| ความเร็วลึก | 0.13.2 | ล่าสุด |
pip install -r requirements.txt
pre-commit install # for clean and tidy code # If you encounter sox compatibility issues
RuntimeError: set_buffer_size requires sox extension which is not available.
# ubuntu
sudo apt-get install sox libsox-dev
# centos
sudo yum install sox sox-devel
# conda env
conda install conda-forge::soxสร้างสำหรับการปรับใช้
เป็นทางเลือกหากคุณต้องการใช้ X86 Runtime หรือ Language Model (LM) คุณต้องสร้างรันไทม์ดังนี้ มิฉะนั้นคุณสามารถเพิกเฉยต่อขั้นตอนนี้ได้
# runtime build requires cmake 3.14 or above
cd runtime/libtorch
mkdir build && cd build && cmake -DGRAPH_TOOLS=ON .. && cmake --build .โปรดดูเอกสารสำหรับการสร้างรันไทม์บนแพลตฟอร์มและระบบปฏิบัติการเพิ่มเติม
คุณสามารถหารือเกี่ยวกับปัญหา GitHub โดยตรง
สำหรับผู้ใช้ภาษาจีนคุณสามารถสแกนรหัส QR ทางด้านซ้ายเพื่อติดตามบัญชีอย่างเป็นทางการของ Wenet เราสร้างกลุ่ม WeChat เพื่อการสนทนาที่ดีขึ้นและตอบสนองได้เร็วขึ้น โปรดสแกนรหัส QR ส่วนบุคคลทางด้านขวาและผู้ชายคนนั้นรับผิดชอบในการเชิญคุณเข้าร่วมกลุ่มแชท
![]() | ![]() |
|---|
@inproceedings { yao2021wenet ,
title = { WeNet: Production oriented Streaming and Non-streaming End-to-End Speech Recognition Toolkit } ,
author = { Yao, Zhuoyuan and Wu, Di and Wang, Xiong and Zhang, Binbin and Yu, Fan and Yang, Chao and Peng, Zhendong and Chen, Xiaoyu and Xie, Lei and Lei, Xin } ,
booktitle = { Proc. Interspeech } ,
year = { 2021 } ,
address = { Brno, Czech Republic } ,
organization = { IEEE }
}
@article { zhang2022wenet ,
title = { WeNet 2.0: More Productive End-to-End Speech Recognition Toolkit } ,
author = { Zhang, Binbin and Wu, Di and Peng, Zhendong and Song, Xingchen and Yao, Zhuoyuan and Lv, Hang and Xie, Lei and Yang, Chao and Pan, Fuping and Niu, Jianwei } ,
journal = { arXiv preprint arXiv:2203.15455 } ,
year = { 2022 }
}