ดาวน์โหลด wenet - ดาวน์โหลดซอร์สโค้ด wenet

wenet

หลาม

v3.1.0

ดาวน์โหลด

เวนเน็ท

ROADMAP เอกสาร | เอกสาร รันไทม์ แบบจำลองที่ผ่านการฝึกอบรม Huggingface | ถาม Wenet Guru

เรา แบ่งปัน สุทธิ ร่วมกัน

ไฮไลท์

การผลิตครั้งแรกและการผลิตพร้อม : หลักการออกแบบหลัก Wenet นำเสนอโซลูชั่นการผลิตสแต็กเต็มรูปแบบสำหรับการจดจำคำพูด
ถูกต้อง : Wenet บรรลุผล SOTA ในชุดข้อมูลการพูดสาธารณะจำนวนมาก
น้ำหนักเบา : Wenet ติดตั้งง่ายใช้งานง่ายออกแบบมาอย่างดีและมีเอกสารที่ดี

ติดตั้ง

ติดตั้งแพ็คเกจ Python

pip install git+https://github.com/wenet-e2e/wenet.git

การใช้บรรทัดคำสั่ง (ใช้ -h สำหรับพารามิเตอร์):

wenet --language chinese audio.wav

การใช้โปรแกรม Python :

 import wenet

model = wenet . load_model ( 'chinese' )
result = model . transcribe ( 'audio.wav' )
print ( result [ 'text' ])

โปรดอ้างอิงการใช้ Python สำหรับบรรทัดคำสั่งเพิ่มเติมและการใช้โปรแกรม Python

ติดตั้งสำหรับการฝึกอบรมและการปรับใช้

โคลน repo

git clone https://github.com/wenet-e2e/wenet.git

ติดตั้ง Conda: โปรดดู https://docs.conda.io/en/latest/miniconda.html
สร้าง Conda Env:

conda create -n wenet python=3.10
conda activate wenet
conda install conda-forge::sox

ติดตั้ง cuda: โปรดไปที่ลิงค์นี้ขอแนะนำให้ติดตั้ง cuda 12.1
ติดตั้ง Torch และ Torchaudio แนะนำให้ใช้ 2.2.2+Cu121:

pip install torch==2.2.2+cu121 torchaudio==2.2.2+cu121 -f https://download.pytorch.org/whl/torch_stable.html

สำหรับผู้ใช้ Ascend NPU:

ติดตั้ง CANN: โปรดไปที่ลิงค์นี้เพื่อติดตั้ง Cann Toolkit และ Kernels
ติดตั้ง Wenet ด้วยการพึ่งพา Torch-NPU:

pip install -e .[torch-npu]

ตารางควบคุมเวอร์ชันที่เกี่ยวข้อง:

ความต้องการ	ขั้นต่ำสุด	แนะนำ
การทำไม่ได้	8.0.rc2.alpha003	ล่าสุด
คบเพลิง	2.1.0	2.2.0
Torch-NPU	2.1.0	2.2.0
ทอร์ชูดิโอ	2.1.0	2.2.0
ความเร็วลึก	0.13.2	ล่าสุด

ติดตั้งแพ็คเกจ Python อื่น ๆ

pip install -r requirements.txt
pre-commit install  # for clean and tidy code

คำถามที่พบบ่อย (คำถามที่พบบ่อย)

 # If you encounter sox compatibility issues
RuntimeError: set_buffer_size requires sox extension which is not available.
# ubuntu
sudo apt-get install sox libsox-dev
# centos
sudo yum install sox sox-devel
# conda env
conda install  conda-forge::sox

สร้างสำหรับการปรับใช้

เป็นทางเลือกหากคุณต้องการใช้ X86 Runtime หรือ Language Model (LM) คุณต้องสร้างรันไทม์ดังนี้ มิฉะนั้นคุณสามารถเพิกเฉยต่อขั้นตอนนี้ได้

 # runtime build requires cmake 3.14 or above
cd runtime/libtorch
mkdir build && cd build && cmake -DGRAPH_TOOLS=ON .. && cmake --build .

โปรดดูเอกสารสำหรับการสร้างรันไทม์บนแพลตฟอร์มและระบบปฏิบัติการเพิ่มเติม

การอภิปรายและการสื่อสาร

คุณสามารถหารือเกี่ยวกับปัญหา GitHub โดยตรง

สำหรับผู้ใช้ภาษาจีนคุณสามารถสแกนรหัส QR ทางด้านซ้ายเพื่อติดตามบัญชีอย่างเป็นทางการของ Wenet เราสร้างกลุ่ม WeChat เพื่อการสนทนาที่ดีขึ้นและตอบสนองได้เร็วขึ้น โปรดสแกนรหัส QR ส่วนบุคคลทางด้านขวาและผู้ชายคนนั้นรับผิดชอบในการเชิญคุณเข้าร่วมกลุ่มแชท

รับทราบ

เรายืมรหัสจำนวนมากจาก ESPNET สำหรับการสร้างแบบจำลองที่ใช้หม้อแปลง
เรายืมรหัสจำนวนมากจาก Kaldi สำหรับการถอดรหัส WFST สำหรับการรวม LM
เราอ้างถึง Eesen สำหรับการสร้างกราฟที่ใช้ TLG สำหรับการรวม LM
เราอ้างถึง OpentRansformer สำหรับการอนุมานชุด Python ของรุ่น E2E

การอ้างอิง

 @inproceedings { yao2021wenet ,
title = { WeNet: Production oriented Streaming and Non-streaming End-to-End Speech Recognition Toolkit } ,
author = { Yao, Zhuoyuan and Wu, Di and Wang, Xiong and Zhang, Binbin and Yu, Fan and Yang, Chao and Peng, Zhendong and Chen, Xiaoyu and Xie, Lei and Lei, Xin } ,
  booktitle = { Proc. Interspeech } ,
  year = { 2021 } ,
  address = { Brno, Czech Republic } ,
  organization = { IEEE }
}

@article { zhang2022wenet ,
  title = { WeNet 2.0: More Productive End-to-End Speech Recognition Toolkit } ,
  author = { Zhang, Binbin and Wu, Di and Peng, Zhendong and Song, Xingchen and Yao, Zhuoyuan and Lv, Hang and Xie, Lei and Yang, Chao and Pan, Fuping and Niu, Jianwei } ,
  journal = { arXiv preprint arXiv:2203.15455 } ,
  year = { 2022 }
}

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน v3.1.0
ประเภท หลาม
เวลาอัปเดต 2025-07-11
ขนาด 12.72MB
มาจาก Github

แอปที่เกี่ยวข้อง

ToDo Co

2025-03-22
Python Portfolio

2024-11-10
เครื่องมือแผนภูมิข้อมูลโอเพ่นซอร์ส Redash v24.10.0

2024-11-27
datamule python

2024-11-08
แพลตฟอร์มการแสดงภาพข้อมูล smartchart เวอร์ชัน 6.9

2024-11-27
เครื่องมือทดสอบโหลดตั๊กแตน v2.32.0

2024-11-27

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ToDo Co

หลาม

1.0.0
Python Portfolio

หลาม
เครื่องมือแผนภูมิข้อมูลโอเพ่นซอร์ส Redash v24.10.0

หลาม

24.10.0
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด