Download de wenet - Download do código fonte wenet

wenet

Pitão

v3.1.0

Baixar

Wenet

Compartilhamos a rede juntos.

Destaques

Produção First e Production Ready : The Core Design Princípio, Wenet fornece soluções de produção de pilha completa para reconhecimento de fala.
Preciso : o WeNet alcança os resultados do SOTA em muitos conjuntos de dados de discursos públicos.
Peso leve : o Wenet é fácil de instalar, fácil de usar, bem projetado e bem documentado.

Instalar

Instale o pacote python

pip install git+https://github.com/wenet-e2e/wenet.git

Uso da linha de comando (use -h para parâmetros):

wenet --language chinese audio.wav

Uso da programação do Python :

 import wenet

model = wenet . load_model ( 'chinese' )
result = model . transcribe ( 'audio.wav' )
print ( result [ 'text' ])

Consulte o uso do Python para obter mais linha de comando e uso de programação Python.

Instale para treinamento e implantação

Clone o repo

git clone https://github.com/wenet-e2e/wenet.git

Instale o CONDA: Por favor, consulte https://docs.conda.io/en/latest/miniconda.html
Crie conda Env:

conda create -n wenet python=3.10
conda activate wenet
conda install conda-forge::sox

Instale o CUDA: Siga este link, é recomendável instalar o CUDA 12.1
Instale a tocha e a torchaudio, é recomendado para usar 2.2.2+Cu121:

pip install torch==2.2.2+cu121 torchaudio==2.2.2+cu121 -f https://download.pytorch.org/whl/torch_stable.html

Para usuários da NPU Ascend:

Instale Cann: Siga este link para instalar o Cann Toolkit e os kernels.
Instale o WeNet com as dependências da Torch-NPU:

pip install -e .[torch-npu]

Tabela de controle de versão relacionada:

Exigência	Mínimo	Recomendar
Cann	8.0.rc2.alpha003	mais recente
tocha	2.1.0	2.2.0
Torch-NPU	2.1.0	2.2.0
Torchaudio	2.1.0	2.2.0
DeepSpeed	0,13.2	mais recente

Instale outros pacotes Python

pip install -r requirements.txt
pre-commit install  # for clean and tidy code

Perguntas frequentes (perguntas frequentes)

 # If you encounter sox compatibility issues
RuntimeError: set_buffer_size requires sox extension which is not available.
# ubuntu
sudo apt-get install sox libsox-dev
# centos
sudo yum install sox sox-devel
# conda env
conda install  conda-forge::sox

Construir para implantação

Opcionalmente, se você deseja usar o X86 Runtime ou Model Language (LM), deve criar o tempo de execução da seguinte maneira. Caso contrário, você pode simplesmente ignorar esta etapa.

 # runtime build requires cmake 3.14 or above
cd runtime/libtorch
mkdir build && cd build && cmake -DGRAPH_TOOLS=ON .. && cmake --build .

Consulte o DOC para criar tempo de execução em mais plataformas e sistema operacional.

Discussão e comunicação

Você pode discutir diretamente sobre questões do GitHub.

Para usuários chineses, você também pode digitalizar o código QR à esquerda para seguir nossa conta oficial da WeNet. Criamos um grupo WeChat para uma melhor discussão e resposta mais rápida. Digitalize o código QR pessoal à direita e o cara é responsável por convidá -lo para o grupo de bate -papo.

Reconhecer

Emprestamos muito código da ESPNET para modelagem baseada em transformadores.
Emprestamos muito código de Kaldi para a decodificação baseada em WFST para a integração de LM.
Referimos o EESEN para a construção de gráficos baseados em TLG para integração de LM.
Nós nos referimos ao OpenTransformer para inferência em lote de Python dos modelos E2E.

Citações

 @inproceedings { yao2021wenet ,
title = { WeNet: Production oriented Streaming and Non-streaming End-to-End Speech Recognition Toolkit } ,
author = { Yao, Zhuoyuan and Wu, Di and Wang, Xiong and Zhang, Binbin and Yu, Fan and Yang, Chao and Peng, Zhendong and Chen, Xiaoyu and Xie, Lei and Lei, Xin } ,
  booktitle = { Proc. Interspeech } ,
  year = { 2021 } ,
  address = { Brno, Czech Republic } ,
  organization = { IEEE }
}

@article { zhang2022wenet ,
  title = { WeNet 2.0: More Productive End-to-End Speech Recognition Toolkit } ,
  author = { Zhang, Binbin and Wu, Di and Peng, Zhendong and Song, Xingchen and Yao, Zhuoyuan and Lv, Hang and Xie, Lei and Yang, Chao and Pan, Fuping and Niu, Jianwei } ,
  journal = { arXiv preprint arXiv:2203.15455 } ,
  year = { 2022 }
}

Expandir

Informações adicionais

Versão v3.1.0
Tipo Pitão
Data da Última Atualização 2025-07-11
tamanho 12.72MB
Vindo de Github

Aplicativos Relacionados

ToDo Co

2025-03-22
Python Portfolio

2024-11-10
Ferramenta de gráfico de dados de código aberto Redash v24.10.0

2024-11-27
datamule python

2024-11-08
plataforma de visualização de dados smartchart v6.9

2024-11-27
Ferramenta de teste de carga Locust v2.32.0

2024-11-27

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ToDo Co

Pitão

1.0.0
Python Portfolio

Pitão
Ferramenta de gráfico de dados de código aberto Redash v24.10.0

Pitão

24.10.0
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos