Descarga audio - Descarga del código fuente de audio

audio

Pitón

TorchAudio 2.5.0 Release

Descargar

Torchaudio: una biblioteca de audio para Pytorch

Logotipo de Torchaudio

El objetivo de Torchaudio es aplicar Pytorch al dominio de audio. Al apoyar a Pytorch, Torchaudio sigue la misma filosofía de proporcionar una fuerte aceleración de GPU, tener un enfoque en las características capacitables a través del sistema Autograd y tener un estilo consistente (nombres de tensor y nombres de dimensiones). Por lo tanto, es principalmente una biblioteca de aprendizaje automático y no una biblioteca general de procesamiento de señales. Los beneficios de Pytorch se pueden ver en Torchaudio a través de todos los cálculos a través de las operaciones de Pytorch, lo que hace que sea fácil de usar y se sienta como una extensión natural.

Admitir E/S de audio (cargar archivos, guardar archivos)
- Cargue una variedad de formatos de audio, como wav , mp3 , ogg , flac , opus , sphere , en un tensor de antorcha usando Sox
- Kaldi (Arca/SCP)
Dataloaders para conjuntos de datos de audio comunes
Funciones de procesamiento de audio y voz
- Forced_align
Transformaciones de audio comunes
- Espectrograma, AmplitudeTodb, Melscale, Melspectrogram, MFCC, Mulawencoding, Mulawdecoding, Risample
Interfaces de cumplimiento: ejecute código usando pytorch que se alinee con otras bibliotecas
- Kaldi: espectrograma, FBank, MFCC

Instalación

Consulte https://pytorch.org/audio/main/installation.html para el proceso de instalación y construcción de Torchaudio.

Referencia de API

La referencia de API se encuentra aquí: http://pytorch.org/audio/main/

Pautas contribuyentes

Consulte CONTRIGIRO.MD

Citación

Si encuentra útil este paquete, cite como:

 @article { yang2021torchaudio ,
  title = { TorchAudio: Building Blocks for Audio and Speech Processing } ,
  author = { Yao-Yuan Yang and Moto Hira and Zhaoheng Ni and Anjali Chourdia and Artyom Astafurov and Caroline Chen and Ching-Feng Yeh and Christian Puhrsch and David Pollack and Dmitriy Genzel and Donny Greenberg and Edward Z. Yang and Jason Lian and Jay Mahadeokar and Jeff Hwang and Ji Chen and Peter Goldsborough and Prabhat Roy and Sean Narenthiran and Shinji Watanabe and Soumith Chintala and Vincent Quenneville-Bélair and Yangyang Shi } ,
  journal = { arXiv preprint arXiv:2110.15018 } ,
  year = { 2021 }
}

 @misc { hwang2023torchaudio ,
      title = { TorchAudio 2.1: Advancing speech recognition, self-supervised learning, and audio processing components for PyTorch } , 
      author = { Jeff Hwang and Moto Hira and Caroline Chen and Xiaohui Zhang and Zhaoheng Ni and Guangzhi Sun and Pingchuan Ma and Ruizhe Huang and Vineel Pratap and Yuekai Zhang and Anurag Kumar and Chin-Yun Yu and Chuang Zhu and Chunxi Liu and Jacob Kahn and Mirco Ravanelli and Peng Sun and Shinji Watanabe and Yangyang Shi and Yumeng Tao and Robin Scheibler and Samuele Cornell and Sean Kim and Stavros Petridis } ,
      year = { 2023 } ,
      eprint = { 2310.17864 } ,
      archivePrefix = { arXiv } ,
      primaryClass = { eess.AS }
}

Descargo de responsabilidad en conjuntos de datos

Esta es una biblioteca de servicios públicos que descarga y prepara conjuntos de datos públicos. No alojamos ni distribuimos estos conjuntos de datos, respondemos por su calidad o equidad, ni afirmamos que tiene licencia para usar el conjunto de datos. Es su responsabilidad determinar si tiene permiso para usar el conjunto de datos bajo la licencia del conjunto de datos.

Si es propietario de un conjunto de datos y desea actualizar cualquier parte de ella (descripción, cita, etc.), o no desea que su conjunto de datos se incluya en esta biblioteca, póngase en contacto con un problema de GitHub. ¡Gracias por su contribución a la comunidad ML!

Licencia de modelo previamente capacitada

Los modelos previamente capacitados proporcionados en esta biblioteca pueden tener sus propias licencias o términos y condiciones derivados del conjunto de datos utilizado para la capacitación. Es su responsabilidad determinar si tiene permiso para usar los modelos para su caso de uso.

Por ejemplo, el modelo SquimSubjective se publica bajo la licencia Creative Commons Attribution Non Commercial 4.0 International (CC-BY-NC 4.0). Consulte el enlace para obtener detalles adicionales.

Otros modelos previamente capacitados que tienen una licencia diferente se observan en la documentación. Consulte la página de documentación.

Expandir

Información adicional