
El objetivo de Torchaudio es aplicar Pytorch al dominio de audio. Al apoyar a Pytorch, Torchaudio sigue la misma filosofía de proporcionar una fuerte aceleración de GPU, tener un enfoque en las características capacitables a través del sistema Autograd y tener un estilo consistente (nombres de tensor y nombres de dimensiones). Por lo tanto, es principalmente una biblioteca de aprendizaje automático y no una biblioteca general de procesamiento de señales. Los beneficios de Pytorch se pueden ver en Torchaudio a través de todos los cálculos a través de las operaciones de Pytorch, lo que hace que sea fácil de usar y se sienta como una extensión natural.
wav , mp3 , ogg , flac , opus , sphere , en un tensor de antorcha usando SoxConsulte https://pytorch.org/audio/main/installation.html para el proceso de instalación y construcción de Torchaudio.
La referencia de API se encuentra aquí: http://pytorch.org/audio/main/
Consulte CONTRIGIRO.MD
Si encuentra útil este paquete, cite como:
@article { yang2021torchaudio ,
title = { TorchAudio: Building Blocks for Audio and Speech Processing } ,
author = { Yao-Yuan Yang and Moto Hira and Zhaoheng Ni and Anjali Chourdia and Artyom Astafurov and Caroline Chen and Ching-Feng Yeh and Christian Puhrsch and David Pollack and Dmitriy Genzel and Donny Greenberg and Edward Z. Yang and Jason Lian and Jay Mahadeokar and Jeff Hwang and Ji Chen and Peter Goldsborough and Prabhat Roy and Sean Narenthiran and Shinji Watanabe and Soumith Chintala and Vincent Quenneville-Bélair and Yangyang Shi } ,
journal = { arXiv preprint arXiv:2110.15018 } ,
year = { 2021 }
} @misc { hwang2023torchaudio ,
title = { TorchAudio 2.1: Advancing speech recognition, self-supervised learning, and audio processing components for PyTorch } ,
author = { Jeff Hwang and Moto Hira and Caroline Chen and Xiaohui Zhang and Zhaoheng Ni and Guangzhi Sun and Pingchuan Ma and Ruizhe Huang and Vineel Pratap and Yuekai Zhang and Anurag Kumar and Chin-Yun Yu and Chuang Zhu and Chunxi Liu and Jacob Kahn and Mirco Ravanelli and Peng Sun and Shinji Watanabe and Yangyang Shi and Yumeng Tao and Robin Scheibler and Samuele Cornell and Sean Kim and Stavros Petridis } ,
year = { 2023 } ,
eprint = { 2310.17864 } ,
archivePrefix = { arXiv } ,
primaryClass = { eess.AS }
}Esta es una biblioteca de servicios públicos que descarga y prepara conjuntos de datos públicos. No alojamos ni distribuimos estos conjuntos de datos, respondemos por su calidad o equidad, ni afirmamos que tiene licencia para usar el conjunto de datos. Es su responsabilidad determinar si tiene permiso para usar el conjunto de datos bajo la licencia del conjunto de datos.
Si es propietario de un conjunto de datos y desea actualizar cualquier parte de ella (descripción, cita, etc.), o no desea que su conjunto de datos se incluya en esta biblioteca, póngase en contacto con un problema de GitHub. ¡Gracias por su contribución a la comunidad ML!
Los modelos previamente capacitados proporcionados en esta biblioteca pueden tener sus propias licencias o términos y condiciones derivados del conjunto de datos utilizado para la capacitación. Es su responsabilidad determinar si tiene permiso para usar los modelos para su caso de uso.
Por ejemplo, el modelo SquimSubjective se publica bajo la licencia Creative Commons Attribution Non Commercial 4.0 International (CC-BY-NC 4.0). Consulte el enlace para obtener detalles adicionales.
Otros modelos previamente capacitados que tienen una licencia diferente se observan en la documentación. Consulte la página de documentación.