
Torchaudio의 목표는 Pytorch를 오디오 도메인에 적용하는 것입니다. Torchaudio는 Pytorch를 지원함으로써 강력한 GPU 가속을 제공하는 것과 동일한 철학을 따르고 Autograd 시스템을 통해 훈련 가능한 기능에 중점을두고 일관된 스타일 (텐서 이름 및 차원 이름)을 갖습니다. 따라서 주로 기계 학습 라이브러리이며 일반적인 신호 처리 라이브러리가 아닙니다. Pytorch의 이점은 Torchaudio에서 모든 계산을 Pytorch 작업을 통해 사용하여 사용하기 쉽고 자연스러운 확장처럼 느낄 수 있습니다.
wav , mp3 , ogg , flac , opus , sphere 와 같은 다양한 오디오 형식을 SOX를 사용하는 토치 텐서에로드하십시오.Torchaudio의 설치 및 빌드 프로세스는 https://pytorch.org/audio/main/installation.html을 참조하십시오.
API 참조는 여기에 있습니다 : http://pytorch.org/audio/main/
Contributing.md를 참조하십시오
이 패키지가 유용하다고 생각되면 다음과 같이 인용하십시오.
@article { yang2021torchaudio ,
title = { TorchAudio: Building Blocks for Audio and Speech Processing } ,
author = { Yao-Yuan Yang and Moto Hira and Zhaoheng Ni and Anjali Chourdia and Artyom Astafurov and Caroline Chen and Ching-Feng Yeh and Christian Puhrsch and David Pollack and Dmitriy Genzel and Donny Greenberg and Edward Z. Yang and Jason Lian and Jay Mahadeokar and Jeff Hwang and Ji Chen and Peter Goldsborough and Prabhat Roy and Sean Narenthiran and Shinji Watanabe and Soumith Chintala and Vincent Quenneville-Bélair and Yangyang Shi } ,
journal = { arXiv preprint arXiv:2110.15018 } ,
year = { 2021 }
} @misc { hwang2023torchaudio ,
title = { TorchAudio 2.1: Advancing speech recognition, self-supervised learning, and audio processing components for PyTorch } ,
author = { Jeff Hwang and Moto Hira and Caroline Chen and Xiaohui Zhang and Zhaoheng Ni and Guangzhi Sun and Pingchuan Ma and Ruizhe Huang and Vineel Pratap and Yuekai Zhang and Anurag Kumar and Chin-Yun Yu and Chuang Zhu and Chunxi Liu and Jacob Kahn and Mirco Ravanelli and Peng Sun and Shinji Watanabe and Yangyang Shi and Yumeng Tao and Robin Scheibler and Samuele Cornell and Sean Kim and Stavros Petridis } ,
year = { 2023 } ,
eprint = { 2310.17864 } ,
archivePrefix = { arXiv } ,
primaryClass = { eess.AS }
}이것은 공개 데이터 세트를 다운로드하고 준비하는 유틸리티 라이브러리입니다. 당사는 이러한 데이터 세트를 호스팅하거나 배포하지 않거나 품질이나 공정성을 보증하거나 데이터 세트를 사용할 수있는 라이센스가 있다고 주장합니다. 데이터 세트 라이센스에 따라 데이터 세트를 사용할 수있는 권한이 있는지 확인하는 것은 귀하의 책임입니다.
데이터 세트 소유자이고 그 일부 (설명, 인용 등)를 업데이트하려면이 라이브러리에 데이터 세트가 포함되기를 원하지 않으면 GitHub 문제를 해결하십시오. ML 커뮤니티에 기여해 주셔서 감사합니다!
이 라이브러리에 제공된 미리 훈련 된 모델에는 교육에 사용되는 데이터 세트에서 파생 된 자체 라이센스 또는 이용 약관이있을 수 있습니다. 사용 사례에 모델을 사용할 수있는 권한이 있는지 여부를 결정하는 것은 귀하의 책임입니다.
예를 들어, SquimsUbjective Model은 Creative Commons Attribution Non Commercial 4.0 International (CC-By-NC 4.0) 라이센스에 따라 출시됩니다. 자세한 내용은 링크를 참조하십시오.
라이센스가 다른 다른 미리 훈련 된 모델은 문서에 기록되어 있습니다. 문서 페이지를 확인하십시오.