audio 다운로드 - audio 소스 코드 다운로드

audio

파이썬

TorchAudio 2.5.0 Release

다운로드

Torchaudio : Pytorch의 오디오 라이브러리

Torchaudio 로고

Torchaudio의 목표는 Pytorch를 오디오 도메인에 적용하는 것입니다. Torchaudio는 Pytorch를 지원함으로써 강력한 GPU 가속을 제공하는 것과 동일한 철학을 따르고 Autograd 시스템을 통해 훈련 가능한 기능에 중점을두고 일관된 스타일 (텐서 이름 및 차원 이름)을 갖습니다. 따라서 주로 기계 학습 라이브러리이며 일반적인 신호 처리 라이브러리가 아닙니다. Pytorch의 이점은 Torchaudio에서 모든 계산을 Pytorch 작업을 통해 사용하여 사용하기 쉽고 자연스러운 확장처럼 느낄 수 있습니다.

오디오 I/O 지원 (파일로드, 파일 저장)
- wav , mp3 , ogg , flac , opus , sphere 와 같은 다양한 오디오 형식을 SOX를 사용하는 토치 텐서에로드하십시오.
- 칼디 (ARK/SCP)
일반적인 오디오 데이터 세트의 데이터 로더
오디오 및 음성 처리 기능
- 강제 _align
일반적인 오디오 변환
- 스펙트로 그램, Amplitudetodb, Melscale, Melspectrogram, MFCC, Mulawencoding, Mulawdecoding, Resapple
준수 인터페이스 : 다른 라이브러리와 일치하는 Pytorch를 사용하여 코드 실행
- Kaldi : Spectrogram, FBank, MFCC

설치

Torchaudio의 설치 및 빌드 프로세스는 https://pytorch.org/audio/main/installation.html을 참조하십시오.

API 참조

API 참조는 여기에 있습니다 : http://pytorch.org/audio/main/

기고 가이드 라인

Contributing.md를 참조하십시오

소환

이 패키지가 유용하다고 생각되면 다음과 같이 인용하십시오.

 @article { yang2021torchaudio ,
  title = { TorchAudio: Building Blocks for Audio and Speech Processing } ,
  author = { Yao-Yuan Yang and Moto Hira and Zhaoheng Ni and Anjali Chourdia and Artyom Astafurov and Caroline Chen and Ching-Feng Yeh and Christian Puhrsch and David Pollack and Dmitriy Genzel and Donny Greenberg and Edward Z. Yang and Jason Lian and Jay Mahadeokar and Jeff Hwang and Ji Chen and Peter Goldsborough and Prabhat Roy and Sean Narenthiran and Shinji Watanabe and Soumith Chintala and Vincent Quenneville-Bélair and Yangyang Shi } ,
  journal = { arXiv preprint arXiv:2110.15018 } ,
  year = { 2021 }
}

 @misc { hwang2023torchaudio ,
      title = { TorchAudio 2.1: Advancing speech recognition, self-supervised learning, and audio processing components for PyTorch } , 
      author = { Jeff Hwang and Moto Hira and Caroline Chen and Xiaohui Zhang and Zhaoheng Ni and Guangzhi Sun and Pingchuan Ma and Ruizhe Huang and Vineel Pratap and Yuekai Zhang and Anurag Kumar and Chin-Yun Yu and Chuang Zhu and Chunxi Liu and Jacob Kahn and Mirco Ravanelli and Peng Sun and Shinji Watanabe and Yangyang Shi and Yumeng Tao and Robin Scheibler and Samuele Cornell and Sean Kim and Stavros Petridis } ,
      year = { 2023 } ,
      eprint = { 2310.17864 } ,
      archivePrefix = { arXiv } ,
      primaryClass = { eess.AS }
}

데이터 세트에서 면책 조항

이것은 공개 데이터 세트를 다운로드하고 준비하는 유틸리티 라이브러리입니다. 당사는 이러한 데이터 세트를 호스팅하거나 배포하지 않거나 품질이나 공정성을 보증하거나 데이터 세트를 사용할 수있는 라이센스가 있다고 주장합니다. 데이터 세트 라이센스에 따라 데이터 세트를 사용할 수있는 권한이 있는지 확인하는 것은 귀하의 책임입니다.

데이터 세트 소유자이고 그 일부 (설명, 인용 등)를 업데이트하려면이 라이브러리에 데이터 세트가 포함되기를 원하지 않으면 GitHub 문제를 해결하십시오. ML 커뮤니티에 기여해 주셔서 감사합니다!