Unduh audio - Unduh Kode Sumber audio

audio

ular piton

TorchAudio 2.5.0 Release

Unduh

Torchaudio: Perpustakaan Audio untuk Pytorch

Logo Torchaudio

Tujuan Torchaudio adalah untuk menerapkan Pytorch ke domain audio. Dengan mendukung Pytorch, Torchaudio mengikuti filosofi yang sama dalam memberikan akselerasi GPU yang kuat, memiliki fokus pada fitur yang dapat dilatih melalui sistem autograd, dan memiliki gaya yang konsisten (nama tensor dan nama dimensi). Oleh karena itu, ini terutama perpustakaan pembelajaran mesin dan bukan perpustakaan pemrosesan sinyal umum. Manfaat Pytorch dapat dilihat di Torchaudio dengan memiliki semua perhitungan melalui operasi Pytorch yang membuatnya mudah digunakan dan merasa seperti ekstensi alami.

Dukungan Audio I/O (Muat File, Simpan File)
- Muat berbagai format audio, seperti wav , mp3 , ogg , flac , opus , sphere , menjadi tensor obor menggunakan sox
- Kaldi (Ark/SCP)
Dataloaders untuk set data audio umum
Fungsi pemrosesan audio dan ucapan
- Forced_align
Transformasi audio umum
- Spektrogram, amplitudetodb, Melscale, Melspectrogram, MFCC, mulawencoding, mulawdecoding, resample
Antarmuka Kepatuhan: Jalankan Kode Menggunakan Pytorch yang selaras dengan perpustakaan lain
- Kaldi: Spectrogram, FBank, MFCC

Instalasi

Silakan merujuk ke https://pytorch.org/audio/main/installation.html untuk instalasi dan pembuatan proses Torchaudio.

Referensi API

Referensi API terletak di sini: http://pytorch.org/audio/main/

Pedoman yang berkontribusi

Silakan merujuk ke contributing.md

Kutipan

Jika Anda menemukan paket ini berguna, silakan kutip sebagai:

 @article { yang2021torchaudio ,
  title = { TorchAudio: Building Blocks for Audio and Speech Processing } ,
  author = { Yao-Yuan Yang and Moto Hira and Zhaoheng Ni and Anjali Chourdia and Artyom Astafurov and Caroline Chen and Ching-Feng Yeh and Christian Puhrsch and David Pollack and Dmitriy Genzel and Donny Greenberg and Edward Z. Yang and Jason Lian and Jay Mahadeokar and Jeff Hwang and Ji Chen and Peter Goldsborough and Prabhat Roy and Sean Narenthiran and Shinji Watanabe and Soumith Chintala and Vincent Quenneville-Bélair and Yangyang Shi } ,
  journal = { arXiv preprint arXiv:2110.15018 } ,
  year = { 2021 }
}

 @misc { hwang2023torchaudio ,
      title = { TorchAudio 2.1: Advancing speech recognition, self-supervised learning, and audio processing components for PyTorch } , 
      author = { Jeff Hwang and Moto Hira and Caroline Chen and Xiaohui Zhang and Zhaoheng Ni and Guangzhi Sun and Pingchuan Ma and Ruizhe Huang and Vineel Pratap and Yuekai Zhang and Anurag Kumar and Chin-Yun Yu and Chuang Zhu and Chunxi Liu and Jacob Kahn and Mirco Ravanelli and Peng Sun and Shinji Watanabe and Yangyang Shi and Yumeng Tao and Robin Scheibler and Samuele Cornell and Sean Kim and Stavros Petridis } ,
      year = { 2023 } ,
      eprint = { 2310.17864 } ,
      archivePrefix = { arXiv } ,
      primaryClass = { eess.AS }
}

Penafian pada dataset

Ini adalah perpustakaan utilitas yang mengunduh dan menyiapkan kumpulan data publik. Kami tidak meng -host atau mendistribusikan set data ini, menjamin kualitas atau keadilannya, atau mengklaim bahwa Anda memiliki lisensi untuk menggunakan dataset. Adalah tanggung jawab Anda untuk menentukan apakah Anda memiliki izin untuk menggunakan dataset di bawah lisensi dataset.

Jika Anda seorang pemilik dataset dan ingin memperbarui bagian mana pun dari itu (deskripsi, kutipan, dll.), Atau tidak ingin dataset Anda dimasukkan dalam perpustakaan ini, silakan hubungi melalui masalah GitHub. Terima kasih atas kontribusi Anda untuk komunitas ML!

Lisensi Model Pra-Terlatih

Model pra-terlatih yang disediakan di perpustakaan ini mungkin memiliki lisensi atau syarat dan ketentuan mereka sendiri yang berasal dari dataset yang digunakan untuk pelatihan. Adalah tanggung jawab Anda untuk menentukan apakah Anda memiliki izin untuk menggunakan model untuk kasus penggunaan Anda.

Misalnya, model SquimSubjective dirilis di bawah lisensi Creative Commons Attribution Non Commercial 4.0 International (CC-BY-NC 4.0). Lihat tautan untuk detail tambahan.

Model pra-terlatih lainnya yang memiliki lisensi berbeda dicatat dalam dokumentasi. Silakan periksa halaman dokumentasi.

Memperluas

Informasi Tambahan