
เป้าหมายของ Torchaudio คือการใช้ pytorch กับโดเมนเสียง ด้วยการสนับสนุน Pytorch Torchaudio ติดตามปรัชญาเดียวกันกับการให้การเร่งความเร็ว GPU ที่แข็งแกร่งโดยมุ่งเน้นไปที่คุณสมบัติการฝึกอบรมผ่านระบบ Autograd และมีสไตล์ที่สอดคล้องกัน (ชื่อเทนเซอร์และชื่อมิติ) ดังนั้นจึงเป็นไลบรารีการเรียนรู้ของเครื่องและไม่ใช่ไลบรารีการประมวลผลสัญญาณทั่วไป ประโยชน์ของ pytorch สามารถเห็นได้ใน Torchaudio ผ่านการคำนวณทั้งหมดผ่านการดำเนินการ pytorch ซึ่งทำให้ง่ายต่อการใช้งานและรู้สึกเหมือนเป็นส่วนขยายตามธรรมชาติ
wav , mp3 , ogg , flac , opus , sphere , เข้าไปใน Torch Tensor โดยใช้ Soxโปรดดูที่ https://pytorch.org/audio/main/installation.html สำหรับการติดตั้งและสร้างกระบวนการของ Torchaudio
การอ้างอิง API อยู่ที่นี่: http://pytorch.org/audio/main/
โปรดดูที่การสนับสนุน. md
หากคุณพบว่าแพ็คเกจนี้มีประโยชน์โปรดอ้างอิงเป็น:
@article { yang2021torchaudio ,
title = { TorchAudio: Building Blocks for Audio and Speech Processing } ,
author = { Yao-Yuan Yang and Moto Hira and Zhaoheng Ni and Anjali Chourdia and Artyom Astafurov and Caroline Chen and Ching-Feng Yeh and Christian Puhrsch and David Pollack and Dmitriy Genzel and Donny Greenberg and Edward Z. Yang and Jason Lian and Jay Mahadeokar and Jeff Hwang and Ji Chen and Peter Goldsborough and Prabhat Roy and Sean Narenthiran and Shinji Watanabe and Soumith Chintala and Vincent Quenneville-Bélair and Yangyang Shi } ,
journal = { arXiv preprint arXiv:2110.15018 } ,
year = { 2021 }
} @misc { hwang2023torchaudio ,
title = { TorchAudio 2.1: Advancing speech recognition, self-supervised learning, and audio processing components for PyTorch } ,
author = { Jeff Hwang and Moto Hira and Caroline Chen and Xiaohui Zhang and Zhaoheng Ni and Guangzhi Sun and Pingchuan Ma and Ruizhe Huang and Vineel Pratap and Yuekai Zhang and Anurag Kumar and Chin-Yun Yu and Chuang Zhu and Chunxi Liu and Jacob Kahn and Mirco Ravanelli and Peng Sun and Shinji Watanabe and Yangyang Shi and Yumeng Tao and Robin Scheibler and Samuele Cornell and Sean Kim and Stavros Petridis } ,
year = { 2023 } ,
eprint = { 2310.17864 } ,
archivePrefix = { arXiv } ,
primaryClass = { eess.AS }
}นี่คือห้องสมุดยูทิลิตี้ที่ดาวน์โหลดและเตรียมชุดข้อมูลสาธารณะ เราไม่ได้โฮสต์หรือแจกจ่ายชุดข้อมูลเหล่านี้บัตรกำนัลคุณภาพหรือความยุติธรรมของพวกเขาหรืออ้างว่าคุณมีใบอนุญาตในการใช้ชุดข้อมูล เป็นความรับผิดชอบของคุณในการพิจารณาว่าคุณได้รับอนุญาตให้ใช้ชุดข้อมูลภายใต้ใบอนุญาตของชุดข้อมูลหรือไม่
หากคุณเป็นเจ้าของชุดข้อมูลและต้องการอัปเดตส่วนใดส่วนหนึ่งของมัน (คำอธิบายการอ้างอิง ฯลฯ ) หรือไม่ต้องการให้ชุดข้อมูลของคุณรวมอยู่ในไลบรารีนี้โปรดติดต่อผ่านปัญหา GitHub ขอบคุณสำหรับการสนับสนุนชุมชน ML!
โมเดลที่ผ่านการฝึกอบรมมาก่อนที่ให้ไว้ในห้องสมุดนี้อาจมีใบอนุญาตหรือข้อกำหนดและเงื่อนไขของตนเองที่ได้จากชุดข้อมูลที่ใช้สำหรับการฝึกอบรม เป็นความรับผิดชอบของคุณในการพิจารณาว่าคุณได้รับอนุญาตให้ใช้แบบจำลองสำหรับกรณีการใช้งานของคุณหรือไม่
ตัวอย่างเช่นโมเดล Squimsubjective ได้รับการเผยแพร่ภายใต้ใบอนุญาต Creative Commons Non Commercial 4.0 International (CC-BY-NC 4.0) ดูลิงค์สำหรับรายละเอียดเพิ่มเติม
โมเดลที่ผ่านการฝึกอบรมล่วงหน้าอื่น ๆ ที่มีใบอนุญาตที่แตกต่างกันจะถูกบันทึกไว้ในเอกสาร โปรดชำระเงินหน้าเอกสาร