
Целью Torchaudio является применение Pytorch к аудиомену. Поддерживая Pytorch, Torchaudio следует той же философии обеспечения сильного ускорения GPU, уделяя особое внимание обучаемым функциям через систему Autograd, и имея постоянный стиль (названия тензоров и названия измерений). Следовательно, это в первую очередь библиотека машинного обучения, а не общая библиотека обработки сигналов. Преимущества Pytorch можно увидеть в Torchaudio, когда все вычисления проводятся через операции Pytorch, что облегчает использование и ощущается как естественное расширение.
wav , mp3 , ogg , flac , opus , sphere , в тензор горелки с использованием SOXПожалуйста, обратитесь к https://pytorch.org/audio/main/installation.html для процесса установки и сборки Торчаудио.
Ссылка на API находится здесь: http://pytorch.org/audio/main/
Пожалуйста, обратитесь к Anforming.md
Если вы найдете этот пакет полезным, пожалуйста, цитируйте как:
@article { yang2021torchaudio ,
title = { TorchAudio: Building Blocks for Audio and Speech Processing } ,
author = { Yao-Yuan Yang and Moto Hira and Zhaoheng Ni and Anjali Chourdia and Artyom Astafurov and Caroline Chen and Ching-Feng Yeh and Christian Puhrsch and David Pollack and Dmitriy Genzel and Donny Greenberg and Edward Z. Yang and Jason Lian and Jay Mahadeokar and Jeff Hwang and Ji Chen and Peter Goldsborough and Prabhat Roy and Sean Narenthiran and Shinji Watanabe and Soumith Chintala and Vincent Quenneville-Bélair and Yangyang Shi } ,
journal = { arXiv preprint arXiv:2110.15018 } ,
year = { 2021 }
} @misc { hwang2023torchaudio ,
title = { TorchAudio 2.1: Advancing speech recognition, self-supervised learning, and audio processing components for PyTorch } ,
author = { Jeff Hwang and Moto Hira and Caroline Chen and Xiaohui Zhang and Zhaoheng Ni and Guangzhi Sun and Pingchuan Ma and Ruizhe Huang and Vineel Pratap and Yuekai Zhang and Anurag Kumar and Chin-Yun Yu and Chuang Zhu and Chunxi Liu and Jacob Kahn and Mirco Ravanelli and Peng Sun and Shinji Watanabe and Yangyang Shi and Yumeng Tao and Robin Scheibler and Samuele Cornell and Sean Kim and Stavros Petridis } ,
year = { 2023 } ,
eprint = { 2310.17864 } ,
archivePrefix = { arXiv } ,
primaryClass = { eess.AS }
}Это библиотека утилит, которая загружает и готовит публичные наборы данных. Мы не размещаем и не размещаем эти наборы данных, не ручаются за их качество или справедливость, или утверждаем, что у вас есть лицензия на использование набора данных. Вы обязаны определить, есть ли у вас разрешение использовать набор данных по лицензии набора данных.
Если вы являетесь владельцем набора данных и хотите обновить какую -либо его часть (описание, цитата и т. Д.) Или не хотите, чтобы ваш набор данных был включен в эту библиотеку, свяжитесь с нами, свяжитесь с проблемой GitHub. Спасибо за ваш вклад в сообщество ML!
Предварительно обученные модели, представленные в этой библиотеке, могут иметь свои собственные лицензии или условия, полученные из набора данных, используемого для обучения. Вы обязаны определить, есть ли у вас разрешение использовать модели для вашего варианта использования.
Например, модель Squimsubjective выпускается по лицензии Creative Commons Attribution Non Commercial 4.0 (CC-BY-NC 4.0). Смотрите ссылку для получения дополнительной информации.
Другие предварительно обученные модели, имеющие разные лицензии, отмечены в документации. Пожалуйста, проверьте страницу документации.