

Brevitas-это библиотека Pytorch для квантования нейронной сети, при поддержке как для квантования после тренировки (PTQ) , так и обучения к квантованию (QAT) .
Обратите внимание, что Brevitas - это исследовательский проект, а не официальный продукт Xilinx.
Если вам нравится этот проект, пожалуйста, рассмотрите этот репо, так как это самый простой и лучший способ его поддержать.
Вы можете установить последний выпуск от PYPI:
pip install brevitas В настоящее время Brevitas предлагает квантованные реализации наиболее распространенных слоев Pytorch, используемых в DNN в brevitas.nn , таких как QuantConv1d , QuantConv2d , QuantConvTranspose1d , QuantConvTranspose2d , QuantMultiheadAttention , QuantRNN , QuantLSTM и т. Д., Для принятия в PTQ и/или QAT. Для каждого из этих слоев квантование различных тензоров (входы, веса, смещение, выходы и т. Д.) Может быть индивидуально настроено в соответствии с широким диапазоном настроек квантования.
В качестве ссылки для PTQ Brevitas приводит пример пользовательского потока для моделей классификации ImageNet в рамках модели brevitas_examples.imagenet_classification.ptq , которые определяют входную модель Torchvision с использованием PTQ в различных конфигурациях квантования (например, ширина битов, гранулярность масштаба, и т. Д.).
Для получения дополнительной информации проверьте наше руководство по началу работы.
Если вы усыновите Brevitas в своей работе, пожалуйста, укажите это как:
@software{brevitas,
author = {Alessandro Pappalardo},
title = {Xilinx/brevitas},
year = {2023},
publisher = {Zenodo},
doi = {10.5281/zenodo.3333552},
url = {https://doi.org/10.5281/zenodo.3333552}
}