

Brevitas adalah perpustakaan Pytorch untuk kuantisasi jaringan saraf, dengan dukungan untuk kuantisasi pasca-pelatihan (PTQ) dan pelatihan kuantisasi-sadar (QAT) .
Harap dicatat bahwa Brevitas adalah proyek penelitian dan bukan produk Xilinx resmi.
Jika Anda menyukai proyek ini, harap pertimbangkan repo ini, karena ini adalah cara paling sederhana dan terbaik untuk mendukungnya.
Anda dapat menginstal rilis terbaru dari PYPI:
pip install brevitas Brevitas saat ini menawarkan implementasi kuantisasi dari lapisan pytorch yang paling umum digunakan dalam DNN di bawah brevitas.nn , seperti QuantConv1d , QuantConv2d , QuantConvTranspose1d , QuantConvTranspose2d , QuantMultiheadAttention QuantRNN , QuantLSTM dll, untuk adopsi di dalam pt dan quantrnn. Untuk masing -masing lapisan ini, kuantisasi tensor yang berbeda (input, bobot, bias, output, dll) dapat disetel secara individual sesuai dengan berbagai pengaturan kuantisasi.
Sebagai referensi untuk PTQ, Brevitas memberikan contoh aliran pengguna untuk model klasifikasi ImageNet di bawah brevitas_examples.imagenet_classification.ptq yang menghitung model input obor menggunakan PTQ di bawah konfigurasi kuantisasi yang berbeda (misalnya lebar bit, granularitas skala, dll).
Untuk info lebih lanjut, checkout panduan memulai kami.
Jika Anda mengadopsi brevitas dalam pekerjaan Anda, silakan mengutipnya sebagai:
@software{brevitas,
author = {Alessandro Pappalardo},
title = {Xilinx/brevitas},
year = {2023},
publisher = {Zenodo},
doi = {10.5281/zenodo.3333552},
url = {https://doi.org/10.5281/zenodo.3333552}
}