Unduh torchdistill - Unduh Kode Sumber torchdistill

torchdistill

Kode sumber lainnya

PyTorch 2.5 support, model migrations, end of Python 3.8 support

Unduh

Torchdistill: Kerangka kerja modular, yang digerakkan oleh konfigurasi untuk distilasi pengetahuan

Torchdistill (sebelumnya KDKIT ) menawarkan berbagai metode penyulingan pengetahuan yang canggih dan memungkinkan Anda untuk merancang eksperimen (baru) hanya dengan mengedit file konfigurasi YAML deklaratif alih-alih kode Python. Bahkan ketika Anda perlu mengekstrak representasi menengah dalam model guru/siswa, Anda tidak perlu menerapkan kembali model, yang sering mengubah antarmuka ke depan, tetapi sebaliknya menentukan jalur modul dalam file YAML. Lihat makalah ini untuk detail lebih lanjut.

Selain distilasi pengetahuan, kerangka kerja ini membantu Anda merancang dan melakukan eksperimen pembelajaran mendalam umum ( tanpa pengkodean ) untuk studi pembelajaran mendalam yang dapat direproduksi. yaitu, ini memungkinkan Anda untuk melatih model tanpa guru hanya dengan mengecualikan entri guru dari file konfigurasi YAML deklaratif. Anda dapat menemukan contoh -contoh di bawah ini dan dalam konfigurasi/sampel/.

Saat Anda merujuk ke Torchdistill di koran Anda, silakan kutip kertas ini alih -alih repositori GitHub ini.
Jika Anda menggunakan Torchdistill sebagai bagian dari pekerjaan Anda, kutipan Anda dihargai dan memotivasi saya untuk mempertahankan dan meningkatkan kerangka kerja ini!

Dokumentasi

Anda dapat menemukan dokumentasi API dan proyek penelitian yang memanfaatkan torchdistill di https://yoshitomo-matsubara.net/torchdistill/

Forward Hook Manager

Menggunakan ForwardHookManager , Anda dapat mengekstrak representasi menengah dalam model tanpa memodifikasi antarmuka fungsi maju.
Contoh notebook ini akan memberi Anda gambaran yang lebih baik tentang penggunaan seperti distilasi pengetahuan dan analisis representasi perantara.

1 Eksperimen → 1 File Konfigurasi Pyyaml Deklaratif

Di Torchdistill , banyak komponen dan modul Pytorch diabstraksikan misalnya, model, dataset, pengoptimal, kerugian, dan banyak lagi! Anda dapat mendefinisikannya dalam file konfigurasi pyyaml deklaratif sehingga dapat dilihat sebagai ringkasan percobaan Anda, dan dalam banyak kasus, Anda tidak perlu menulis kode Python sama sekali . Lihatlah beberapa konfigurasi yang tersedia di konfigurasi/. Anda akan melihat modul apa yang diabstraksi dan bagaimana mereka didefinisikan dalam file konfigurasi pyyaml deklaratif untuk merancang percobaan.

Jika Anda ingin menggunakan modul Anda sendiri (model, fungsi kerugian, dataset, dll) dengan kerangka kerja ini, Anda dapat melakukannya tanpa mengedit kode dalam paket lokal torchdistill/ .
Lihat dokumentasi resmi dan diskusi untuk lebih jelasnya.

Tolok ukur

Akurasi validasi TOP-1 untuk ILSVRC 2012 (ImageNet)

Contoh

Kode yang dapat dieksekusi dapat ditemukan dalam contoh/ seperti

Klasifikasi Gambar: ImageNet (ILSVRC 2012), CIFAR-10, CIFAR-100, dll
Deteksi Objek: Coco 2017, dll
Segmentasi Semantik: Coco 2017, Pascal VOC, dll
Klasifikasi teks: lem, dll

Untuk CIFAR-10 dan CIFAR-100, beberapa model diimplementasikan dan tersedia sebagai model pretrained di Torchdistill . Rincian lebih lanjut dapat ditemukan di sini.

Beberapa model transformator disesuaikan dengan torchdistill untuk tugas lem tersedia di Hugging Face Model Hub. Contoh hasil benchmark lem dan detail dapat ditemukan di sini.

Contoh Google Colab

Contoh -contoh berikut tersedia dalam demo/. Perhatikan bahwa contoh -contoh ini untuk pengguna Google Colab dan kompatibel dengan Amazon Sagemaker Studio Lab. Biasanya, contoh/ akan menjadi referensi yang lebih baik jika Anda memiliki GPU sendiri.

CIFAR-10 dan CIFAR-100

Pelatihan tanpa model guru
Distilasi Pengetahuan

LEM

Fine-tuning tanpa model guru
Distilasi Pengetahuan

Contoh -contoh ini menulis file prediksi tes untuk Anda melihat kinerja pengujian di sistem leaderboard lem.

Hub Pytorch

Jika Anda menemukan model di hub pytorch atau repositori gitub yang mendukung hub pytorch, Anda dapat mengimpornya sebagai model guru/siswa hanya dengan mengedit file konfigurasi YAML deklaratif.

Misalnya, jika Anda menggunakan resnest-50 pretrained yang tersedia di HuggingFace/Pytorch-Image-Models (alias TIMM ) sebagai model guru untuk dataset Imagenet, Anda dapat mengimpor model melalui hub Pytorch dengan entri berikut dalam file konfigurasi YAML deklaratif Anda.

 models :
  teacher_model :
    key : ' resnest50d '
    repo_or_dir : ' huggingface/pytorch-image-models '
    kwargs :
      num_classes : 1000
      pretrained : True

Cara mengatur

Python> = 3.9
Pipenv (opsional)

Pasang oleh PIP/PIPENV

 pip3 install torchdistill
# or use pipenv
pipenv install torchdistill

Instal dari repositori ini (tidak disarankan)

 git clone https://github.com/yoshitomo-matsubara/torchdistill.git
cd torchdistill/
pip3 install -e .
# or use pipenv
pipenv install "-e ."

Masalah / Pertanyaan / Permintaan / Permintaan Tarik

Jangan ragu untuk membuat masalah jika Anda menemukan bug.
Jika Anda memiliki permintaan pertanyaan atau fitur, mulailah diskusi baru di sini. Silakan cari melalui masalah dan diskusi dan pastikan masalah/pertanyaan/permintaan Anda belum ditangani.

Permintaan tarik dipersilakan. Mulailah dengan masalah dan diskusikan solusi dengan saya daripada memulai dengan permintaan tarik.

Kutipan

Jika Anda menggunakan Torchdistill dalam riset Anda, silakan kutip makalah berikut:
[Kertas] [pracetak]

 @inproceedings { matsubara2021torchdistill ,
  title = { {torchdistill: A Modular, Configuration-Driven Framework for Knowledge Distillation} } ,
  author = { Matsubara, Yoshitomo } ,
  booktitle = { International Workshop on Reproducible Research in Pattern Recognition } ,
  pages = { 24--44 } ,
  year = { 2021 } ,
  organization = { Springer }
}

[Kertas] [OpenReview] [preprint]

 @inproceedings { matsubara2023torchdistill ,
  title = { {torchdistill Meets Hugging Face Libraries for Reproducible, Coding-Free Deep Learning Studies: A Case Study on NLP} } ,
  author = { Matsubara, Yoshitomo } ,
  booktitle = { Proceedings of the 3rd Workshop for Natural Language Processing Open Source Software (NLP-OSS 2023) } ,
  publisher = { Empirical Methods in Natural Language Processing } ,
  pages = { 153--164 } ,
  year = { 2023 }
}

Ucapan Terima Kasih

Proyek ini telah didukung oleh kredit OSS Travis CI dan program lisensi gratis Jetbrain (open source) masing -masing sejak November 2021 dan Juni 2022.

Referensi

? Pytorch/Visi/Referensi/Klasifikasi/
? Pytorch/Visi/Referensi/Deteksi/
? Pytorch/Visi/Referensi/Segmentasi/
? Huggingface/Transformers/Contoh/Pytorch/Klasifikasi Teks
? Geoffrey Hinton, Oriol Vinyals, Jeff Dean. "Distilling the Blneling in a Neural Network" (Deep Learning and Representation Learning Workshop: Neurips 2014)
? Adriana Romero, Nicolas Ballas, Samira Ebrahimi Kahou, Antoine Chassang, Carlo Gatta, Yoshua Bengio. "Fitnets: Petunjuk untuk Jaring Deep Thin" (ICLR 2015)
? Junho Yim, Donggyu Joo, Jihoon Bae, Junmo Kim. "Hadiah dari Distilasi Pengetahuan: Optimalisasi Cepat, Minimalisasi Jaringan dan Pembelajaran Transfer" (CVPR 2017)
? Sergey Zagoruyko, Nikos Komodakis. "Memperhatikan lebih banyak perhatian: Meningkatkan kinerja jaringan saraf konvolusional melalui transfer perhatian" (ICLR 2017)
? Nikolaos Passalis, Anastasios Tefas. "Mempelajari representasi mendalam dengan transfer pengetahuan probabilistik" (ECCV 2018)
? Jangho Kim, Taman Seonguk, Nojun Kwak. "Jaringan kompleks parafrase: kompresi jaringan melalui transfer faktor" (Neurips 2018)
? Byeongho Heo, Minsik Lee, Sangdoo Yun, Jin Young Choi. "Transfer Pengetahuan Melalui Distilasi Batas Aktivasi Dibentuk oleh Neuron Tersembunyi" (AAAI 2019)
? Tong He, Chunhua Shen, Zhi Tian, Dong Gong, Sun Changming, Youliang Yan. "Adaptasi Pengetahuan untuk Segmentasi Semantik yang Efisien" (CVPR 2019)
? Wonpyo Park, Dongju Kim, Yan Lu, Minsu Cho. "Distilasi Pengetahuan Relasional" (CVPR 2019)
? Sungsoo Ahn, Shell Xu Hu, Andreas Damianou, Neil D. Lawrence, Zhenwen Dai. "Distilasi Informasi Variasional untuk Transfer Pengetahuan" (CVPR 2019)
? Yoshitomo Matsubara, Sabur Baidya, Davide Callegaro, Marco Levorato, Sameer Singh. "Jaringan saraf yang terdalam terpisah untuk sistem real-time yang dibantu oleh Edge" (Lokakarya tentang Topik Hot dalam Analisis Video dan Tepi Cerdas: Mobicom 2019)
? Baoyun Peng, Xiao Jin, Jiaheng Liu, Dongsheng Li, Yichao Wu, Yu Liu, Shunfeng Zhou, Zhaoning Zhang. "Korelasi Korelasi untuk Distilasi Pengetahuan" (ICCV 2019)
? Frederick Tung, Greg Mori. "Distilasi pengetahuan pemeliharaan kesamaan" (ICCV 2019)
? Yonglong Tian, Dilip Krishnan, Phillip Isola. "Distilasi Representasi Kontras" (ICLR 2020)
? Yoshitomo Matsubara, Marco Levorato. "Kompresi saraf dan penyaringan untuk deteksi objek real-time yang dibantu tepi dalam jaringan yang ditantang" (ICPR 2020)
? Li Yuan, Francis Ehtay, Guilin Li, Tao Wang, Jiashi Feng. "Meninjau kembali distilasi pengetahuan melalui label Smoothing regularisasi" (CVPR 2020)
? Guodong Xu, Ziwei Liu, Xiaoxiao Li, Chen Change Loy. "Distilasi Pengetahuan Bertemu dengan Perlengkapan Sendiri" (ECCV 2020)
? Youcai Zhang, Zhonghao Lan, Yuchen Dai, Fangao Zeng, Yan Bai, Jie Chang, Yichen Wei. "Distilasi Adaptif Prime-Ware" (ECCV 2020)
? Penguang Chen, Shu Liu, Hengshuang Zhao, Jiaya Jia. "Pengetahuan Distilling Via Knowledge" (CVPR 2021)
? Li Liu, Qingle Huang, Sihao Lin, Hongwei Xie, Bing Wang, Xiaojun Chang, Xiaodan Liang. "Menjelajahi korelasi antar saluran untuk distilasi pengetahuan yang terpelihara keanekaragaman" (ICCV 2021)
? Tao Huang, Shan You, Fei Wang, Chen Qian, Chang Xu. "Distilasi pengetahuan dari guru yang lebih kuat" (Neurips 2022)
? Roy Miles, Krystian Mikolajczyk. "Memahami Peran Proyektor dalam Distilasi Pengetahuan" (AAAI 2024)
? Shangquan Sun, Wenqi Ren, Jingzhi Li, Rui Wang, Xiaochun Cao. "Standardisasi logit dalam distilasi pengetahuan" (CVPR 2024)