torchdistill Download - ดาวน์โหลดซอร์สโค้ด torchdistill

torchdistill

ซอร์สโค้ดอื่น ๆ

PyTorch 2.5 support, model migrations, end of Python 3.8 support

ดาวน์โหลด

Torchdistill: เฟรมเวิร์กแบบแยกส่วนที่ขับเคลื่อนด้วยการกำหนดค่าสำหรับการกลั่นความรู้

Torchdistill (เดิมคือ KDKIT ) นำเสนอวิธีการกลั่นความรู้ที่ทันสมัยที่หลากหลายและช่วยให้คุณสามารถออกแบบ (ใหม่) การทดลองง่ายๆโดยการแก้ไขไฟล์กำหนดค่า YAML ที่ประกาศแทนรหัส Python แม้ว่าคุณจะต้องแยกการเป็นตัวแทนระดับกลางในโมเดลครู/นักเรียนคุณ ไม่ จำเป็นต้องปรับปรุงโมเดลใหม่ซึ่งมักจะเปลี่ยนอินเทอร์เฟซของไปข้างหน้า แต่แทนที่จะระบุเส้นทางโมดูลในไฟล์ YAML อ้างถึงเอกสารเหล่านี้สำหรับรายละเอียดเพิ่มเติม

นอกเหนือจากการกลั่นความรู้เฟรมเวิร์กนี้ยังช่วยให้คุณออกแบบและทำการทดลองการเรียนรู้เชิงลึกทั่วไป ( โดยไม่ต้องเขียนโค้ด ) สำหรับการศึกษาการเรียนรู้เชิงลึกที่ทำซ้ำได้ เช่นมันช่วยให้คุณสามารถฝึกอบรมโมเดลโดยไม่มีครูเพียงแค่ไม่รวมรายการครูจากไฟล์กำหนดค่า Yaml ที่ประกาศ คุณสามารถค้นหาตัวอย่างด้านล่างและใน configs/sample/

เมื่อคุณอ้างถึง Torchdistill ในกระดาษของคุณโปรดอ้างอิงเอกสารเหล่านี้แทนที่เก็บ GitHub นี้
หากคุณใช้ Torchdistill เป็นส่วนหนึ่งของงานของคุณการอ้างอิงของคุณจะได้รับการชื่นชมและกระตุ้นให้ฉันรักษาและอัพเกรดกรอบนี้!

เอกสาร

คุณสามารถค้นหาเอกสารและโครงการวิจัย API ที่ใช้ประโยชน์จาก Torchdistill ได้ที่ https://yoshitomo-matsubara.net/torchdistill/

Forward Hook Manager

การใช้ ForwardHookManager คุณสามารถแยกการแสดงระดับกลางในโมเดลโดยไม่ต้องแก้ไขอินเทอร์เฟซของฟังก์ชันไปข้างหน้า
สมุดบันทึกตัวอย่างนี้จะช่วยให้คุณมีความคิดที่ดีขึ้นเกี่ยวกับการใช้งานเช่นการกลั่นความรู้และการวิเคราะห์การเป็นตัวแทนระดับกลาง

1 การทดลอง→ 1 ไฟล์กำหนดค่า pyyaml declarative

ใน Torchdistill ส่วนประกอบและโมดูล Pytorch จำนวนมากนั้นเป็นนามธรรมเช่นโมเดลชุดข้อมูลชุดเครื่องมือเพิ่มประสิทธิภาพการสูญเสียและอื่น ๆ ! คุณสามารถกำหนดไว้ในไฟล์กำหนดค่า Pyyaml ที่ประกาศเพื่อให้สามารถมองเห็นได้ว่าเป็นบทสรุปของการทดลองของคุณและในหลายกรณีคุณ ไม่จำเป็นต้องเขียนรหัส Python เลย ดูการกำหนดค่าบางอย่างที่มีอยู่ใน configs/ คุณจะเห็นโมดูลใดที่เป็นนามธรรมและวิธีการกำหนดไว้ในไฟล์กำหนดค่า pyyaml ที่ประกาศเพื่อออกแบบการทดลอง

หากคุณต้องการใช้โมดูลของคุณเอง (รุ่นฟังก์ชั่นการสูญเสียชุดข้อมูล ฯลฯ ) กับเฟรมเวิร์กนี้คุณสามารถทำได้โดยไม่ต้องแก้ไขรหัสในแพ็คเกจท้องถิ่น torchdistill/
ดูเอกสารอย่างเป็นทางการและการอภิปรายสำหรับรายละเอียดเพิ่มเติม

เกณฑ์มาตรฐาน

ความแม่นยำในการตรวจสอบความถูกต้องของ TOP-1 สำหรับ ILSVRC 2012 (ImageNet)

ตัวอย่าง

รหัสปฏิบัติการสามารถพบได้ในตัวอย่าง/ เช่น

การจำแนกภาพ: Imagenet (ILSVRC 2012), CIFAR-10, CIFAR-100 ฯลฯ
การตรวจจับวัตถุ: Coco 2017 ฯลฯ
การแบ่งส่วนความหมาย: Coco 2017, Pascal VOC ฯลฯ
การจำแนกประเภทข้อความ: กาว ฯลฯ

สำหรับ CIFAR-10 และ CIFAR-100 บางรุ่นได้รับการปรับปรุงใหม่และมีให้เป็นรุ่นที่ผ่านการฝึกอบรมใน Torchdistill รายละเอียดเพิ่มเติมสามารถดูได้ที่นี่

หม้อแปลงบางรุ่นปรับแต่งโดย Torchdistill สำหรับงานกาวมีให้บริการที่ Hugging Face Model Hub ตัวอย่างมาตรฐานกาวและรายละเอียดสามารถดูได้ที่นี่

ตัวอย่าง Google Colab

ตัวอย่างต่อไปนี้มีอยู่ในการสาธิต/ โปรดทราบว่าตัวอย่างเหล่านี้มีไว้สำหรับผู้ใช้ Google Colab และเข้ากันได้กับ Amazon Sagemaker Studio Lab โดยปกติตัวอย่าง/ จะเป็นข้อมูลอ้างอิงที่ดีกว่าหากคุณมี GPU ของคุณเอง

CIFAR-10 และ CIFAR-100

การฝึกอบรมโดยไม่มีนางแบบครู
การกลั่นความรู้

กาว

ปรับแต่งโดยไม่มีนางแบบครู
การกลั่นความรู้

ตัวอย่างเหล่านี้เขียนไฟล์การทำนายการทดสอบเพื่อให้คุณเห็นประสิทธิภาพการทดสอบที่ระบบลีดเดอร์บอร์ดกาว

ฮับ Pytorch

หากคุณพบโมเดลบน Pytorch Hub หรือ GitHub Repositories ที่สนับสนุน Pytorch Hub คุณสามารถนำเข้าเป็นรุ่นครู/นักเรียนได้ง่ายๆโดยการแก้ไขไฟล์กำหนดค่า YAML ที่ประกาศ

เช่นถ้าคุณใช้ resnest-50 ที่ได้รับการฝึกฝนไว้ใน HuggingFace/Pytorch-Image-Models (AKA TIMM ) เป็นแบบจำลองครูสำหรับชุดข้อมูล Imagenet คุณสามารถนำเข้าโมเดลผ่าน Pytorch Hub พร้อมรายการต่อไปนี้

 models :
  teacher_model :
    key : ' resnest50d '
    repo_or_dir : ' huggingface/pytorch-image-models '
    kwargs :
      num_classes : 1000
      pretrained : True

วิธีการตั้งค่า

Python> = 3.9
PIPENV (ไม่บังคับ)

ติดตั้งโดย pip/pipenv

 pip3 install torchdistill
# or use pipenv
pipenv install torchdistill

ติดตั้งจากที่เก็บนี้ (ไม่แนะนำ)

 git clone https://github.com/yoshitomo-matsubara/torchdistill.git
cd torchdistill/
pip3 install -e .
# or use pipenv
pipenv install "-e ."

ปัญหา / คำถาม / คำขอ / คำขอดึง

อย่าลังเลที่จะสร้างปัญหาหากคุณพบข้อผิดพลาด
หากคุณมีคำถามหรือคำขอคุณลักษณะให้เริ่มการสนทนาใหม่ที่นี่ โปรดค้นหาผ่านปัญหาและการอภิปรายและตรวจสอบให้แน่ใจว่าปัญหา/คำถาม/คำขอของคุณยังไม่ได้รับการแก้ไข

ยินดีต้อนรับคำขอดึง โปรดเริ่มต้นด้วยปัญหาและหารือเกี่ยวกับวิธีแก้ปัญหากับฉันแทนที่จะเริ่มด้วยคำขอดึง

การอ้างอิง

หากคุณใช้ Torchdistill ในการวิจัยของคุณโปรดอ้างอิงเอกสารต่อไปนี้:
[กระดาษ] [preprint]

 @inproceedings { matsubara2021torchdistill ,
  title = { {torchdistill: A Modular, Configuration-Driven Framework for Knowledge Distillation} } ,
  author = { Matsubara, Yoshitomo } ,
  booktitle = { International Workshop on Reproducible Research in Pattern Recognition } ,
  pages = { 24--44 } ,
  year = { 2021 } ,
  organization = { Springer }
}

[กระดาษ] [OpenReview] [Preprint]

 @inproceedings { matsubara2023torchdistill ,
  title = { {torchdistill Meets Hugging Face Libraries for Reproducible, Coding-Free Deep Learning Studies: A Case Study on NLP} } ,
  author = { Matsubara, Yoshitomo } ,
  booktitle = { Proceedings of the 3rd Workshop for Natural Language Processing Open Source Software (NLP-OSS 2023) } ,
  publisher = { Empirical Methods in Natural Language Processing } ,
  pages = { 153--164 } ,
  year = { 2023 }
}

กิตติกรรมประกาศ

โครงการนี้ได้รับการสนับสนุนโดยเครดิต OSS ของ Travis CI และโปรแกรมใบอนุญาตฟรีของ Jetbrain (โอเพ่นซอร์ส) ตั้งแต่เดือนพฤศจิกายน 2564 และมิถุนายน 2565 ตามลำดับ

การอ้างอิง

- Pytorch/Vision/Reference/การจำแนก/
- Pytorch/Vision/References/Detection/
- Pytorch/Vision/References/Segmentation/
- huggingface/transformers/ตัวอย่าง/pytorch/classification
- Geoffrey Hinton, Oriol Vinyals, Jeff Dean "กลั่นความรู้ในเครือข่ายประสาท" (การเรียนรู้อย่างลึกซึ้งและการเป็นตัวแทนการประชุมเชิงปฏิบัติการ: Neurips 2014)
- Adriana Romero, Nicolas Ballas, Samira Ebrahimi Kahou, Antoine Chassang, Carlo Gatta, Yoshua Bengio "Fitnets: คำแนะนำสำหรับอวนลึกบาง ๆ " (ICLR 2015)
- Junho Yim, Donggyu Joo, Jihoon Bae, Junmo Kim "ของขวัญจากการกลั่นความรู้: การเพิ่มประสิทธิภาพอย่างรวดเร็ว, การลดเครือข่ายและการถ่ายโอนการเรียนรู้" (CVPR 2017)
- Sergey Zagoruyko, Nikos Komodakis "การให้ความสนใจกับความสนใจมากขึ้น: การปรับปรุงประสิทธิภาพของเครือข่ายประสาทแบบ Convolutional ผ่านการถ่ายโอนความสนใจ" (ICLR 2017)
- Nikolaos Passalis, Anastasios Tefas "เรียนรู้การเป็นตัวแทนอย่างลึกซึ้งด้วยการถ่ายโอนความรู้ที่น่าจะเป็น" (ECCV 2018)
- Jangho Kim, Seonguk Park, Nojun Kwak "เครือข่ายการถอดความที่ซับซ้อน: การบีบอัดเครือข่ายผ่านการถ่ายโอนปัจจัย" (Neurips 2018)
- Byeongho Heo, Minsik Lee, Sangdoo Yun, Jin Young Choi "การถ่ายโอนความรู้ผ่านการกลั่นขอบเขตการเปิดใช้งานที่เกิดจากเซลล์ประสาทที่ซ่อนอยู่" (AAAI 2019)
- ตองเขา, ชุนฮัวชิน, จีเทียน, ดงกง, การเปลี่ยนแปลงของดวงอาทิตย์, Youliang Yan "การปรับความรู้สำหรับการแบ่งส่วนความหมายที่มีประสิทธิภาพ" (CVPR 2019)
- Wonpyo Park, Dongju Kim, Yan Lu, Minsu Cho "การกลั่นความรู้เชิงสัมพันธ์" (CVPR 2019)
- Sungsoo Ahn, Shell Xu Hu, Andreas Damianou, Neil D. Lawrence, Zhenwen Dai "การกลั่นข้อมูล variational สำหรับการถ่ายโอนความรู้" (CVPR 2019)
- Yoshitomo Matsubara, Sabur Baidya, Davide Callegaro, Marco Levorato, Sameer Singh "เครือข่ายประสาทลึกแยกส่วนสำหรับระบบแบบเรียลไทม์ช่วยขอบ" (เวิร์กช็อปเกี่ยวกับหัวข้อร้อนในการวิเคราะห์วิดีโอและขอบอัจฉริยะ: Mobicom 2019)
- Baoyun Peng, Xiao Jin, Jiaheng Liu, Dongsheng Li, Yichao Wu, Yu Liu, Shunfeng Zhou, Zhaoning Zhang "ความสัมพันธ์สหสัมพันธ์สำหรับการกลั่นความรู้" (ICCV 2019)
- Frederick Tung, Greg Mori "การกลั่นความรู้ที่คล้ายคลึงกัน" (ICCV 2019)
- Yonglong Tian, Dilip Krishnan, Phillip Isola "การกลั่นด้วยความคมชัด" (ICLR 2020)
- Yoshitomo Matsubara, Marco Levorato "การบีบอัดระบบประสาทและการกรองสำหรับการตรวจจับวัตถุแบบเรียลไทม์แบบช่วยขอบในเครือข่ายที่ท้าทาย" (ICPR 2020)
- Li Yuan, Francis Ehtay, Guilin Li, Tao Wang, Jiashi Feng "การทบทวนการกลั่นความรู้ผ่านฉลากทำให้การปรับสภาพเป็นปกติ" (CVPR 2020)
- Guodong Xu, Ziwei Liu, Xiaoxiao Li, Chen Change Loy "การกลั่นความรู้ตรงตามการดูแลตนเอง" (ECCV 2020)
- Youcai Zhang, Zhonghao Lan, Yuchen Dai, Fangao Zeng, Yan Bai, Jie Chang, Yichen Wei "Prime-Adaptive Distillation" (ECCV 2020)
- Pengguang Chen, Shu Liu, Hengshuang Zhao, Jiaya Jia "การกลั่นความรู้ผ่านการทบทวนความรู้" (CVPR 2021)
- Li Liu, Qingle Huang, Sihao Lin, Hongwei Xie, Bing Wang, Xiaojun Chang, Xiaodan Liang "การสำรวจความสัมพันธ์ระหว่างช่องทางสำหรับการกลั่นความรู้ที่ได้รับการอนุรักษ์ความหลากหลาย" (ICCV 2021)
- Tao Huang, Shan You, Fei Wang, Chen Qian, Chang Xu "การกลั่นความรู้จากครูที่แข็งแกร่งขึ้น" (Neurips 2022)
- Roy Miles, Krystian Mikolajczyk "ทำความเข้าใจบทบาทของโปรเจ็กเตอร์ในการกลั่นความรู้" (AAAI 2024)
- Shangquan Sun, Wenqi Ren, Jingzhi Li, Rui Wang, Xiaochun Cao "การจัดมาตรฐาน logit ในการกลั่นความรู้" (CVPR 2024)