تنزيل torchdistill - تنزيل رمز المصدر torchdistill

torchdistill

شفرة المصدر الأخرى

PyTorch 2.5 support, model migrations, end of Python 3.8 support

تنزيل

Torchdistill: إطار عمل وحدني مدفوع بالتكوين لتقطير المعرفة

يقدم Torchdistill (سابقًا KDKIT ) العديد من أساليب التقطير المعرفة الحديثة ويمكّنك من تصميم تجارب (جديدة) ببساطة عن طريق تحرير ملف تكوين YAML التصريحي بدلاً من رمز Python. حتى عندما تحتاج إلى استخراج التمثيلات المتوسطة في نماذج المعلم/الطلاب ، فلن تحتاج إلى إعادة تنفيذ النماذج ، والتي غالبًا ما تغير واجهة الأمام ، ولكن بدلاً من ذلك حدد مسار (مسارات) الوحدة النمطية في ملف YAML. الرجوع إلى هذه الأوراق لمزيد من التفاصيل.

بالإضافة إلى تقطير المعرفة ، يساعدك هذا الإطار في تصميم وأجر تجارب تعليمية عميقة عامة ( بدون ترميز ) لدراسات التعلم العميق القابلة للتكرار. أي أنه يمكّنك من تدريب النماذج بدون معلمين ببساطة عن طريق استبعاد إدخالات المعلمين من ملف تكوين YAML التصريح. يمكنك العثور على مثل هذه الأمثلة أدناه وفي التكوينات/عينة/.

عندما تشير إلى Torchdistill في ورقتك ، يرجى الاستشهاد بهذه الأوراق بدلاً من مستودع GitHub.
إذا كنت تستخدم Torchdistill كجزء من عملك ، فسيتم تقدير الاقتباس الخاص بك ويحفزني على الحفاظ على هذا الإطار وترقيته!

الوثائق

يمكنك العثور على مشاريع وثيقة API والبحث التي تستفيد من torchdistill على https://yoshitomo-matsubara.net/torchdistill/

مدير الخطاف إلى الأمام

باستخدام ForwardHookManager ، يمكنك استخراج تمثيلات وسيطة في النموذج دون تعديل واجهة وظيفتها الأمامية.
سيعطيك دفتر الملاحظات هذا المثال فكرة أفضل عن الاستخدام مثل تقطير المعرفة وتحليل التمثيلات الوسيطة.

1 تجربة → 1 ملف تكوين pyyaml التصريحي

في Torchdistill ، يتم استخلاص العديد من المكونات ووحدات Pytorch على سبيل المثال ، على سبيل المثال ، نماذج ، مجموعات بيانات ، مُحسّنات ، خسائر ، وأكثر من ذلك! يمكنك تعريفها في ملف تكوين Pyyaml التصريحي بحيث يمكن اعتباره ملخصًا لتجربتك ، وفي كثير من الحالات ، لن تحتاج إلى كتابة رمز Python على الإطلاق . ألقِ نظرة على بعض التكوينات المتاحة في التكوينات/. سترى الوحدات النمطية المخصصة وكيف يتم تعريفها في ملف تكوين Pyyaml التصريحي لتصميم تجربة.

إذا كنت ترغب في استخدام الوحدات النمطية الخاصة بك (النماذج ، وظائف الخسارة ، مجموعات البيانات ، إلخ) مع هذا الإطار ، يمكنك القيام بذلك دون تحرير رمز في الحزمة المحلية torchdistill/ .
راجع الوثائق والمناقشات الرسمية لمزيد من التفاصيل.

المعايير

أعلى 1 دقة التحقق من الصحة لـ ILSVRC 2012 (ImageNet)

أمثلة

يمكن العثور على الرمز القابل للتنفيذ في أمثلة/ مثل

تصنيف الصور: ImageNet (ILSVRC 2012) ، CIFAR-10 ، CIFAR-100 ، إلخ
اكتشاف الكائن: Coco 2017 ، إلخ
التجزئة الدلالية: Coco 2017 ، Pascal Voc ، إلخ
تصنيف النص: الغراء ، إلخ

بالنسبة إلى CIFAR-10 و CIFAR-100 ، يتم إعادة تنفيذ بعض النماذج ومتاحة كموديلات مسبقة في Torchdistill . يمكن العثور على مزيد من التفاصيل هنا.

تتوفر بعض نماذج المحولات التي تم ضبطها بواسطة Torchdistill لمهام الغراء في Hugging Face Model Hub. عينة من نتائج قياس الغراء والتفاصيل يمكن العثور عليها هنا.

أمثلة Google Colab

الأمثلة التالية متوفرة في العرض التوضيحي/. لاحظ أن هذه الأمثلة مخصصة لمستخدمي Google Colab ومتوافق مع مختبر Amazon Sagemaker Studio. عادةً ما تكون الأمثلة/ ستكون مرجعًا أفضل إذا كان لديك وحدة معالجة الرسومات الخاصة بك.

CIFAR-10 و CIFAR-100

التدريب بدون نماذج المعلمين
تقطير المعرفة

غراء

صقله بدون نماذج للمعلمين
تقطير المعرفة

تكتب هذه الأمثلة ملفات التنبؤ الاختبار لكي ترى أداء الاختبار في نظام Glue Leaderboard.

PYTORCH HUB

إذا وجدت نماذج على Pytorch Hub أو مستودعات Github التي تدعم Pytorch Hub ، فيمكنك استيرادها كطرازات معلم/طالب ببساطة عن طريق تحرير ملف تكوين YAML التصريحي.

على سبيل المثال ، إذا كنت تستخدم RESNEST-50 متاحًا في عانق Pytorch-image-models (المعروف أيضًا باسم TIMM ) كنموذج مدرس لمجموعة بيانات ImageNet ، يمكنك استيراد النموذج عبر Pytorch Hub مع الإدخال التالي في ملف تكوين YAML التعريفي الخاص بك.

 models :
  teacher_model :
    key : ' resnest50d '
    repo_or_dir : ' huggingface/pytorch-image-models '
    kwargs :
      num_classes : 1000
      pretrained : True

كيفية الإعداد

بيثون> = 3.9
pipenv (اختياري)

تثبيت بواسطة PIP/PIPENV

 pip3 install torchdistill
# or use pipenv
pipenv install torchdistill

التثبيت من هذا المستودع (غير موصى به)

 git clone https://github.com/yoshitomo-matsubara/torchdistill.git
cd torchdistill/
pip3 install -e .
# or use pipenv
pipenv install "-e ."

المشكلات / الأسئلة / الطلبات / السحب

لا تتردد في إنشاء مشكلة إذا وجدت خطأ.
إذا كان لديك سؤال أو طلب ميزة ، فابدأ مناقشة جديدة هنا. يرجى البحث من خلال القضايا والمناقشات والتأكد من عدم معالجة مشكلتك/سؤالك/طلبك بعد.

طلبات السحب موضع ترحيب. يرجى البدء بمشكلة ومناقشة الحلول معي بدلاً من البدء بطلب سحب.

اقتباس

إذا كنت تستخدم Torchdistill في بحثك ، فيرجى الاستشهاد بالأوراق التالية:
[ورقة] [preprint]

 @inproceedings { matsubara2021torchdistill ,
  title = { {torchdistill: A Modular, Configuration-Driven Framework for Knowledge Distillation} } ,
  author = { Matsubara, Yoshitomo } ,
  booktitle = { International Workshop on Reproducible Research in Pattern Recognition } ,
  pages = { 24--44 } ,
  year = { 2021 } ,
  organization = { Springer }
}

[ورقة] [OpenReview] [preprint]

 @inproceedings { matsubara2023torchdistill ,
  title = { {torchdistill Meets Hugging Face Libraries for Reproducible, Coding-Free Deep Learning Studies: A Case Study on NLP} } ,
  author = { Matsubara, Yoshitomo } ,
  booktitle = { Proceedings of the 3rd Workshop for Natural Language Processing Open Source Software (NLP-OSS 2023) } ,
  publisher = { Empirical Methods in Natural Language Processing } ,
  pages = { 153--164 } ,
  year = { 2023 }
}

شكر وتقدير

تم دعم هذا المشروع من قبل ائتمانات OSS من Travis CI وبرامج الترخيص المجانية لـ Jetbrain (المصدر المفتوح) منذ نوفمبر 2021 ويونيو 2022 ، على التوالي.

مراجع

؟ Pytorch/الرؤية/المراجع/التصنيف/
؟ pytorch/الرؤية/المراجع/الكشف/
؟ Pytorch/الرؤية/المراجع/التجزئة/
؟ Luggingface/Transformers/Ampressings/Pytorch/Text-Text
؟ جيفري هينتون ، أوريول فيليالز ، جيف دين. "تقطير المعرفة في شبكة عصبية" (ورشة تعلم التعلم العميق والتمثيل: Neurips 2014)
؟ أدريانا روميرو ، نيكولاس بالاس ، سميرا إبراهيمي كاهو ، أنطوان تشاسانغ ، كارلو جاتا ، يوشوا بينجيو. "FitNets: تلميحات للشبكات العميقة الرقيقة" (ICLR 2015)
؟ Junho Yim ، Donggyu Joo ، Jihoon Bae ، Junmo Kim. "هدية من تقطير المعرفة: التحسين السريع ، وتقليل الشبكة وتعلم النقل" (CVPR 2017)
؟ سيرجي زاجورويكو ، نيكوس كومودياكيس. "إيلاء المزيد من الاهتمام بالاهتمام: تحسين أداء الشبكات العصبية التلافيفية عن طريق نقل الانتباه" (ICLR 2017)
؟ Nikolaos Passalis ، Anastasios Tefas. "تعلم تمثيلات عميقة مع نقل المعرفة الاحتمالية" (ECCV 2018)
؟ Jangho Kim ، Seonguk Park ، Nojun Kwak. "إعادة صياغة الشبكة المعقدة: ضغط الشبكة عبر نقل العوامل" (Neups 2018)
؟ Byeongho Heo ، Minsik Lee ، Sangdoo Yun ، Jin Young Choi. "نقل المعرفة عن طريق تقطير حدود التنشيط التي تشكلتها الخلايا العصبية المخفية" (AAAI 2019)
؟ تونغ هو ، تشونهوا شين ، تشاي تيان ، دونغ غونغ ، تشانغمينغ صن ، أنت. "تكيف المعرفة للتجزئة الدلالية الفعالة" (CVPR 2019)
؟ وينبيو بارك ، دونغجو كيم ، يان لو ، مينسو تشو. "تقطير المعرفة العلائقية" (CVPR 2019)
؟ Sungsoo Ahn ، Shell Xu Hu ، Andreas Damianou ، Neil D. Lawrence ، Zhenwen Dai. "تقطير المعلومات التباين لنقل المعرفة" (CVPR 2019)
؟ Yoshitomo Matsubara ، Sabur Baidya ، Davide Callegaro ، Marco Levorato ، Sameer Singh. "تقسيم الشبكات العصبية العميقة للأنظمة الفعلية بمساعدة الحافة" (ورشة عمل حول المواضيع الساخنة في تحليلات الفيديو والحواف الذكية: Mobicom 2019)
؟ Baoyun Peng ، Xiao Jin ، Jiaheng Liu ، Dongsheng Li ، Yichao Wu ، Yu Liu ، Shunfeng Zhou ، Zhaoning Zhang. "ترابط الارتباط لتقطير المعرفة" (ICCV 2019)
؟ فريدريك تونغ ، جريج موري. "تقطير المعرفة المحافظة على التشابه" (ICCV 2019)
؟ Yonglong Tian ، Dilip Krishnan ، Phillip Isola. "تقطير تمثيل متناقض" (ICLR 2020)
؟ يوشيتومو ماتسوبارا ، ماركو ليفوراتو. "الضغط العصبي والتصفية للكشف عن الكائنات في الوقت الفعلي بمساعدة الحافة في الشبكات التي تحدى" (ICPR 2020)
؟ لي يوان ، فرانسيس إيهتاي ، جولن لي ، تاو وانغ ، جياشى فنغ. "إعادة النظر في تقطير المعرفة عن طريق تنظيم تجانس الملصقات" (CVPR 2020)
؟ Guodong Xu ، Ziwei Liu ، Xiaoxiao Li ، Chen Change Loy. "تقطير المعرفة يجتمع الإشراف الذاتي" (ECCV 2020)
؟ Youcai Zhang ، Zhonghao Lan ، Yuchen Dai ، Fangao Zeng ، Yan Bai ، Jie Chang ، Yichen Wei. "التقطير التكيفي الوعائي" (ECCV 2020)
؟ Pengguang Chen ، Shu Liu ، Hengshuang Zhao ، Jiaya Jia. "تقطير المعرفة عبر مراجعة المعرفة" (CVPR 2021)
؟ Li Liu ، Qingle Huang ، Sihao Lin ، Hongwei Xie ، Bing Wang ، Xiaojun Chang ، Xiaodan Liang. "استكشاف ارتباط بين القنوات للتقطير المعرفة المحفوظ للتنوع" (ICCV 2021)
؟ تاو هوانغ ، شان أنت ، فاي وانغ ، تشن تشيان ، تشانغ شو. "تقطير المعرفة من معلم أقوى" (Neups 2022)
؟ روي مايلز ، Krystian Mikolajczyk. "فهم دور جهاز العرض في تقطير المعرفة" (AAAI 2024)
؟ Shangquan Sun ، Wenqi Ren ، Jingzhi Li ، Rui Wang ، Xiaochun Cao. "توحيد السجل في تقطير المعرفة" (CVPR 2024)