torchdistill下载torchdistill源代码下载

torchdistill

其他源码

PyTorch 2.5 support, model migrations, end of Python 3.8 support

下载

Torchdistill：用于知识蒸馏的模块化，配置驱动的框架

Torchdistill （以前是KDKIT ）提供了各种最先进的知识蒸馏方法，并使您可以通过编辑声明性YAML配置文件而不是Python代码来设计（新）实验。即使您需要在教师/学生模型中提取中间表示形式，您也无需重新实现模型，而这些模型通常会更改向前的界面，而是指定YAML文件中的模块路径。有关更多详细信息，请参阅这些论文。

除了知识蒸馏外，该框架还可以帮助您设计和执行一般的深度学习实验（无需编码），以进行可再现的深度学习研究。即，它使您可以通过将教师条目排除在声明性的YAML配置文件中，而无需老师培训模型。您可以在下面和configs/sample/中找到此类示例。

当您在论文中提到Torchdistill时，请引用这些论文而不是此GitHub存储库。
如果您将Torchdistill用作工作的一部分，那么您的引文将受到赞赏，并激励我维护和升级此框架！

文档

您可以在https://yoshitomo-matsubara.net/torchdistill/上找到利用Torchdistill的API文档和研究项目

前向钩管理器

使用ForwardHookManager ，您可以在模型中提取中间表示，而无需修改其正向函数的接口。
本示例笔记本将使您更好地了解使用诸如知识蒸馏和中间表示的分析。

1个实验→1个声明的PYYAML配置文件

在Torchdistill中，许多组件和Pytorch模块都是抽象的，例如，模型，数据集，优化器，损失等等！您可以在声明的PYYAML配置文件中定义它们，以便可以将其视为实验的摘要，在许多情况下，您将根本不需要编写Python代码。查看Configs/中可用的一些配置。您会看到哪些模块抽象了，以及如何在声明的PYYAML配置文件中定义它们以设计实验。

如果您想使用此框架使用自己的模块（模型，损失功能，数据集等），则可以在本地软件包torchdistill/中编辑代码/。
有关更多详细信息，请参见官方文档和讨论。

基准

ILSVRC 2012（Imagenet）的TOP-1验证精度

例子

可执行代码可以在示例/中找到

图像分类：Imagenet（ILSVRC 2012），CIFAR-10，CIFAR-100等
对象检测：可可2017等
语义细分：Coco 2017，Pascal VOC等
文本分类：胶水等

对于CIFAR-10和CIFAR-100，某些模型将重新实现，并在Torchdistill中作为验证模型可用。可以在此处找到更多详细信息。

Hugging Face Model Hub可以使用一些由Torchdistill微调用于胶水任务的变压器模型。样品胶基准的结果和详细信息可以在此处找到。

Google Colab示例

以下示例在演示中可用。请注意，这些示例适用于Google Colab用户，并且与Amazon Sagemaker Studio Lab兼容。通常，如果您拥有自己的GPU，则示例/将是更好的参考。

CIFAR-10和CIFAR-100

没有老师模型的培训
知识蒸馏

胶水

没有老师模型的微调
知识蒸馏

这些示例写出了测试预测文件，供您查看胶排行榜系统中的测试性能。

Pytorch枢纽

如果您在支持Pytorch Hub的Pytorch Hub或GitHub存储库上找到模型，则只需编辑声明性的YAML配置文件即可将它们导入教师/学生模型。

例如，如果您使用huggingface/pytorch-image-models（aka timm ）中可用的Resnest-50作为Imagenet数据集的教师模型，则可以通过Pytorch Hub在您的声明性YAML配置文件中使用以下条目导入该模型。

 models :
  teacher_model :
    key : ' resnest50d '
    repo_or_dir : ' huggingface/pytorch-image-models '
    kwargs :
      num_classes : 1000
      pretrained : True

如何设置

Python> = 3.9
PIPENV（可选）

通过PIP/PIPENV安装

 pip3 install torchdistill
# or use pipenv
pipenv install torchdistill

从此存储库中安装（不建议）

 git clone https://github.com/yoshitomo-matsubara/torchdistill.git
cd torchdistill/
pip3 install -e .
# or use pipenv
pipenv install "-e ."

问题 /问题 /请求 /拉请求

如果找到错误，请随时创建问题。
如果您有问题或功能请求，请在此处开始新的讨论。请搜索问题和讨论，并确保尚未解决您的问题/问题/请求。

欢迎拉动请求。请从问题开始，并与我讨论解决方案，而不是从拉动请求开始。

引用

如果您在研究中使用Torchdistill ，请引用以下论文：
[纸] [preprint]

 @inproceedings { matsubara2021torchdistill ,
  title = { {torchdistill: A Modular, Configuration-Driven Framework for Knowledge Distillation} } ,
  author = { Matsubara, Yoshitomo } ,
  booktitle = { International Workshop on Reproducible Research in Pattern Recognition } ,
  pages = { 24--44 } ,
  year = { 2021 } ,
  organization = { Springer }
}

[Paper] [OpenReview] [Preprint]

 @inproceedings { matsubara2023torchdistill ,
  title = { {torchdistill Meets Hugging Face Libraries for Reproducible, Coding-Free Deep Learning Studies: A Case Study on NLP} } ,
  author = { Matsubara, Yoshitomo } ,
  booktitle = { Proceedings of the 3rd Workshop for Natural Language Processing Open Source Software (NLP-OSS 2023) } ,
  publisher = { Empirical Methods in Natural Language Processing } ,
  pages = { 153--164 } ,
  year = { 2023 }
}

致谢

自2021年11月和2022年6月以来，Travis CI的OSS信贷和Jetbrain的免费许可计划（开源）已支持该项目。

参考

？ pytorch/vision/参考/分类/
？ Pytorch/Vision/参考/检测/
？ Pytorch/Vision/参考/分段/
？拥抱面/变压器/示例/pytorch/文本分类
？ Geoffrey Hinton，Oriol Vinyals，Jeff Dean。 “在神经网络中提取知识”（深度学习和表示学习研讨会：Neurips 2014）
？ Adriana Romero，Nicolas Ballas，Samira Ebrahimi Kahou，Antoine Chassang，Carlo Gatta，Yoshua Bengio。 “ Fitnets：薄深网的提示”（ICLR 2015）
？ Junho Yim，Donggyu Joo，Jihoon Bae，Junmo Kim。 “知识蒸馏的礼物：快速优化，网络最小化和转移学习”（CVPR 2017）
？ Sergey Zagoruyko，Nikos Komodakis。 “更多地关注关注：通过注意转移提高卷积神经网络的表现”（ICLR 2017）
？ Nikolaos Passalis，Anastasios Tefas。 “通过概率知识转移学习深层表示”（ECCV 2018）
？ Jangho Kim，Seonguk Park，Nojun Kwak。 “释义复杂网络：通过因子传输的网络压缩”（Neurips 2018）
？ Byeongho Heo，Minsik Lee，Sangdoo Yun，Jin Young Choi。 “通过隐藏神经元形成的激活边界蒸馏的知识转移”（AAAI 2019）
？他，Chunhua Shen，Zhi Tian，Dong Gong，Changming Sun，Youliang Yan。 “知识适应有效的语义细分”（CVPR 2019）
？ Wonpyo Park，Dongju Kim，Yan Lu，Minsu Cho。 “关系知识蒸馏”（CVPR 2019）
？ Sungsoo Ahn，Shell Xu Hu，Andreas Damianou，Neil D. Lawrence，Zhenwen Dai。 “知识转移的变分信息蒸馏”（CVPR 2019）
？ Yoshitomo Matsubara，Sabur Baidya，Davide Callegaro，Marco Levorato，Sameer Singh。 “用于边缘辅助实时系统的蒸馏拆分深神网络”（视频分析和智能边缘的热门话题的讲习班：Mobicom 2019）
？ Baoyun Peng，Xiao Jin，Jiaheng Liu，Dongsheng Li，Yichao Wu，Yu Liu，Shunfeng Zhou，Zhaoning Zhang Zhang。 “知识蒸馏的相关一致性”（ICCV 2019）
？弗雷德里克·邓（Frederick Tung），格雷格·莫里（Greg Mori）。 “具有相似性的知识蒸馏”（ICCV 2019）
？永隆，迪利普·克里希南（Dilip Krishnan），菲利普（Phillip） “对比表示蒸馏”（ICLR 2020）
？ Yoshitomo Matsubara，Marco Levorato。 “在挑战网络中进行边缘辅助实时对象检测的神经压缩和过滤”（ICPR 2020）
？ Li Yuan，Francis Ehtay，Guilin Li，Tao Wang，Jiashi Feng。 “通过标签平滑正规化重新访问知识蒸馏”（CVPR 2020）
？ Guodong Xu，Ziwei Liu，Xiaoxiao Li，Chen Change Loy。 “知识蒸馏符合自学意义”（ECCV 2020）
？ Youcai Zhang，Zhonghao lan，Yuchen Dai，Fangao Zeng，Yan Bai，Jie Chang，Yichen Wei。 “ Prime Awawaweawaptive蒸馏”（ECCV 2020）
？ Pengguang Chen，Shu Liu，Hengshuang Zhao，Jiaya Jia。 “通过知识审查提取知识”（CVPR 2021）
？ Li Liu，Qingle Huang，Sihao Lin，Hongwei Xie，Bing Wang，Xiaojun Chang，Xiaodan Liang。 “探索多样性保留的知识蒸馏的通道间相关性”（ICCV 2021）
？陶黄（Tao Huang），Shan You，Fei Wang，Chen Qian，Chang Xu。 “从更强大的老师那里蒸馏”（神经2022）
？ Roy Miles，Krystian Mikolajczyk。 “了解投影仪在知识蒸馏中的作用”（AAAI 2024）
？ Shangquan Sun，Wenqi Ren，Jingzhi Li，Rui Wang，Xioochun Cao。 “知识蒸馏中的logit标准化”（CVPR 2024）

展开

附加信息

版本 PyTorch 2.5 support, model migrations, end of Python 3.8 support
类型其他源码
更新时间 2025-04-18
大小 3.26MB
来自于 Github

torchdistill

Torchdistill：用于知识蒸馏的模块化，配置驱动的框架

文档

前向钩管理器

1个实验→1个声明的PYYAML配置文件

基准

例子

Google Colab示例

CIFAR-10和CIFAR-100

胶水

Pytorch枢纽

如何设置

通过PIP/PIPENV安装

从此存储库中安装（不建议）

问题 /问题 /请求 /拉请求

引用

致谢

参考

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express