Descargar torchdistill - Descargar el código fuente de torchdistill

torchdistill

Otro código fuente

PyTorch 2.5 support, model migrations, end of Python 3.8 support

Descargar

TorchDistill: un marco modular impulsado por la configuración para la destilación del conocimiento

TorchDistill (anteriormente KDKIT ) ofrece varios métodos de destilación de conocimiento de última generación y le permite diseñar (nuevos) experimentos simplemente editando un archivo de configuración YAML declarativo en lugar del código Python. Incluso cuando necesite extraer representaciones intermedias en modelos de maestro/estudiante, no necesitará volver a implementar los modelos, que a menudo cambian la interfaz del avance, sino especificar las rutas del módulo en el archivo YAML. Consulte estos documentos para obtener más detalles.

Además de la destilación del conocimiento, este marco le ayuda a diseñar y realizar experimentos generales de aprendizaje profundo ( sin codificación ) para estudios reproducibles de aprendizaje profundo. es decir, le permite capacitar a modelos sin maestros simplemente excluyendo las entradas de los maestros de un archivo de configuración YAML declarativo. Puede encontrar tales ejemplos a continuación y en Configs/Sample/.

Cuando se refiera a TorchDistill en su artículo, cita estos documentos en lugar de este repositorio de GitHub.
Si usa TorchDistill como parte de su trabajo, su cita es apreciada y me motiva a mantener y actualizar este marco.

Documentación

Puede encontrar los proyectos de documentación y investigación de la API que aprovechan TorchDistill en https://yoshitomo-matsubara.net/torchdistill/

Adelante gerente de gancho

Utilizando ForwardhookManager , puede extraer representaciones intermedias en el modelo sin modificar la interfaz de su función de avance.
Este cuaderno de ejemplo le dará una mejor idea del uso, como la destilación de conocimiento y el análisis de representaciones intermedias.

1 Experimento → 1 Archivo de configuración Pyyaml declarativo

En TorchDistill , muchos componentes y módulos de Pytorch son abstraídos, por ejemplo, modelos, conjuntos de datos, optimizadores, pérdidas y más. Puede definirlos en un archivo de configuración Pyyaml declarativo para que pueda verse como un resumen de su experimento, y en muchos casos, no necesitará escribir el código Python en absoluto . Eche un vistazo a algunas configuraciones disponibles en Configs/. Verá qué módulos se abstraen y cómo se definen en un archivo de configuración Pyyaml declarativo para diseñar un experimento.

Si desea usar sus propios módulos (modelos, funciones de pérdida, conjuntos de datos, etc.) con este marco, puede hacerlo sin editar código en el paquete local torchdistill/ .
Vea la documentación oficial y las discusiones para obtener más detalles.

Puntos de referencia

Top-1 Precisión de validación para ILSVRC 2012 (Imagenet)

Ejemplos

El código ejecutable se puede encontrar en ejemplos/ como

Clasificación de imágenes: Imagenet (ILSVRC 2012), CIFAR-10, CIFAR-100, etc.
Detección de objetos: Coco 2017, etc.
Segmentación semántica: Coco 2017, Pascal VOC, etc.
Clasificación de texto: pegamento, etc.

Para CIFAR-10 y CIFAR-100, algunos modelos se reimplementan y están disponibles como modelos previos a la petrada en Torchdistill . Se pueden encontrar más detalles aquí.

Algunos modelos de transformadores ajustados por TorchDistill para tareas de pegamento están disponibles en Hub Model Hub. Los resultados y detalles de referencia de pegamento de muestra se pueden encontrar aquí.

Ejemplos de Google Colab

Los siguientes ejemplos están disponibles en demo/. Tenga en cuenta que estos ejemplos son para usuarios de Google Colab y compatibles con Amazon Sagemaker Studio Lab. Por lo general, los ejemplos/ serían una mejor referencia si tiene sus propias GPU (s).

CIFAR-10 y CIFAR-100

Capacitación sin modelos de maestros
Destilación de conocimiento

PEGAMENTO

Ajuste fino sin modelos de maestros
Destilación de conocimiento

Estos ejemplos escriben archivos de predicción de prueba para que vea el rendimiento de la prueba en el sistema de placas de clasificación.

Centro de pytorch

Si encuentra modelos en Pytorch Hub o Repositorios de GitHub que admiten Pytorch Hub, puede importarlos como modelos de maestro/estudiante simplemente editando un archivo de configuración YAML declarativo.

Por ejemplo, si utiliza un resnest-50 previamente disponible en Huggingface/Pytorch-Image-Models (también conocido como TIMM ) como modelo de maestro para el conjunto de datos de Imagenet, puede importar el modelo a través de Pytorch Hub con la siguiente entrada en su archivo de configuración YAML declarativo.

 models :
  teacher_model :
    key : ' resnest50d '
    repo_or_dir : ' huggingface/pytorch-image-models '
    kwargs :
      num_classes : 1000
      pretrained : True

Cómo configurar

Python> = 3.9
Pipenv (opcional)

Instalar por PIP/Pipenv

 pip3 install torchdistill
# or use pipenv
pipenv install torchdistill

Instalar desde este repositorio (no recomendado)

 git clone https://github.com/yoshitomo-matsubara/torchdistill.git
cd torchdistill/
pip3 install -e .
# or use pipenv
pipenv install "-e ."

Problemas / preguntas / solicitudes / solicitudes de extracción

No dude en crear un problema si encuentra un error.
Si tiene una pregunta o solicitud de función, comience una nueva discusión aquí. Busque en cuestiones y discusiones y asegúrese de que su problema/pregunta/solicitud aún no se haya abordado.

Las solicitudes de extracción son bienvenidas. Comience con un problema y discuta soluciones conmigo en lugar de comenzar con una solicitud de extracción.

Citación

Si usa TorchDistill en su investigación, cite los siguientes documentos:
[Documento] [Preprint]

 @inproceedings { matsubara2021torchdistill ,
  title = { {torchdistill: A Modular, Configuration-Driven Framework for Knowledge Distillation} } ,
  author = { Matsubara, Yoshitomo } ,
  booktitle = { International Workshop on Reproducible Research in Pattern Recognition } ,
  pages = { 24--44 } ,
  year = { 2021 } ,
  organization = { Springer }
}

[Paper] [OpenReview] [Preprint]

 @inproceedings { matsubara2023torchdistill ,
  title = { {torchdistill Meets Hugging Face Libraries for Reproducible, Coding-Free Deep Learning Studies: A Case Study on NLP} } ,
  author = { Matsubara, Yoshitomo } ,
  booktitle = { Proceedings of the 3rd Workshop for Natural Language Processing Open Source Software (NLP-OSS 2023) } ,
  publisher = { Empirical Methods in Natural Language Processing } ,
  pages = { 153--164 } ,
  year = { 2023 }
}

Expresiones de gratitud

Este proyecto ha sido respaldado por los créditos OSS de Travis CI y los programas de licencia gratuita de JetBrain (código abierto) desde noviembre de 2021 y junio de 2022, respectivamente.

Referencias

? pytorch/visión/referencias/clasificación/
? pytorch/visión/referencias/detección/
? pytorch/visión/referencias/segmentación/
? Huggingface/transformers/ejemplos/pytorch/text-classificación
? Geoffrey Hinton, Oriol Vinyals, Jeff Dean. "Destilar el conocimiento en una red neuronal" (Taller de aprendizaje y aprendizaje profundo: Neurips 2014)
? Adriana Romero, Nicolas Ballas, Samira Ebrahimi Kahou, Antoine Chassang, Carlo Gatta, Yoshua Bengio. "FitNets: Sugerencias para redes profundas delgadas" (ICLR 2015)
? Junho Yim, Donggyu Joo, Jihoon Bae, Junmo Kim. "Un regalo de la destilación del conocimiento: optimización rápida, minimización de red y aprendizaje de transferencia" (CVPR 2017)
? Sergey Zagoruyko, Nikos Komodakis. "Prestar más atención a la atención: mejorar el desempeño de las redes neuronales convolucionales a través de la transferencia de atención" (ICLR 2017)
? Nikolaos Passalis, Anastasios Tefas. "Aprender representaciones profundas con transferencia de conocimiento probabilístico" (ECCV 2018)
? Jangho Kim, Parque Seonguk, Nojun Kwak. "Parafraseando la red compleja: compresión de la red a través de la transferencia de factores" (Neurips 2018)
? Byeonho Heo, Minsik Lee, Sangdoo Yun, Jin Young Choi. "Transferencia de conocimiento a través de la destilación de los límites de activación formados por las neuronas ocultas" (AAAI 2019)
? Tong He, Chunhua Shen, Zhi Tian, Dong Gong, Changming Sun, Yoliang Yan. "Adaptación del conocimiento para la segmentación semántica eficiente" (CVPR 2019)
? Wonpeo Park, Dongju Kim, Yan Lu, Minsu Cho. "Destilación del conocimiento relacional" (CVPR 2019)
? Sungsoo Ahn, Shell Xu Hu, Andreas Damianou, Neil D. Lawrence, Zhenwen Dai. "Destilación de información variacional para la transferencia de conocimiento" (CVPR 2019)
? Yoshitomo Matsubara, Sabur Baidya, Davide Callegaro, Marco Levorato, Sameer Singh. "Redes neuronales profundas divididas destiladas para sistemas en tiempo real asistidos por el borde" (taller sobre temas calientes en análisis de video y bordes inteligentes: Mobicom 2019)
? Baoyun Peng, Xiao Jin, Jiaheng Liu, Dongsheng Li, Yichao Wu, Yu Liu, Shunfeng Zhou, Zhaoning Zhang. "Congruencia de correlación por la destilación del conocimiento" (ICCV 2019)
? Frederick Tung, Greg Mori. "Destilación del conocimiento que presenta similitudes" (ICCV 2019)
? Yonglong Tian, Dilip Krishnan, Phillip Isola. "Destilación de representación contrastante" (ICLR 2020)
? Yoshitomo Matsubara, Marco Levorato. "Compresión neural y filtrado para la detección de objetos en tiempo real asistido por bordes en redes desafiadas" (ICPR 2020)
? Li Yuan, Francis Ehtay, Guilin Li, Tao Wang, Jiashi Feng. "Revisando la destilación de conocimiento a través de la regularización de suavizado de etiquetas" (CVPR 2020)
? Guodong Xu, Ziwei Liu, Xiaoxiao Li, Chen Change Loy. "La destilación del conocimiento se encuentra con la auto-supervisión" (ECCV 2020)
? Yocai Zhang, Zhonghao Lan, Yuchen Dai, Fangao Zeng, Yan Bai, Jie Chang, Yichen Wei. "Destilación adaptativa consciente de prime" (ECCV 2020)
? Pengguang Chen, Shu Liu, Hengshuang Zhao, Jiaya Jia. "Destilar conocimiento a través de la revisión del conocimiento" (CVPR 2021)
? Li Liu, Qingle Huang, Sihao Lin, Hongwei Xie, Bing Wang, Xiaojun Chang, Xiaodan Liang. "Explorando la correlación entre canales para la destilación de conocimiento conservado por diversidad" (ICCV 2021)
? Tao Huang, Shan You, Fei Wang, Chen Qian, Chang Xu. "Destilación del conocimiento de un maestro más fuerte" (Neurips 2022)
? Roy Miles, Krystian Mikolajczyk. "Comprender el papel del proyector en la destilación del conocimiento" (AAAI 2024)
? Shangquan Sun, Wenqi Ren, Jingzhi Li, Rui Wang, Xiaochun Cao. "Estandarización logit en la destilación del conocimiento" (CVPR 2024)