Download de torchdistill - Download de código fonte torchdistill

torchdistill

Outro código-fonte

PyTorch 2.5 support, model migrations, end of Python 3.8 support

Baixar

Torchdistill: uma estrutura modular e orientada por configuração para destilação de conhecimento

A Torchdistill (anteriormente KDKit ) oferece vários métodos de destilação de conhecimento de ponta e permite projetar (novos) experimentos simplesmente editando um arquivo de configuração YAML declarativo em vez do código Python. Mesmo quando você precisa extrair representações intermediárias nos modelos de professores/alunos, você não precisará reimplementar os modelos, que geralmente alteram a interface do avanço, mas, em vez disso, especificar os caminhos do módulo no arquivo YAML. Consulte esses trabalhos para obter mais detalhes.

Além da destilação do conhecimento, essa estrutura ajuda a projetar e realizar experimentos gerais de aprendizado profundo ( sem codificação ) para estudos de aprendizado profundo reprodutível. Ou seja, permite que você treine modelos sem professores simplesmente excluindo entradas de professores de um arquivo de configuração da YAML declarativo. Você pode encontrar esses exemplos abaixo e em configurações/amostra/.

Quando você se refere ao Torchdistill em seu artigo, cite esses papéis em vez deste repositório do GitHub.
Se você usa a Torchdistill como parte do seu trabalho, sua citação é apreciada e me motiva a manter e atualizar essa estrutura!

Documentação

Você pode encontrar os projetos de documentação e pesquisa da API que aproveitam a Torchdistill em https://yoshitomo-matsubara.net/torchdistill/

Gerente de gancho para frente

Usando o ForwardHookManager , você pode extrair representações intermediárias no modelo sem modificar a interface de sua função avançada.
Este notebook de exemplo fornecerá uma idéia melhor do uso, como destilação de conhecimento e análise de representações intermediárias.

1 experimento → 1 arquivo declarativo de configuração pyyaml

Em Torchdistill , muitos componentes e módulos de Pytorch são abstraídos, por exemplo, modelos, conjuntos de dados, otimizadores, perdas e muito mais! Você pode defini -los em um arquivo de configuração Pyyaml declarativo para que possa ser visto como um resumo do seu experimento e, em muitos casos, não precisará escrever o código Python . Dê uma olhada em algumas configurações disponíveis nas configurações/. Você verá quais módulos são abstraídos e como eles são definidos em um arquivo de configuração pyyaml declarativo para projetar um experimento.

Se você deseja usar seus próprios módulos (modelos, funções de perda, conjuntos de dados etc.) com essa estrutura, você pode fazê -lo sem editar o código no pacote local torchdistill/ .
Consulte a documentação e discussões oficiais para obter mais detalhes.

Benchmarks

Precisão de validação top-1 para ILSVRC 2012 (ImageNet)

Exemplos

O código executável pode ser encontrado em exemplos/ como

Classificação da imagem: ImageNet (ILSVRC 2012), CIFAR-10, CIFAR-100, etc
Detecção de objetos: Coco 2017, etc
Segmentação semântica: Coco 2017, Pascal Voc, etc
Classificação de texto: cola, etc

Para CIFAR-10 e CIFAR-100, alguns modelos são reimplementados e disponíveis como modelos pré-treinados em Torchdistill . Mais detalhes podem ser encontrados aqui.

Alguns modelos de transformadores são ajustados pela Torchdistill para tarefas de cola estão disponíveis para abraçar o Hub do Modelo de Face Face. Os resultados e detalhes da referência de cola de amostra podem ser encontrados aqui.

Exemplos do Google Colab

Os exemplos a seguir estão disponíveis na demonstração/. Observe que esses exemplos são para usuários do Google Colab e compatíveis com o Amazon Sagemaker Studio Lab. Geralmente, exemplos/ seria uma referência melhor se você tiver seus próprios GPU (s).

CIFAR-10 e CIFAR-100

Treinamento sem modelos de professores
Destilação do conhecimento

COLA

Tuneamento fino sem modelos de professores
Destilação do conhecimento

Esses exemplos escrevem arquivos de previsão de teste para você ver o desempenho do teste no sistema de tabela de líderes de cola.

Pytorch Hub

Se você encontrar modelos nos repositórios Pytorch Hub ou GitHub, que suportam o Pytorch Hub, poderá importá -los como modelos de professores/alunos simplesmente editando um arquivo de configuração YAML declarativo.

Por exemplo, se você usar um resnest-50 pré-terenciado em modelos HuggingFace/Pytorch-Image (também conhecido como Timm ) como modelo de professor para o conjunto de dados ImageNet, poderá importar o modelo via hub pytorch com a seguinte entrada no seu arquivo declarativo de configuração YAML.

 models :
  teacher_model :
    key : ' resnest50d '
    repo_or_dir : ' huggingface/pytorch-image-models '
    kwargs :
      num_classes : 1000
      pretrained : True

Como configurar

Python> = 3.9
Pipenv (opcional)

Instale por PIP/PIPENV

 pip3 install torchdistill
# or use pipenv
pipenv install torchdistill

Instale a partir deste repositório (não recomendado)

 git clone https://github.com/yoshitomo-matsubara/torchdistill.git
cd torchdistill/
pip3 install -e .
# or use pipenv
pipenv install "-e ."

Questões / perguntas / solicitações / solicitações de puxão

Sinta -se à vontade para criar um problema se encontrar um bug.
Se você tiver uma solicitação de pergunta ou recurso, inicie uma nova discussão aqui. Pesquise problemas e discussões e verifique se sua questão/pergunta/solicitação ainda não foi abordada.

Solicitações de tração são bem -vindas. Comece com um problema e discuta soluções comigo, em vez de começar com uma solicitação de tração.

Citação

Se você usar a Torchdistill em sua pesquisa, cite os seguintes trabalhos:
[Papel] [pré -impressão]

 @inproceedings { matsubara2021torchdistill ,
  title = { {torchdistill: A Modular, Configuration-Driven Framework for Knowledge Distillation} } ,
  author = { Matsubara, Yoshitomo } ,
  booktitle = { International Workshop on Reproducible Research in Pattern Recognition } ,
  pages = { 24--44 } ,
  year = { 2021 } ,
  organization = { Springer }
}

[Paper] [OpenReview] [pré -impressão]

 @inproceedings { matsubara2023torchdistill ,
  title = { {torchdistill Meets Hugging Face Libraries for Reproducible, Coding-Free Deep Learning Studies: A Case Study on NLP} } ,
  author = { Matsubara, Yoshitomo } ,
  booktitle = { Proceedings of the 3rd Workshop for Natural Language Processing Open Source Software (NLP-OSS 2023) } ,
  publisher = { Empirical Methods in Natural Language Processing } ,
  pages = { 153--164 } ,
  year = { 2023 }
}

Agradecimentos

Este projeto foi apoiado pelos créditos OSS da Travis CI e pelos programas de licença gratuita da JetBrain (código aberto) desde novembro de 2021 e junho de 2022, respectivamente.

Referências

? pytorch/visão/referências/classificação/
? pytorch/visão/referências/detecção/
? pytorch/visão/referências/segmentação/
? Huggingface/Transformers/Exemplos/Pytorch/Classificação de Texto
? Geoffrey Hinton, Oriol Vinyals, Jeff Dean. "Distilação do conhecimento em uma rede neural" (Deep Learning and Representation Learning Workshop: Neurips 2014)
? Adriana Romero, Nicolas Ballas, Samira Ebrahimi Kahou, Antoine Chassang, Carlo Gatta, Yoshua Bengio. "FitNets: dicas para redes profundas finas" (ICLR 2015)
? Junho Yim, Donggyu Joo, Jihoon Bae, Junmo Kim. "Um presente da destilação do conhecimento: otimização rápida, minimização de rede e aprendizado de transferência" (CVPR 2017)
? Sergey Zagoruyko, Nikos Komodakis. "Prestando mais atenção à atenção: melhorando o desempenho das redes neurais convolucionais via transferência de atenção" (ICLR 2017)
? Nikolaos passalis, Anastasios Tefas. "Aprendendo representações profundas com transferência probabilística de conhecimento" (ECCV 2018)
? Jangho Kim, Parque Seonguk, Nojun Kwak. "Parafraseando Rede Complexa: Compressão de Rede via transferência de fatores" (Neurips 2018)
? Byeongho Heo, Minsik Lee, Sangdoo Yun, Jin Young Choi. "Transferência de conhecimento por destilação dos limites de ativação formados por neurônios ocultos" (AAAI 2019)
? Tong He, Chunhua Shen, Zhi Tian, Dong Gong, Sun Chillming, Youliang Yan. "Adaptação do conhecimento para segmentação semântica eficiente" (CVPR 2019)
? Wonpyo Park, Dongju Kim, Yan Lu, Minsu Cho. "Destilação do Conhecimento Relacional" (CVPR 2019)
? Sungsoo Ahn, Shell Xu Hu, Andreas Damianou, Neil D. Lawrence, Zhenwen Dai. "Destilação de informações variacionais para transferência de conhecimento" (CVPR 2019)
? Yoshitomo Matsubara, Sabur Baidya, Davide Callegaro, Marco Levorato, Sameer Singh. "Redes neurais profundas divididas destiladas para sistemas em tempo real assistidos por bordas" (workshop sobre tópicos quentes em análise de vídeo e arestas inteligentes: Mobicom 2019)
? Baoyun Peng, Xiao Jin, Jiaheng Liu, Dongsheng LI, Yichao Wu, Yu Liu, Shunfeng Zhou, Zhaoning Zhang. "Congruência de correlação pela destilação do conhecimento" (ICCV 2019)
? Frederick Tung, Greg Mori. "Destilação de conhecimento que preserva a similaridade" (ICCV 2019)
? Yonglong Tian, Dilip Krishnan, Phillip Isola. "Destilação de Representação Contrastiva" (ICLR 2020)
? Yoshitomo Matsubara, Marco Levorato. "Compressão neural e filtragem para detecção de objetos em tempo real assistida por borda em redes desafiadas" (ICPR 2020)
? Li Yuan, Francis Ehtay, Guilin Li, Tao Wang, Jiashi Feng. "Revisitando a destilação do conhecimento via regularização de suavização de etiquetas" (CVPR 2020)
? Guodong Xu, Ziwei Liu, Xiaoxiao Li, Chen mudam de Loy. "A destilação do conhecimento atende à auto-supervisão" (ECCV 2020)
? Youcai Zhang, Zhonghao Lan, Yuchen Dai, Fangao Zeng, Yan Bai, Jie Chang, Yichen Wei. "Destilação adaptativa com consciência primária" (ECCV 2020)
? Pengguang Chen, Shu Liu, Hengshuang Zhao, Jiaya Jia. "Conhecimento de destilação via Knowledge Review" (CVPR 2021)
? Liu Liu, Qingle Huang, Sihao Lin, Hongwei Xie, Bing Wang, Xiaojun Chang, Xiaodan Liang. "Explorando a correlação entre canais para destilação de conhecimento preservada pela diversidade" (ICCV 2021)
? Tao Huang, Shan você, Fei Wang, Chen Qian, Chang Xu. "Destilação de conhecimento de um professor mais forte" (Neurips 2022)
? Roy Miles, Krystian Mikolajczyk. "Entendendo o papel do projetor na destilação do conhecimento" (AAAI 2024)
? Shangquan Sun, Wenqi Ren, Jingzhi Li, Rui Wang, Xiaochun Cao. "Padronização de logit na destilação do conhecimento" (CVPR 2024)

Expandir

Informações adicionais

Versão PyTorch 2.5 support, model migrations, end of Python 3.8 support
Tipo Outro código-fonte
Data da Última Atualização 2025-04-18
tamanho 3.26MB
Vindo de Github

Aplicativos Relacionados

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos