knowledge distillation pytorch 다운로드 - knowledge distillation pytorch 소스 코드 다운로드

knowledge distillation pytorch

파이썬

1.0.0

다운로드

지식-방지-파이터

효율적인 하드웨어 솔루션을위한 DNN의 지식 증류 탐색
저자 : 아이통 리
프레임 워크 : Pytorch
데이터 세트 : CIFAR-10

특징

"얕은"및 "깊은"지식 증류 (KD) 실험을 탐색하기위한 프레임 워크
"params.json"에 의해 정의 된 하이퍼 파라미터 (긴 Argparser 명령 피하기)
초 파라미터 검색 및 결과 합성 (테이블로)
Progress Bar, Tensorboard 지원 및 체크 포인트 절약/로딩 (utils.py)
사전 예방 된 교사 모델을 다운로드 할 수 있습니다

설치하다

레포를 복제하십시오

 git clone https://github.com/peterliht/knowledge-distillation-pytorch.git

종속성 설치 (Pytorch 포함)
```
 pip install -r requirements.txt
```

조직화 :

./train.py : CIFAR-10에서 KD의 유무에 관계없이 기차/평가를위한 정문.
./experiments/ : 각 실험에 대한 JSON 파일; hypersearch에 대한 dir
./model/ : 교사 및 학생 DNNS, 지식 증류 (KD) 손실 정의, 데이터 로더

실험 사용에 대한 주요 메모 :

"Explements.zip"에서 사전 예방 된 교사 모델 체크 포인트에 대한 zip 파일을 다운로드하십시오.
압제되지 않은 서브 폴더를 '지식-방지 -Pytorch/실험/'로 옮기기 만하면 (필요한 경우 기존의 것과 교체; 기본 경로 이름 지정을 따르십시오).
resnet-18의 다크 지식으로 5 층 CNN을 훈련시키기 위해 Train.py에 전화하거나 최첨단 더 깊은 모델이 증류 된 RESNET-18 교육을 시작합니다.
hypersearch에는 search_hyperparams.py를 사용하십시오
하이퍼 파라미터는 Params.json 파일에 정의되어 있습니다. 자세한 내용은 search_hyperparams.py의 헤더를 참조하십시오

기차 (데이터 세트 : CIFAR-10)

참고 : 모든 초 파라미터는 'model_dir'에서 'params.json'에서 찾아서 수정할 수 있습니다.

-사전 훈련 된 RESNET-18 모델에서 증류 된 지식으로 5 층 CNN을 훈련

 python train.py --model_dir experiments/cnn_distill

-미리 훈련 된 Resnext-29 교사에서 증류 된 지식으로 RESNET-18 모델을 훈련

 python train.py --model_dir experiments/resnet18_distill/resnext_teacher

- 지정된 실험에 대한 하이퍼 파라미터 검색 ( 'parent_dir/params.json')

 python search_hyperparams.py --parent_dir experiments/cnn_distill_alpha_temp

-최근 hypersearch 실험의 결과를 확인하십시오

 python synthesize_results.py --parent_dir experiments/cnn_distill_alpha_temp

결과 : "얕은"및 "깊은"증류

빠른 테이크 아웃 (추가 자세한 내용) :

지식 증류는 얕은 DNN과 최첨단 DNN에 대한 정규화를 제공합니다.
표지되지 않은 또는 부분 데이터 세트가 있으면 교사 모델에 대한 어두운 지식의 혜택을 누릴 수 있습니다.

-RESNET-18에서 5 계층 CNN에서 지식 증류

모델	드롭 아웃 = 0.5	드롭 아웃이 없습니다
5 계층 CNN	83.51%	84.74%
5 층 CNN W/ RESNET18	84.49%	85.69%

- 더 깊은 모델에서 RESNET-18까지의 지식 증류

모델	테스트 정확도
기준 RESNET-18	94.175%
+ KD 더 넓은 레즈넷 -28-10	94.333%
+ KD PRERESNET-110	94.531%
+ KD Densenet-100	94.729%
+ KD Resnext-29-8	94.788%

참조

H. Li, "효율적인 하드웨어 솔루션을위한 깊은 신경망의 지식 증류 탐색", CS230 Report, 2018

Hinton, Geoffrey, Oriol Vinyals 및 Jeff Dean. "신경망에서의 지식을 증류합니다." Arxiv preprint arxiv : 1503.02531 (2015).

Romero, A., Ballas, N., Kahou, SE, Chassang, A., Gatta, C., & Bengio, Y. (2014). Fitnets : 얇은 딥 네트에 대한 힌트. Arxiv preprint arxiv : 1412.6550.

https://github.com/cs230-stanford/cs230-stanford.github.io

https://github.com/bearpaw/pytorch-classification

확장하다

추가 정보

버전 1.0.0
유형 파이썬
업데이트 시간 2025-07-15
크기 23.28MB
출처 Github

knowledge distillation pytorch

지식-방지-파이터

특징

설치하다

조직화 :

실험 사용에 대한 주요 메모 :

기차 (데이터 세트 : CIFAR-10)

결과 : "얕은"및 "깊은"증류

참조

GitHub sgrebnov/cordova plugin background download

Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

pytorch image models

Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

chat.petals.dev

GPT Prompt Templates

GPTyped

ToDo Co

Python Portfolio

datamule python

Google Dorks

shepherd

mongo express