pytorch_resnet_cifar10
1.0.0
Torchvision Model Zoo는 다양한 최첨단 아키텍처의 구현을 제공하지만 대부분 Imagenet에 대해 정의되고 구현됩니다. 일반적으로 다른 데이터 세트에서 제공된 모델을 사용하는 것이 간단하지만 일부 경우 수동 설정이 필요합니다.
예를 들어, CIFAR10에 Resnets가있는 Pytorch 리포지토리는 원래 논문에 설명 된 바와 같이 구현을 제공합니다. CIFAR10에서 TorchVision의 모델 만 사용하면 레이어 수와 매개 변수 수가 다른 모델을 얻을 수 있습니다. CIFAR10의 RESNET-S를 원본 용지와 직접 비교하려는 경우 용납 할 수 없습니다. 이 repo의 목적은 원래 논문에 설명 된대로 CIFAR10에 대한 RESNET-S의 유효한 Pytorch 구현을 제공하는 것입니다. 다음 모델이 제공됩니다.
| 이름 | # 레이어 | # 매개 변수 | 테스트 err (종이) | ERR 테스트 (이 명소) |
|---|---|---|---|---|
| RESNET20 | 20 | 0.27m | 8.75% | 8.27% |
| RESNET32 | 32 | 0.46m | 7.51% | 7.37% |
| RESNET44 | 44 | 0.66m | 7.17% | 6.90% |
| RESNET56 | 56 | 0.85m | 6.97% | 6.61% |
| RESNET110 | 110 | 1.7m | 6.43% | 6.32% |
| RESNET1202 | 1202 | 19.4m | 7.93% | 6.18% |
이 구현은 원래 논문의 설명과 비슷하거나 더 나은 테스트 오류와 일치합니다.
git clone https://github.com/akamaster/pytorch_resnet_cifar10
cd pytorch_resnet_cifar10
chmod +x run.sh && ./run.sh우리의 구현은 일부 경고와 함께 논문을 간단하게 따릅니다. 첫째 , 논문의 훈련은 열차 데이터에 45k/5k 열차/검증 분할을 사용하고 검증 세트의 성능을 기반으로 최상의 성능 모델을 선택합니다. 우리는 검증 테스트를 수행하지 않습니다 . RESNET 헤드 투 헤드의 결과를 연기 용지와 비교 해야하는 경우이 점을 명심하십시오. 둘째 , RESNET1202를 훈련 시키려면 GPU에서 16GB 메모리가 필요하다는 점을 명심하십시오.
이 구현이 유용 하고이 페이지를 인용/언급하려면 다음은 Bibtex 인용입니다.
@misc { Idelbayev18a ,
author = " Yerlan Idelbayev " ,
title = " Proper {ResNet} Implementation for {CIFAR10/CIFAR100} in {PyTorch} " ,
howpublished = " url{https://github.com/akamaster/pytorch_resnet_cifar10} " ,
note = " Accessed: 20xx-xx-xx "
}