pytorch_resnet_cifar10
1.0.0
Torchvision Model Zooは、さまざまな最先端のアーキテクチャの実装の数を提供しますが、それらのほとんどはImagenet用に定義および実装されています。通常、他のデータセットで提供されたモデルを使用するのは簡単ですが、いくつかのケースでは手動のセットアップが必要です。
たとえば、CIFAR10にResnetを備えたPytorchリポジトリは、元の論文で説明されているように実装を提供します。 CIFAR10でTorchVisionのモデルを使用するだけの場合、レイヤー数とパラメーターの数が異なるモデルが表示されます。これは、CIFAR10のResNet-Sを元の論文と直接比較する場合は受け入れられません。このレポの目的は、元の論文に記載されているように、CIFAR10のResNet-Sの有効なPytorch実装を提供することです。次のモデルが提供されています。
| 名前 | #レイヤー | #params | テストERR(論文) | テストERR(このembr。) |
|---|---|---|---|---|
| Resnet20 | 20 | 0.27m | 8.75% | 8.27% |
| resnet32 | 32 | 0.46m | 7.51% | 7.37% |
| resnet44 | 44 | 0.66m | 7.17% | 6.90% |
| ResNet56 | 56 | 0.85m | 6.97% | 6.61% |
| resnet110 | 110 | 1.7m | 6.43% | 6.32% |
| RESNET1202 | 1202 | 19.4m | 7.93% | 6.18% |
この実装は、元の論文の説明と一致し、同等またはより良いテストエラーを伴います。
git clone https://github.com/akamaster/pytorch_resnet_cifar10
cd pytorch_resnet_cifar10
chmod +x run.sh && ./run.sh私たちの実装は、いくつかの警告で簡単な方法で論文に従います。まず、論文のトレーニングでは、列車データの45K/5Kトレイン/検証の分割を使用し、検証セットのパフォーマンスに基づいて最適なパフォーマンスモデルを選択します。検証テストは実行されません。 Resnetの結果を元の紙に直接比較する必要がある場合は、これを念頭に置いてください。第二に、ResNet1202をトレーニングする場合は、GPUに16GBメモリが必要であることに留意してください。
この実装が便利で、このページを引用/言及したい場合は、Bibtexの引用を次に示します。
@misc { Idelbayev18a ,
author = " Yerlan Idelbayev " ,
title = " Proper {ResNet} Implementation for {CIFAR10/CIFAR100} in {PyTorch} " ,
howpublished = " url{https://github.com/akamaster/pytorch_resnet_cifar10} " ,
note = " Accessed: 20xx-xx-xx "
}