بقلم Songtao Liu ، Di Huang ، Yunhong Wang
مستوحى من بنية الحقول الاستقبالية (RFS) في الأنظمة البصرية البشرية ، نقترح وحدة كتلة RF جديدة (RFB) ، والتي تأخذ العلاقة بين حجم وغرابة RFS في الاعتبار ، لتعزيز التمييز وقوة الميزات. نقوم بتجميع وحدة RFB إلى أعلى SSD مع نموذج CNN خفيف الوزن ، وبناء كاشف شبكة RFB. يمكنك استخدام الرمز لتدريب/تقييم شبكة RFB للكشف عن الكائنات. لمزيد من التفاصيل ، يرجى الرجوع إلى ورقة ECCV الخاصة بنا.

| نظام | رسم خريطة | FPS (Titan X Maxwell) |
|---|---|---|
| أسرع R-CNN (VGG16) | 73.2 | 7 |
| Yolov2 (Darknet-19) | 78.6 | 40 |
| R-FCN (RESNET-101) | 80.5 | 9 |
| SSD300* (VGG16) | 77.2 | 46 |
| SSD512* (VGG16) | 79.8 | 19 |
| RFBNET300 (VGG16) | 80.7 | 83 |
| RFBNET512 (VGG16) | 82.2 | 38 |
| نظام | خريطة اختبار ديف | الوقت (Titan x Maxwell) |
|---|---|---|
| أسرع R-CNN ++ (Resnet-101) | 34.9 | 3.36s |
| Yolov2 (Darknet-19) | 21.6 | 25ms |
| SSD300* (VGG16) | 25.1 | 22 مللي ثانية |
| SSD512* (VGG16) | 28.8 | 53ms |
| Retinanet500 (Resnet-101-FPN) | 34.4 | 90ms |
| RFBNET300 (VGG16) | 30.3 | 15ms |
| RFBNET512 (VGG16) | 33.8 | 30ms |
| RFBNET512-E (VGG16) | 34.4 | 33ms |
| نظام | خريطة Minival Coco | #حدود |
|---|---|---|
| SSD Mobilenet | 19.3 | 6.8 م |
| RFB Mobilenet | 20.7 | 7.4m |
يرجى الاستشهاد بالورقة في منشوراتك إذا كانت تساعد بحثك:
@InProceedings{Liu_2018_ECCV,
author = {Liu, Songtao and Huang, Di and Wang, andYunhong},
title = {Receptive Field Block Net for Accurate and Fast Object Detection},
booktitle = {The European Conference on Computer Vision (ECCV)},
month = {September},
year = {2018}
}
./make.shملاحظة : تحقق من دعم هندسة GPU في utils/build.py ، السطر 131. الافتراضي هو:
'nvcc': ['-arch=sm_52',
conda install opencvملاحظة: للتدريب ، ندعم حاليًا VOC و Coco.
لتسهيل الأمور ، نوفر محمل مجموعة بيانات VOC و Coco البسيطة التي ترث torch.utils.data.Dataset مما يجعلها متوافقة تمامًا مع API torchvision.datasets .
# specify a directory for dataset to be downloaded into, else default is ~/data/
sh data/scripts/VOC2007.sh # <directory> # specify a directory for dataset to be downloaded into, else default is ~/data/
sh data/scripts/VOC2012.sh # <directory>قم بتثبيت مجموعة بيانات MS Coco على/path/to/coco من موقع الويب الرسمي ، الافتراضي هو ~/data/coco. بعد التعليمات لإعداد Minival2014 و ValminusMinival2014 التعليقات التوضيحية. يجب أن تكون جميع ملفات التسمية (.json) تحت المجلد/ التعليقات التوضيحية. يجب أن يكون لهذا الهيكل الأساسي
$COCO /
$COCO /cache/
$COCO /annotations/
$COCO /images/
$COCO /images/test2015/
$COCO /images/train2014/
$COCO /images/val2014/تحديث : أصدرت مجموعة بيانات Coco الحالية مجموعات Train2017 و Val2017 والتي ليست سوى انشقاقات جديدة لمجموعات الصور نفسها.
قم أولاً بتنزيل أوزان شبكة VGG-16 Pytorch Reduced VGG-16 على: https://s3.amazonaws.com/amdegroot-models
يتم نقل BaseNet MobiLenet مسبقًا من Mobilenet-Caffe ، والذي يحقق معدلات دقة أفضل قليلاً من المعدل الأصلي المذكور في الورقة ، يتوفر ملف الوزن على: https://drive.google.com/open؟id=13AzsapyBBDJZFGIDQN1INBLPSDDXCKK14 أو BAIDUYUN.
بشكل افتراضي ، نفترض أنك قمت بتنزيل الملف في RFBNet/weights DIR:
mkdir weights
cd weights
wget https://s3.amazonaws.com/amdegroot-models/vgg16_reducedfc.pthtrain_RFB.py كعلم أو تغييرها يدويًا. python train_RFB.py -d VOC -v RFB_vgg -s 300 train_RFB.py للخيارات)لتقييم شبكة مدربة:
python test_RFB.py -d VOC -v RFB_vgg -s 300 --trained_model /path/to/model/weights بشكل افتراضي ، سيتم إخراج نتائج الخريطة مباشرة على اختبار Voc2007 أو Coco Minival2014 . بالنسبة لنتائج اختبار VOC2012 واختبار DEV ، يمكنك تغيير مجموعات البيانات يدويًا في ملف test_RFB.py ، ثم حفظ نتائج الكشف وتقديمها إلى الخادم.