โดย Songtao Liu, Di Huang, Yunhong Wang
ได้รับแรงบันดาลใจจากโครงสร้างของฟิลด์ที่เปิดกว้าง (RFs) ในระบบภาพของมนุษย์เราเสนอโมดูล RF Block (RFB) ใหม่ซึ่งคำนึงถึงความสัมพันธ์ระหว่างขนาดและความผิดปกติของ RFs เพื่อเพิ่มความสามารถในการแยกแยะและความทนทานของคุณสมบัติ เรารวบรวมโมดูล RFB ขึ้นไปด้านบนของ SSD ด้วยรุ่น CNN ที่มีน้ำหนักเบาโดยสร้างเครื่องตรวจจับสุทธิ RFB คุณสามารถใช้รหัสเพื่อฝึกอบรม/ประเมิน RFB NET สำหรับการตรวจจับวัตถุ สำหรับรายละเอียดเพิ่มเติมโปรดดูกระดาษ ECCV ของเรา

| ระบบ | แผนที่ | FPS (Titan X Maxwell) |
|---|---|---|
| R-CNN เร็วขึ้น (VGG16) | 73.2 | 7 |
| YOLOV2 (Darknet-19) | 78.6 | 40 |
| R-FCN (RESNET-101) | 80.5 | 9 |
| SSD300* (VGG16) | 77.2 | 46 |
| SSD512* (VGG16) | 79.8 | 19 |
| RFBNET300 (VGG16) | 80.7 | 83 |
| RFBNET512 (VGG16) | 82.2 | 38 |
| ระบบ | Test-Dev Map | เวลา (Titan x Maxwell) |
|---|---|---|
| R-CNN ++ เร็วขึ้น (RESNET-101) | 34.9 | 3.36s |
| YOLOV2 (Darknet-19) | 21.6 | 25ms |
| SSD300* (VGG16) | 25.1 | 22ms |
| SSD512* (VGG16) | 28.8 | 53ms |
| Retinanet500 (RESNET-101-FPN) | 34.4 | 90ms |
| RFBNET300 (VGG16) | 30.3 | 15ms |
| RFBNET512 (VGG16) | 33.8 | 30ms |
| RFBNET512-E (VGG16) | 34.4 | 33ms |
| ระบบ | แผนที่ Coco Minival | #parameters |
|---|---|---|
| SSD Mobilenet | 19.3 | 6.8m |
| RFB Mobilenet | 20.7 | 7.4m |
โปรดอ้างอิงบทความของเราในสิ่งพิมพ์ของคุณหากช่วยวิจัยของคุณ:
@InProceedings{Liu_2018_ECCV,
author = {Liu, Songtao and Huang, Di and Wang, andYunhong},
title = {Receptive Field Block Net for Accurate and Fast Object Detection},
booktitle = {The European Conference on Computer Vision (ECCV)},
month = {September},
year = {2018}
}
./make.shหมายเหตุ : ตรวจสอบการสนับสนุนสถาปัตยกรรม GPU ใน Utils/build.py, บรรทัด 131. ค่าเริ่มต้นคือ:
'nvcc': ['-arch=sm_52',
conda install opencvหมายเหตุ: สำหรับการฝึกอบรมปัจจุบันเราสนับสนุน VOC และ Coco
เพื่อให้สิ่งต่าง ๆ ง่ายขึ้นเราจึงจัดหาชุดข้อมูล VOC และ Coco DataSet อย่างง่ายที่สืบทอด torch.utils.data.Dataset ทำให้เข้ากันได้อย่างเต็มที่กับ torchvision.datasets API
# specify a directory for dataset to be downloaded into, else default is ~/data/
sh data/scripts/VOC2007.sh # <directory> # specify a directory for dataset to be downloaded into, else default is ~/data/
sh data/scripts/VOC2012.sh # <directory>ติดตั้งชุดข้อมูล MS Coco AT/PATH/TO/COCO จากเว็บไซต์ทางการ, ค่าเริ่มต้นคือ ~/data/Coco ทำตามคำแนะนำในการเตรียม Minival2014 และ Valminusminival2014 คำอธิบายประกอบ ไฟล์ป้ายกำกับทั้งหมด (.json) ควรอยู่ภายใต้ Coco/ Annotations/ Folder ควรมีโครงสร้างพื้นฐานนี้
$COCO /
$COCO /cache/
$COCO /annotations/
$COCO /images/
$COCO /images/test2015/
$COCO /images/train2014/
$COCO /images/val2014/อัปเดต : ชุดข้อมูล Coco ปัจจุบันได้เปิดตัวชุด Train2017 และ Val2017 ใหม่ซึ่งเป็นเพียงการแยกใหม่ของชุดภาพเดียวกัน
ดาวน์โหลดครั้งแรกที่ FC-Reduced VGG-16 Pytorch Base Network Weights ที่: https://s3.amazonaws.com/amdegroot-models/vgg16_reducedfc.pth หรือจากไดรเวอร์ Baiduyun ของเรา
Mobilenet Basenet ที่ได้รับการฝึกอบรมล่วงหน้านั้นได้รับการพอร์ตจาก Mobilenet-Caffe ซึ่งบรรลุอัตราความแม่นยำที่ดีกว่าเดิมเล็กน้อยที่รายงานไว้ในกระดาษไฟล์น้ำหนักมีอยู่ที่: https://drive.google.com/open?id=13azsapybbdjzfgidqn1inblpsdddxck14 หรือ baiduy
โดยค่าเริ่มต้นเราถือว่าคุณได้ดาวน์โหลดไฟล์ใน RFBNet/weights DIR:
mkdir weights
cd weights
wget https://s3.amazonaws.com/amdegroot-models/vgg16_reducedfc.pthtrain_RFB.py เป็นธงหรือเปลี่ยนด้วยตนเอง python train_RFB.py -d VOC -v RFB_vgg -s 300 train_RFB.py สำหรับตัวเลือก)เพื่อประเมินเครือข่ายที่ผ่านการฝึกอบรม:
python test_RFB.py -d VOC -v RFB_vgg -s 300 --trained_model /path/to/model/weights โดยค่าเริ่มต้นจะส่งออกผลลัพธ์แผนที่โดยตรงใน การทดสอบ VOC2007 หรือ Coco Minival2014 สำหรับผลลัพธ์ การทดสอบ VOC2012 และผล การทดสอบ COCO คุณสามารถเปลี่ยนชุดข้อมูลในไฟล์ test_RFB.py ด้วยตนเองจากนั้นบันทึกผลการตรวจจับและส่งไปยังเซิร์ฟเวอร์