liu,di huang,Yunhong Wang
受到人类视觉系统的接收场(RF)结构的启发,我们提出了一个新型的RF块(RFB)模块,该模块考虑了RF的大小和偏心率之间的关系,以增强特征的可区分性和鲁棒性。我们通过轻巧的CNN模型将RFB模块进一步将RFB模块组装到SSD的顶部,从而构建RFB NET检测器。您可以使用代码来训练/评估RFB NET进行对象检测。有关更多详细信息,请参阅我们的ECCV论文。

| 系统 | 地图 | FPS (Titan X Maxwell) |
|---|---|---|
| 更快的R-CNN(VGG16) | 73.2 | 7 |
| Yolov2(Darknet-19) | 78.6 | 40 |
| R-FCN(RESNET-101) | 80.5 | 9 |
| SSD300*(VGG16) | 77.2 | 46 |
| SSD512*(VGG16) | 79.8 | 19 |
| RFBNET300(VGG16) | 80.7 | 83 |
| RFBNET512(VGG16) | 82.2 | 38 |
| 系统 | 测试-DEV地图 | 时间(Titan X Maxwell) |
|---|---|---|
| 更快的R-CNN ++(RESNET-101) | 34.9 | 3.36 |
| Yolov2(Darknet-19) | 21.6 | 25ms |
| SSD300*(VGG16) | 25.1 | 22ms |
| SSD512*(VGG16) | 28.8 | 53ms |
| 视网膜500(RESNET-101-FPN) | 34.4 | 90ms |
| RFBNET300(VGG16) | 30.3 | 15ms |
| RFBNET512(VGG16) | 33.8 | 30ms |
| RFBNET512-E(VGG16) | 34.4 | 33ms |
| 系统 | 可可宽道图 | #参数 |
|---|---|---|
| SSD Mobilenet | 19.3 | 68m |
| RFB Mobilenet | 20.7 | 74m |
如果有助于您的研究,请在您的出版物中引用我们的论文:
@InProceedings{Liu_2018_ECCV,
author = {Liu, Songtao and Huang, Di and Wang, andYunhong},
title = {Receptive Field Block Net for Accurate and Fast Object Detection},
booktitle = {The European Conference on Computer Vision (ECCV)},
month = {September},
year = {2018}
}
./make.sh注意:检查您在utils/build.py中的GPU架构支持,第131行。默认值为:
'nvcc': ['-arch=sm_52',
conda install opencv注意:对于培训,我们目前支持VOC和可可。
为了使事情变得简单,我们提供了简单的VOC和可可数据集加载程序,该加载程序继承了torch.utils.data.Dataset ,使其与torchvision.datasets API完全兼容。
# specify a directory for dataset to be downloaded into, else default is ~/data/
sh data/scripts/VOC2007.sh # <directory> # specify a directory for dataset to be downloaded into, else default is ~/data/
sh data/scripts/VOC2012.sh # <directory>从官方网站上安装/路径/to/coco的MS可可数据集,默认为〜/data/coco。按照准备小型2014和Valminusminival2014注释的说明。所有标签文件(.json)均应在可可/注释/文件夹下。它应该具有这种基本结构
$COCO /
$COCO /cache/
$COCO /annotations/
$COCO /images/
$COCO /images/test2015/
$COCO /images/train2014/
$COCO /images/val2014/更新:当前的可可数据集已发布新的Train2017和Val2017集,它们只是相同图像集的新拆分。
首先下载FC降低的VGG-16 Pytorch基本网络权重:
Mobilenet预先培训的Basenet从Mobilenet-Caffe移植,其准确率比论文中报道的原始文件略好,重量文件可在以下网址提供:https://drive.google.com/open?id=13azsapybbbdjzfgiDqn1Inblpsddxcck14或baiduyun verter。
默认情况下,我们假设您已在RFBNet/weights dir中下载了该文件:
mkdir weights
cd weights
wget https://s3.amazonaws.com/amdegroot-models/vgg16_reducedfc.pthtrain_RFB.py中列出的参数指定为标志或手动更改它们即可。 python train_RFB.py -d VOC -v RFB_vgg -s 300 train_RFB.py了解选项),从检查站获取培训。评估训练有素的网络:
python test_RFB.py -d VOC -v RFB_vgg -s 300 --trained_model /path/to/model/weights默认情况下,它将在VOC2007测试或可可Minival2014上直接输出地图结果。对于VOC2012测试和可可Test-DEV结果,您可以在test_RFB.py文件中手动更改数据集,然后保存检测结果并提交给服务器。