Сондтао Лю, Ди Хуан, Юнхон Ванг
Вдохновленный структурой рецептивных полей (RFS) в визуальных системах человека, мы предлагаем новый модуль RF -блока (RFB), который принимает во внимание взаимосвязь между размером и эксцентричностью RFS, чтобы повысить дискриминируемость и надежность особенностей. Мы также собираем модуль RFB в верхнюю часть SSD с легкой моделью CNN, построив детектор RFB. Вы можете использовать код для обучения/оценки сети RFB для обнаружения объектов. Для получения более подробной информации, пожалуйста, обратитесь к нашей бумаге ECCV.

| Система | карта | FPS (Titan X Maxwell) |
|---|---|---|
| Быстрее R-CNN (VGG16) | 73,2 | 7 |
| Yolov2 (Darknet-19) | 78.6 | 40 |
| R-FCN (RESNET-101) | 80.5 | 9 |
| SSD300* (VGG16) | 77.2 | 46 |
| SSD512* (VGG16) | 79,8 | 19 |
| RFBnet300 (VGG16) | 80.7 | 83 |
| RFBNet512 (VGG16) | 82.2 | 38 |
| Система | тестовая карта | Время (Титан X Максвелл) |
|---|---|---|
| Быстрее r-cnn ++ (resnet-101) | 34.9 | 3,36 с |
| Yolov2 (Darknet-19) | 21.6 | 25 мс |
| SSD300* (VGG16) | 25.1 | 22 мс |
| SSD512* (VGG16) | 28.8 | 53 мс |
| Retinanet500 (resnet-101-fpn) | 34.4 | 90 мс |
| RFBnet300 (VGG16) | 30.3 | 15 мс |
| RFBNet512 (VGG16) | 33,8 | 30 мс |
| Rfbnet512-e (VGG16) | 34.4 | 33 мс |
| Система | Coco Minival Map | #Параметры |
|---|---|---|
| SSD Mobilenet | 19.3 | 6,8 м |
| RFB Mobilenet | 20.7 | 7,4 м |
Пожалуйста, процитируйте нашу статью в ваших публикациях, если это поможет вашему исследованию:
@InProceedings{Liu_2018_ECCV,
author = {Liu, Songtao and Huang, Di and Wang, andYunhong},
title = {Receptive Field Block Net for Accurate and Fast Object Detection},
booktitle = {The European Conference on Computer Vision (ECCV)},
month = {September},
year = {2018}
}
./make.shПримечание . Проверьте поддержку архитектуры GPU в utils/build.py, строка 131. По умолчанию это:
'nvcc': ['-arch=sm_52',
conda install opencvПримечание. Для обучения мы в настоящее время поддерживаем VOC и Coco.
Чтобы облегчить ситуацию, мы предоставляем простой загрузчик набора данных VOC и COCO, который наследует torch.utils.data.Dataset torchvision.datasets
# specify a directory for dataset to be downloaded into, else default is ~/data/
sh data/scripts/VOC2007.sh # <directory> # specify a directory for dataset to be downloaded into, else default is ~/data/
sh data/scripts/VOC2012.sh # <directory>Установите набор данных MS Coco AT/PATH/TO/COCO с официального веб -сайта, по умолчанию ~/DATA/COCO. Следуя инструкциям по подготовке аннотаций Minival2014 и Valminusminival2014 . Все файлы метки (.json) должны находиться под кокосовой/ аннотацией/ папкой. У него должна быть эта основная структура
$COCO /
$COCO /cache/
$COCO /annotations/
$COCO /images/
$COCO /images/test2015/
$COCO /images/train2014/
$COCO /images/val2014/Обновление : текущий набор данных COCO выпустил новые наборы Train2017 и Val2017 , которые являются всего лишь новыми распадами тех же наборов изображений.
Сначала загрузите FC-восстановленные VGG-16 Pytorch Base Weewors по адресу: https://s3.amazonaws.com/amdegroot-models/vgg16_reducedfc.pth или от нашего драйвера Baiduyun
Предварительно обученный BaseNet Mobilenet является переносимым из Mobilenet-Caffe, который достигает немного лучших показателей точности, чем оригинальный в статье, файл веса доступен по адресу: https://drive.google.com/open?id=13astapybbbdjzfgidqn1inblpsdxck14 или Baiduyun.
По умолчанию мы предполагаем, что вы загрузили файл в RFBNet/weights Dir:
mkdir weights
cd weights
wget https://s3.amazonaws.com/amdegroot-models/vgg16_reducedfc.pthtrain_RFB.py в качестве флага или вручную изменить их. python train_RFB.py -d VOC -v RFB_vgg -s 300 train_RFB.py для вариантов)Чтобы оценить обученную сеть:
python test_RFB.py -d VOC -v RFB_vgg -s 300 --trained_model /path/to/model/weights По умолчанию он напрямую выведет результаты карты на тестировании VOC2007 или Coco Minival2014 . Для результатов тестирования VOC2012 и Coco Test-DEV вы можете вручную изменить наборы данных в файле test_RFB.py , а затем сохранить результаты обнаружения и отправить на сервер.