注意:当我开始学习Pytorch时,我在这个项目中重新实现了更快的RCNN。然后,我在所有项目中都使用Pytorch。我仍然记得我花了一周的时间来弄清楚如何将CUDA代码构建为Pytorch层:)。但是实际上,这不是一个很好的实现,我没有获得与原始CAFFE代码相同的地图。
该项目不再维护,并且可能与最新的Pytorch不兼容(0.4.0之后)。所以我建议:
这是更快的RCNN的Pytorch实现。该项目主要基于py-faster-rcnn和tffrcnn。
有关R-CNN的详细信息,请参考更快的R-CNN纸张:通过Shaoqing Ren,Kaiming He,Ross Girshick,Jian Sun的Shaoqing Ren进行实时对象检测。
安装要求(您可以使用PIP或ANACONDA):
conda install pip pyyaml sympy h5py cython numpy scipy
conda install -c menpo opencv3
pip install easydict
克隆更快的R-CNN存储库
git clone [email protected]:longcw/faster_rcnn_pytorch.git构建NMS和ROI_Pooling层的Cython模块
cd faster_rcnn_pytorch/faster_rcnn
./make.sh下载训练有素的模型vggnet_fast_rcnn_iter_70000.h5(更新)并在demo.py中设置模型路径
运行演示python demo.py
关注此项目(TFFRCNN)下载并准备培训,验证,测试数据和ImageNet预先训练的VGG16模型。
由于该程序将数据加载到faster_rcnn_pytorch/data默认情况下,因此您可以将数据路径设置为如下。
cd faster_rcnn_pytorch
mkdir data
cd data
ln -s $VOCdevkit VOCdevkit2007然后,您可以在train.py和.yml文件中的培训参数中设置一些超参数。
现在,我在VOC07上获得了0.661的地图,而原始纸获得了0.699的地图。您可能需要调整在faster_rcnn/faster_rcnn.py中定义的损失函数。
借助蜡笔,我们可以访问张量板的可视化功率,以实现任何深度学习框架。
要使用Tensorboard,请安装蜡笔(https://github.com/torrvision/crayon),然后在faster_rcnn/train.py中设置use_tensorboard = True 。
在test.py中设置训练有素的模型的路径。
cd faster_rcnn_pytorch
mkdir output
python test.py许可证:麻省理工学院许可证(麻省理工学院)