참고 :이 프로젝트는 더 이상 유지 관리되지 않으며 최신 Pytorch (0.4.0 이후)와 호환되지 않을 수 있습니다.
이것은 Yolov2의 Pytorch 구현입니다. 이 프로젝트는 주로 Darkflow 및 Darknet을 기반으로합니다.
이미지 전처리를위한 후 처리 및 multiprocessing.Pool 을 위해 Cython 확장을 사용했습니다. VOC2007에서 이미지 테스트 비용은 약 13 ~ 20ms입니다.
Yolo 및 Yolov2에 대한 자세한 내용은 프로젝트 페이지와 논문을 참조하십시오 : Yolo9000 : Joseph Redmon과 Ali Farhadi의 더 나은, 더 빠르고, 더 강해집니다 .
참고 1 : 이것은 여전히 실험 프로젝트입니다. VOC07 테스트 맵은 약 0.71입니다 ( @cory8249에 의해보고 된 VOC07+12 TRAINVAL에 대한 교육). 훈련에 대한 자세한 내용은 issues1 및 isuse23을 참조하십시오.
참고 2 : multiprocessing.Pool.imap 이기 때문에 메모리 공간이 충분하지 않아서 멈추지 않기 때문에 Torch.utils.data.dataset을 사용하여 자신의 Dataloader를 작성하는 것이 좋습니다. Vocdataset의 dataloader 의 예 : ressue71.
참고 3 : Pytorch 0.4 : #59로 업그레이드
이 저장소를 복제하십시오
git clone [email protected]:longcw/yolo2-pytorch.git REORG 레이어 ( tf.extract_image_patches ) 빌드
cd yolo2-pytorch
./make.sh 훈련 된 모델 YOLO-VOC.WEEUDDS.H5 (링크 업데이트)를 다운로드하고 demo.py 에서 모델 경로를 설정하십시오.
데모 python demo.py 실행하십시오.
모든 데이터 세트에서 Yolo2를 훈련시킬 수 있습니다. 여기서 우리는 VOC2007/2012에서 훈련합니다.
교육, 검증, 테스트 데이터 및 Vocdevkit을 다운로드하십시오
wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar
wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar
wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCdevkit_08-Jun-2007.tar 이 모든 타르를 VOCdevkit 이라는 하나의 디렉토리로 추출하십시오.
tar xvf VOCtrainval_06-Nov-2007.tar
tar xvf VOCtest_06-Nov-2007.tar
tar xvf VOCdevkit_08-Jun-2007.tar이 기본 구조가 있어야합니다
$VOCdevkit / # development kit
$VOCdevkit /VOCcode/ # VOC utility code
$VOCdevkit /VOC2007 # image sets, annotations, etc.
# ... and several other directories ... 기본적으로 yolo2-pytorch/data 로 데이터를로드하는 프로그램이므로 데이터 경로를 다음과 같이 설정할 수 있습니다.
cd yolo2-pytorch
mkdir data
cd data
ln -s $VOCdevkit VOCdevkit2007 사전에 사전 RAKNET19 모델 (링크 업데이트)을 다운로드하고 경로를 yolo2-pytorch/cfgs/exps/darknet19_exp1.py 로 설정하십시오.
(선택 사항) Tensorboard를 사용한 교육.
Tensorboard를 사용하려면 yolo2-pytorch/cfgs/config.py 에서 use_tensorboard = True 설정하고 tensorboardx (https://github.com/lanpa/tensorboard-pytorch)를 설치하십시오. Tensorboard 로그는 training/runs 에 저장됩니다.
훈련 프로그램 : python train.py .
trained_model 의 경로를 yolo2-pytorch/cfgs/config.py 로 설정하십시오.
cd faster_rcnn_pytorch
mkdir output
python test.py포워드 패스는 네트워크에 4 개의 인수를 제공해야합니다.
im_data 이미지 데이터.C x H x W 형식이어야하며, 여기서 C 이미지의 컬러 채널에 해당하고 H 와 W 각각 높이와 너비입니다.utils/im_transform.py 에 제공된 imcv2_recolor 함수를 사용하여 이미지를 전처리하십시오. 또한 이미지가 416 x 416 픽셀로 크기를 조정했는지 확인하십시오.gt_boxes 각각의 크기 N x 4 인 numpy Array 목록, 여기서 N 이미지의 기능 수입니다. 각 행의 네 값은 x_bottom_left , y_bottom_left , x_top_right 및 y_top_right 에 해당해야합니다.gt_classes 각 배열이 gt_boxes 에 제공된 각 경계 상자의 클래스에 해당하는 정수 값이 포함 된 numpy Array 목록dontcare 목록 목록라이센스 : MIT 라이센스 (MIT)