FCOS下載 - FCOS源代碼下載

FCOS

Python

1.0.0

下載

FCO：完全卷積的一階段對象檢測

該項目託管用於實施FCOS算法以進行對象檢測的代碼，如我們的論文所示：

 FCOS: Fully Convolutional One-Stage Object Detection;
Zhi Tian, Chunhua Shen, Hao Chen, and Tong He;
In: Proc. Int. Conf. Computer Vision (ICCV), 2019.
arXiv preprint arXiv:1904.01355

完整的論文可在以下網址提供：https：//arxiv.org/abs/1904.01355。

基於檢測2的實現包含在AdeLaidet中。

這裡還提供了一個具有46fps的實時型號和46fps和40.3的Coco Minival上的實時型號。

亮點

完全不含錨點： FCO完全避免了與錨盒和所有超級參數相關的複雜計算。
更好的性能：非常簡單的單階段檢測器的性能要比更快的R-CNN取得更好的性能（38.7 vs. 36.8）。在此處查看更多模型和實驗結果。
更快的訓練和測試：使用相同的硬件和骨幹固定-50-FPN，FCO還需要比更快的R-CNN更少的訓練時間（6.5h vs. 8.8h）。與更快的R-CNN相比，FCO的推理時間還要少12毫米（44毫秒與56ms）。
最先進的性能：我們基於Resnext-64x4d-101的最佳模型和可變形的捲積在可可Test-DEV上的AP（帶有多尺度測試）的AP中達到49.0％ 。

更新

具有快速和多樣性（FAD）神經架構搜索的FCO在FAD中可以避免。（30/10/2020）
用於導出ONNX模型的腳本。（2019年11月21日）
新的NMS（請參閱＃165）將基於Resne（X）T的模型加快了30％，基於Mobilenet的模型的型號速度達到40％，其性能恰好相同。在這裡查看。（2019年12月10日）
釋放具有大大改進的新車型。最佳模型通過多尺度測試在可可測試DEV上獲得49％的AP。（2019年11月9日）
Vovnet-FCO可在帶有Vovnet骨架的FCO帶有FCO。（2019年8月8日）
如下所示，使用Bbox的小區域進行訓練的一種技巧將AP提高了近1點。（23/07/2019）
HRNET-FCO可在HRNET骨架上使用FCO。（2019年3月7日）
NAS-FCO可用使用AutoML搜索的FPN（R50，R101，Resnext101和MobilenetV2骨架）的FCO。（30/06/2019）
FCO已在MMDetection中實施。非常感謝 @yhcao6和@hellock。（17/05/2019）

需要硬件

我們使用8個NVIDIA V100 GPU。
但是4 1080TI GPU也可以訓練基於RESNET-50-FPN的FCO，因為FCO的存儲器有效。

安裝

僅測試的安裝

對於只想在項目中使用FCO作為對象檢測器的用戶，他們可以通過PIP安裝。為此，運行：

 pip install torch  # install pytorch if you do not have it
pip install git+https://github.com/tianzhi0549/FCOS.git
# run this command line for a demo 
fcos https://github.com/tianzhi0549/FCOS/raw/master/demo/images/COCO_val2014_000000000885.jpg

請在此處查看接口使用。

用於完整的安裝

該FCO實現基於MaskRCNN基準。因此，安裝與原始MaskRCNN基準相同。

請檢查install.md以獲取安裝說明。您可能還需要查看MaskRCNN基準的原始readme.md。

快速演示

安裝完成後，您可以按照以下步驟進行快速演示。

 # assume that you are under the root directory of this project,
# and you have activated your virtual environment if needed.
wget https://huggingface.co/tianzhi/FCOS/resolve/main/FCOS_imprv_R_50_FPN_1x.pth?download=true -O FCOS_imprv_R_50_FPN_1x.pth
python demo/fcos_demo.py

推理

可可省minival拆分上的推理命令行：

 python tools/test_net.py 
    --config-file configs/fcos/fcos_imprv_R_50_FPN_1x.yaml 
    MODEL.WEIGHT FCOS_imprv_R_50_FPN_1x.pth 
    TEST.IMS_PER_BATCH 4

請注意：

如果您的模型的名稱不同，請用自己的FCOS_imprv_R_50_FPN_1x.pth替換。
如果您遇到了不可存儲的錯誤，請嘗試將TEST.IMS_PER_BATCH減少到1。
如果要評估不同的模型，請更改--config-file將其配置文件（以configs/fcos）和型號為MODEL.WEIGHT 。
可以使用多GPU推理，請參閱＃78。
我們通過使用多標籤NMS（請參閱＃165）提高了後過程效率，該效率平均節省了18ms。以下表中的推論指標已相應更新。

型號

為了方便起見，我們提供以下訓練有素的模型（即將推出更多型號）。

Resne（X）TS：

所有基於RESNE（X）T的模型均經過微型批次和冷凍批歸一化的16張圖像訓練（即，與MaskRCNN_BENCHMARCH中的模型一致）。

模型	多尺度培訓	測試時間 / IM	AP（友人）	關聯
fcos_imprv_r_50_fpn_1x	不	44ms	38.7	下載
fcos_imprv_dcnv2_r_50_fpn_1x	不	54ms	42.3	下載
fcos_imprv_r_101_fpn_2x	是的	57ms	43.0	下載
fcos_imprv_dcnv2_r_101_fpn_2x	是的	73ms	45.6	下載
fcos_imprv_x_101_32x8d_fpn_2x	是的	110ms	44.0	下載
fcos_imprv_dcnv2_x_101_32x8d_fpn_2x	是的	143ms	46.4	下載
fcos_imprv_x_101_64x4d_fpn_2x	是的	112ms	44.7	下載
fcos_imprv_dcnv2_x_101_64x4x4d_fpn_2x	是的	144ms	46.6	下載

請注意， imprv在我們的論文表3中表示improvements 。這些幾乎無需成本的變化總共提高了約1.5％的績效。因此，我們強烈建議使用它們。以下是我們初始論文中介紹的原始模型。

模型	多尺度培訓	測試時間 / IM	AP（友人）	AP（test-dev）	關聯
FCOS_R_50_FPN_1X	不	45ms	37.1	37.4	下載
FCOS_R_101_FPN_2X	是的	59ms	41.4	41.5	下載
fcos_x_101_32x8d_fpn_2x	是的	110ms	42.5	42.7	下載
fcos_x_101_64x4d_fpn_2x	是的	113ms	43.0	43.2	下載

Mobilenets：

我們更新基於Mobilenet模型的批處理歸一化。如果要使用Syncbn，請安裝Pytorch 1.1或更高版本。

模型	培訓批量大小	多尺度培訓	測試時間 / IM	AP（友人）	關聯
fcos_syncbn_bs32_c128_mnv2_fpn_1x	32	不	26ms	30.9	下載
fcos_syncbn_bs32_mnv2_fpn_1x	32	不	33ms	33.1	下載
fcos_bn_bs16_mnv2_fpn_1x	16	不	44ms	31.0	下載

[1] 1x和2x表示該模型分別用於90K和180K迭代。
[2]所有結果都是通過單個模型獲得的，沒有任何測試時間數據增加，例如多尺度，翻轉等。
[3] c128表示該模型在塔中有128個（而不是256個）頻道（即配置中的MODEL.RESNETS.BACKBONE_OUT_CHANNELS ）。
[4] dcnv2表示可變形的捲積網絡V2。請注意，對於基於重新連接的模型，我們在骨幹中應用了從C3階段到C5的可變形卷積。對於基於RESNEXT的模型，僅C4和C5階段使用可變形的捲積。所有模型在最後一層的探測器塔中使用可變形的捲積。
[5]模型FCOS_imprv_dcnv2_X_101_64x4d_FPN_2x帶有多尺度測試的模型在可可Test-DEV上的AP中獲得了49.0％。請使用TEST.BBOX_AUG.ENABLED True啟用多尺度測試。

訓練

以下命令行將使用同步隨機梯度下降（SGD）在8 GPU上訓練FCOS_IMPRV_R_50_FPN_1X：

 python -m torch.distributed.launch 
    --nproc_per_node=8 
    --master_port=$((RANDOM + 10000)) 
    tools/train_net.py 
    --config-file configs/fcos/fcos_imprv_R_50_FPN_1x.yaml 
    DATALOADER.NUM_WORKERS 2 
    OUTPUT_DIR training_dir/fcos_imprv_R_50_FPN_1x

注意：

如果您想使用較少的GPU，請更改--nproc_per_node為GPU的數量。無需更改其他設置。總批量大小不取決於nproc_per_node 。如果要更改總批量大小，請在configs/fcos/fcos_r_50_fpn_1x.yaml中更改SOLVER.IMS_PER_BATCH 。
這些模型將保存到OUTPUT_DIR中。
如果您想用其他骨幹訓練FCO，請更改--config-file 。
如果您想在自己的數據集上訓練FCO，請按照此說明＃54進行操作。
現在，使用8 GPU和4 GPU的培訓可以具有相同的性能。以前的性能差距是因為我們在計算損失時沒有在GPU之間同步num_pos 。

onnx

請參閱目錄ONNX目錄，以將模型導出到ONNX。可以在此處下載轉換的模型。我們建議您使用pytorch> = 1.4.0（或每晚）和火炬> = 0.5.0（或每晚）進行ONNX型號。

為該項目做出貢獻

歡迎任何拉的請求或問題。

引用

如果該項目有助於您的研究，請考慮在您的出版物中引用我們的論文。 Bibtex參考如下。

 @inproceedings{tian2019fcos,
  title   =  {{FCOS}: Fully Convolutional One-Stage Object Detection},
  author  =  {Tian, Zhi and Shen, Chunhua and Chen, Hao and He, Tong},
  booktitle =  {Proc. Int. Conf. Computer Vision (ICCV)},
  year    =  {2019}
}

 @article{tian2021fcos,
  title   =  {{FCOS}: A Simple and Strong Anchor-free Object Detector},
  author  =  {Tian, Zhi and Shen, Chunhua and Chen, Hao and He, Tong},
  booktitle =  {IEEE T. Pattern Analysis and Machine Intelligence (TPAMI)},
  year    =  {2021}
}