FCOS Download - FCOS -Quellcode herunterladen

FCOS

Python

1.0.0

Herunterladen

FCOS: Vollverkieferte einstufige Objekterkennung

In diesem Projekt wird der Code für die Implementierung des FCOS -Algorithmus zur Objekterkennung veranstaltet, wie in unserem Artikel angegeben:

 FCOS: Fully Convolutional One-Stage Object Detection;
Zhi Tian, Chunhua Shen, Hao Chen, and Tong He;
In: Proc. Int. Conf. Computer Vision (ICCV), 2019.
arXiv preprint arXiv:1904.01355

Das vollständige Papier ist unter: https://arxiv.org/abs/1904.01355 erhältlich.

Die Implementierung basierend auf DETECTRON2 ist in Adelaidet enthalten.

Ein Echtzeitmodell mit 46 fps und 40,3 in AP auf Coco Minival ist ebenfalls erhältlich.

Highlights

Total Ankerfrei: FCOs vermeidet die komplizierte Berechnung, die sich auf Ankerboxen und alle Hyperparameter von Ankerboxen beziehen.
Bessere Leistung: Der sehr einfache einstufige Detektor erzielt eine viel bessere Leistung (38,7 gegenüber 36,8 in AP mit ResNet-50) als schnellere R-CNN. Weitere Modelle und experimentelle Ergebnisse finden Sie hier.
Schnelleres Training und Test: Mit den gleichen Hardwares- und Backbone ResNet-50-FPN benötigen FCOs auch weniger Trainingszeiten (6,5h gegenüber 8,8 Stunden) als schnellere R-CNN. FCOs nimmt auch 12 ms weniger Inferenzzeit pro Bild als schnellere R-CNN (44 ms gegenüber 56 ms).
Hochmoderne Leistung: Unser bestes Modell basiert auf Resnext-64x4D-101 und deformierbare Konvolutionen erreicht 49,0% in AP auf CoCo-Test-Dev (mit mehrskaligen Tests).

Aktualisierungen

FCOs mit schneller und vielfältiger (FAD) -Scharchitektur suchen bei der FAD. (30/10/2020)
Skript zum Exportieren von ONNX -Modellen. (21/11/2019)
Neue NMS (siehe #165) beschleunigt die Modelle von Resne (X) T -basierten Modellen um bis zu 30% und Modelle auf Mobilenetbasis um 40% mit genau der gleichen Leistung. Schauen Sie sich hier an. (10.10.2019)
Neue Modelle mit viel verbesserter Leistung werden veröffentlicht. Das beste Modell erreicht 49% in AP auf Coco Test-Dev mit mehrskaligen Tests. (11/09/2019)
FCOs mit VOVNET-Backbones sind bei VOVNET-FCOS erhältlich. (08/08/2019)
Ein Trick bei der Verwendung einer kleinen zentralen Region der Bbox für das Training verbessert den AP um fast 1 Punkt, wie hier gezeigt. (23/07/2019)
FCOs mit HRNET-Backbones sind bei HRNet-FCOs erhältlich. (03.07.2019)
FCOS mit durchsuchten FPN (R50, R101, Resnext101 und Mobilenetv2) ist bei NAS-FCOS erhältlich. (30/06/2019)
FCOs wurden in mmdetektion implementiert. Vielen Dank an @yhcao6 und @hellock. (17/05/2019)

Erforderliche Hardware

Wir verwenden 8 nvidia v100 gpus.
Aber 4 1080Ti-GPUs können auch ein vollwertiges FCOS-Basis von RESNET-50-FPN basieren, da FCOs speichereffizient sind.

Installation

Nur-Test-Installation

Für Benutzer, die FCOs nur als Objektdetektor in ihren Projekten verwenden möchten, können sie es per PIP installieren. Um dies zu tun, rennen Sie:

 pip install torch  # install pytorch if you do not have it
pip install git+https://github.com/tianzhi0549/FCOS.git
# run this command line for a demo 
fcos https://github.com/tianzhi0549/FCOS/raw/master/demo/images/COCO_val2014_000000000885.jpg

Bitte besuchen Sie hier die Benutzeroberfläche.

Für eine vollständige Installation

Diese FCOS-Implementierung basiert auf Maskrcnn-Benchmark. Daher ist die Installation die gleiche wie die ursprüngliche Maskrcnn-Benchmark.

Bitte überprüfen Sie die Installationsanweisungen install.md. Möglicherweise möchten Sie auch den ursprünglichen Readme.md von Maskrcnn-Benchmark sehen.

Eine schnelle Demo

Sobald die Installation abgeschlossen ist, können Sie die folgenden Schritte ausführen, um eine schnelle Demo auszuführen.

 # assume that you are under the root directory of this project,
# and you have activated your virtual environment if needed.
wget https://huggingface.co/tianzhi/FCOS/resolve/main/FCOS_imprv_R_50_FPN_1x.pth?download=true -O FCOS_imprv_R_50_FPN_1x.pth
python demo/fcos_demo.py

Schlussfolgerung

Die Inferenzkommandozeile auf Coco Minival Split:

 python tools/test_net.py 
    --config-file configs/fcos/fcos_imprv_R_50_FPN_1x.yaml 
    MODEL.WEIGHT FCOS_imprv_R_50_FPN_1x.pth 
    TEST.IMS_PER_BATCH 4

Bitte beachten Sie::

Wenn der Name Ihres Modells unterschiedlich ist, ersetzen Sie bitte FCOS_imprv_R_50_FPN_1x.pth durch Ihren eigenen.
Wenn Sie außerhalb des Memory-Fehlers einschlagen, versuchen Sie, TEST.IMS_PER_BATCH zu reduzieren.
Wenn Sie ein anderes Modell bewerten möchten, ändern Sie bitte --config-file in seine Konfigurationsdatei (in Konfigurationen/FCOS) und MODEL.WEIGHT . Gewicht auf seine Gewichtsdatei.
Multi-GPU-Inferenz ist verfügbar. Weitere Informationen finden Sie in #78.
Wir haben die Effizienz nach der Nachbearbeitung durch die Verwendung von Multi-Label-NMs (siehe #165) verbessert, was durchschnittlich 18 ms spart. Die Inferenzmetrik in den folgenden Tabellen wurde entsprechend aktualisiert.

Modelle

Für Ihre Bequemlichkeit bieten wir die folgenden geschulten Modelle an (bald kommen bald Modelle).

Resne (x) ts:

Alle resne (x) t-basierten Modelle werden mit 16 Bildern in einer Mini-Batch- und Frozen-Stapel-Normalisierung trainiert (dh mit Modellen in maskrcnn_benchmark).

Modell	Multi-Scale-Training	Testzeit / IM	AP (Minival)	Link
FCOS_IMPRV_R_50_FPN_1X	NEIN	44 ms	38,7	herunterladen
Fcos_imprv_dcnv2_r_50_fpn_1x	NEIN	54 ms	42.3	herunterladen
FCOS_IMPRV_R_101_FPN_2X	Ja	57 ms	43.0	herunterladen
FCOS_IMPRV_DCNV2_R_101_FPN_2X	Ja	73 ms	45,6	herunterladen
Fcos_imprv_x_101_32x8d_fpn_2x	Ja	110 ms	44.0	herunterladen
Fcos_imprv_dcnv2_x_101_32x8d_fpn_2x	Ja	143 ms	46,4	herunterladen
Fcos_imprv_x_101_64x4d_fpn_2x	Ja	112 ms	44.7	herunterladen
Fcos_imprv_dcnv2_x_101_64x4d_fpn_2x	Ja	144 ms	46.6	herunterladen

Beachten Sie, dass imprv improvements in unserem Papier Tabelle 3 bezeichnet. Diese fast kostenfreien Änderungen verbessern die Leistung insgesamt um ~ 1,5%. Daher empfehlen wir dringend, sie zu verwenden. Im Folgenden sind die ursprünglichen Modelle in unserem ersten Papier aufgeführt.

Modell	Multi-Scale-Training	Testzeit / IM	AP (Minival)	AP (Test-dev)	Link
Fcos_r_50_fpn_1x	NEIN	45 ms	37.1	37,4	herunterladen
FCOS_R_101_FPN_2X	Ja	59 ms	41,4	41,5	herunterladen
Fcos_x_101_32x8d_fpn_2x	Ja	110 ms	42,5	42.7	herunterladen
Fcos_x_101_64x4d_fpn_2x	Ja	113 ms	43.0	43.2	herunterladen

Mobilens:

Wir aktualisieren die Batch -Normalisierung für Mobilenet -basierte Modelle. Wenn Sie Syncbn verwenden möchten, installieren Sie bitte Pytorch 1.1 oder höher.

Modell	Trainingseinheitgröße	Multi-Scale-Training	Testzeit / IM	AP (Minival)	Link
FCOS_SYNCBN_BS32_C128_MNV2_FPN_1X	32	NEIN	26 ms	30.9	herunterladen
FCOS_SYNCBN_BS32_MNV2_FPN_1X	32	NEIN	33 ms	33.1	herunterladen
Fcos_bn_bs16_mnv2_fpn_1x	16	NEIN	44 ms	31.0	herunterladen

[1] 1x und 2x bedeuten, dass das Modell für 90K- bzw. 180K -Iterationen trainiert wird.
[2] Alle Ergebnisse werden mit einem einzelnen Modell und ohne Testzeitvergrößerung wie Multi-Skala, Flipping usw. erhalten.
[3] c128 bezeichnet, dass das Modell 128 (anstelle von 256) Kanälen in Türmen (dh MODEL.RESNETS.BACKBONE_OUT_CHANNELS in config) enthält.
[4] dcnv2 bezeichnet deformierbare Faltungsnetzwerke v2. Beachten Sie, dass wir für rESNET -basierte Modelle deformierbare Konvolutionen von Stufe C3 auf C5 in Backbones anwenden. Für resNext -basierte Modelle verwenden nur Stadium C4 und C5 deformierbare Konvolutionen. Alle Modelle verwenden in der letzten Schicht von Detektortürmen deformierbare Konvolutionen.
[5] Das Modell FCOS_imprv_dcnv2_X_101_64x4d_FPN_2x mit Multi-Scale-Tests erreicht 49,0% in AP auf Coco-Test-Dev. Bitte verwenden Sie TEST.BBOX_AUG.ENABLED True , um mehrskalige Tests zu aktivieren.

Ausbildung

Die folgende Befehlszeile trainiert FCOS_IMPRV_R_50_FPN_1X auf 8 GPUs mit synchronem stochastischen Gradientenabstieg (SGD):

 python -m torch.distributed.launch 
    --nproc_per_node=8 
    --master_port=$((RANDOM + 10000)) 
    tools/train_net.py 
    --config-file configs/fcos/fcos_imprv_R_50_FPN_1x.yaml 
    DATALOADER.NUM_WORKERS 2 
    OUTPUT_DIR training_dir/fcos_imprv_R_50_FPN_1x

Beachten Sie, dass:

Wenn Sie weniger GPUs verwenden möchten, ändern Sie bitte --nproc_per_node an die Anzahl der GPUs. Keine anderen Einstellungen müssen geändert werden. Die Gesamtstapelgröße hängt nicht von nproc_per_node ab. Wenn Sie die Gesamtstapelgröße ändern möchten, ändern Sie bitte SOLVER.IMS_PER_BATCH in configs/fcos/fcos_r_50_fpn_1x.yaml.
Die Modelle werden in OUTPUT_DIR gespeichert.
Wenn Sie FCOs mit anderen Rückgräbern trainieren möchten, wechseln Sie bitte --config-file .
Wenn Sie FCOs in Ihrem eigenen Datensatz trainieren möchten, befolgen Sie diese Anweisung #54.
Jetzt kann das Training mit 8 GPUs und 4 GPUs die gleiche Leistung haben. Die vorherige Leistungslücke lag daran, dass wir num_pos zwischen GPUs beim Computerverlust nicht synchronisiert haben.

Onnx

Weitere Informationen zum Exportieren des Modells in ONNX finden Sie im Verzeichnis ONNX. Ein konvertiertes Modell kann hier heruntergeladen werden. Wir empfehlen Ihnen, Pytorch> = 1.4.0 (oder nächtliche) und Torchvision> = 0,5.0 (oder Nacht) für ONNX -Modelle zu verwenden.

Beitrag zum Projekt

Alle Zuganfragen oder Probleme sind willkommen.

Zitate

Bitte erwägen Sie, unser Papier in Ihren Veröffentlichungen zu zitieren, wenn das Projekt Ihre Forschung hilft. Die Bibtex -Referenz lautet wie folgt.

 @inproceedings{tian2019fcos,
  title   =  {{FCOS}: Fully Convolutional One-Stage Object Detection},
  author  =  {Tian, Zhi and Shen, Chunhua and Chen, Hao and He, Tong},
  booktitle =  {Proc. Int. Conf. Computer Vision (ICCV)},
  year    =  {2019}
}

 @article{tian2021fcos,
  title   =  {{FCOS}: A Simple and Strong Anchor-free Object Detector},
  author  =  {Tian, Zhi and Shen, Chunhua and Chen, Hao and He, Tong},
  booktitle =  {IEEE T. Pattern Analysis and Machine Intelligence (TPAMI)},
  year    =  {2021}
}

Anerkennung

Wir möchten uns bei @yqyao für die Tricks von Center Proben und Giou bedanken. Wir danken auch @bearcatt für seinen Vorschlag, den Center-Ness-Zweig mit einer Box-Regression zu positionieren (siehe #89).

Lizenz

Für die akademische Verwendung ist dieses Projekt unter der 2 -Klausel -BSD -Lizenz lizenziert - Einzelheiten finden Sie in der Lizenzdatei. Für den kommerziellen Gebrauch wenden Sie sich bitte an die Autoren.

Expandieren

Zusätzliche Informationen