retinanet examples Unduh - retinanet examples Pengunduhan Kode Sumber

retinanet examples

ular piton

1.0.0

Unduh

NVIDIA Object Detection Toolkit (ODTK)

Deteksi objek satu tahap tunggal yang cepat dan akurat dengan optimasi GPU ujung ke ujung.

Keterangan

ODTK adalah detektor objek tembakan tunggal dengan berbagai tulang punggung dan kepala deteksi. Ini memungkinkan pertukaran kinerja/akurasi.

Ini dioptimalkan untuk pemrosesan GPU ujung ke ujung menggunakan:

Kerangka kerja pembelajaran mendalam Pytorch dengan dukungan ONNX
NVIDIA APEX untuk presisi campuran dan pelatihan terdistribusi
Nvidia dali untuk pra-pemrosesan data yang dioptimalkan
Nvidia tensorrt untuk inferensi kinerja tinggi
Nvidia Deepstream untuk Dukungan Stream Video Real-Time yang Dioptimalkan

Deteksi kotak pembatas yang diputar

Repo ini sekarang mendukung deteksi kotak pembatas yang diputar. Lihat Pelatihan Deteksi Rotasi dan Deteksi Deteksi Rotasi Dokumen Inferensi untuk informasi lebih lanjut tentang cara menggunakan perintah --rotated-bbox .

Anotasi kotak pembatas dijelaskan oleh [x, y, w, h, theta] .

Pertunjukan

Pipa deteksi memungkinkan pengguna untuk memilih tulang punggung tertentu tergantung pada trade-off akurasi latensi yang disukai.

Akurasi model retinanet ODTK dan latensi inferensi & FPS (frame per detik) untuk Coco 2017 (Train/Val) setelah jadwal pelatihan penuh. Hasil inferensi termasuk kotak pembatas pasca pemrosesan untuk ukuran batch 1. Inferensi yang diukur pada --resize 800 menggunakan --with-dali pada mesin Tensorrt FP16.

Tulang punggung	peta @[IOU = 0,50: 0,95]	Waktu pelatihan di DGX1V	Latensi inferensi FP16 di V100	Inferensi latensi int8 pada t4	Latensi inferensi FP16 di A100	Inferensi Latensi Int8 pada A100
Resnet18fpn	0.318	5 jam	14 ms; 71 fps	18 ms; 56 fps	9 ms; 110 fps	7 ms; 141 fps
MobileNetV2FPN	0.333		14 ms; 74 fps	18 ms; 56 fps	9 ms; 114 fps	7 ms; 138 fps
Resnet34fpn	0.343	6 jam	16 ms; 64 fps	20 ms; 50 fps	10 ms; 103 fps	7 ms; 142 fps
Resnet50fpn	0.358	7 jam	18 ms; 56 fps	22 ms; 45 fps	11 ms; 93 fps	8 ms; 129 fps
Resnet101fpn	0.376	10 jam	22 ms; 46 fps	27 ms; 37 fps	13 ms; 78 fps	9 ms; 117 fps
Resnet152fpn	0.393	12 jam	26 ms; 38 fps	33 ms; 31 fps	15 ms; 66 fps	10 ms; 103 fps

Instalasi

Untuk kinerja terbaik, gunakan wadah Pytorch NGC Docker terbaru. Kloning repositori ini, bangun dan jalankan gambar Anda sendiri:

git clone https://github.com/nvidia/retinanet-examples
docker build -t odtk:latest retinanet-examples/
docker run --gpus all --rm --ipc=host -it odtk:latest

Penggunaan

Pelatihan, inferensi, evaluasi dan ekspor model dapat dilakukan melalui utilitas odtk . Untuk detail lebih lanjut, termasuk daftar parameter, silakan lihat dokumentasi pelatihan dan inferensi.

Pelatihan

Latih model deteksi pada Coco 2017 dari tulang punggung pra-terlatih:

odtk train retinanet_rn50fpn.pth --backbone ResNet50FPN 
    --images /coco/images/train2017/ --annotations /coco/annotations/instances_train2017.json 
    --val-images /coco/images/val2017/ --val-annotations /coco/annotations/instances_val2017.json

Tuning fine

Fine-tune model pra-terlatih pada dataset Anda. Dalam contoh di bawah ini kami menggunakan VOC Pascal dengan anotasi JSON:

odtk train model_mydataset.pth --backbone ResNet50FPN 
    --fine-tune retinanet_rn50fpn.pth 
    --classes 20 --iters 10000 --val-iters 1000 --lr 0.0005 
    --resize 512 --jitter 480 640 --images /voc/JPEGImages/ 
    --annotations /voc/pascal_train2012.json --val-annotations /voc/pascal_val2012.json

Catatan: Sisi yang lebih pendek dari gambar input akan diubah ukurannya untuk resize selama sisi yang lebih panjang tidak menjadi lebih besar dari max-size . Selama pelatihan, gambar akan secara acak diubah ukuran secara acak ke ukuran baru dalam kisaran jitter .

Kesimpulan

Evaluasi Model Deteksi Anda di Coco 2017:

odtk infer retinanet_rn50fpn.pth --images /coco/images/val2017/ --annotations /coco/annotations/instances_val2017.json

Jalankan inferensi pada dataset Anda:

odtk infer retinanet_rn50fpn.pth --images /dataset/val --output detections.json

Inferensi yang dioptimalkan dengan Tensorrt

Untuk inferensi yang lebih cepat, ekspor model deteksi ke mesin Tensorrt FP16 yang dioptimalkan:

odtk export model.pth engine.plan

Evaluasi model dengan backend Tensorrt pada Coco 2017:

odtk infer engine.plan --images /coco/images/val2017/ --annotations /coco/annotations/instances_val2017.json

Inferensi int8 dengan Tensorrt

Untuk inferensi yang lebih cepat, lakukan kalibrasi int8 untuk membuat mesin Tensorrt Int8 yang dioptimalkan:

odtk export model.pth engine.plan --int8 --calibration-images /coco/images/val2017/

Ini akan membuat file Int8CalibrationTable yang dapat digunakan untuk membuat mesin TensorRt Int8 untuk model yang sama di kemudian hari tanpa perlu melakukan kalibrasi.

Atau buat mesin Tensorrt Int8 yang dioptimalkan menggunakan tabel kalibrasi yang di -cache:

odtk export model.pth engine.plan --int8 --calibration-table /path/to/INT8CalibrationTable

Kumpulan data

Retinanet mendukung anotasi dalam format Coco JSON. Saat mengubah anotasi dari dataset Anda sendiri menjadi JSON, entri berikut diperlukan:

 {
    "images": [{
        "id" : int,
        "file_name" : str
    }],
    "annotations": [{
        "id" : int,
        "image_id" : int, 
        "category_id" : int,
        "bbox" : [x, y, w, h]   # all floats
        "area": float           # w * h. Required for validation scores
        "iscrowd": 0            # Required for validation scores
    }],
    "categories": [{
        "id" : int
    ]}
}

Jika menggunakan flag --rotated-bbox untuk deteksi yang diputar, tambahkan theta float tambahan ke anotasi. Untuk mendapatkan skor validasi, Anda juga perlu mengisi bagian segmentation .

        "bbox" : [x, y, w, h, theta]    # all floats, where theta is measured in radians anti-clockwise from the x-axis.
        "segmentation" : [[x1, y1, x2, y2, x3, y3, x4, y4]]
                                        # Required for validation scores.

Penafian

Ini adalah proyek penelitian, bukan produk NVIDIA resmi.

Kompatibilitas Jetpack

Cabang ini menggunakan Tensorrt 7. Jika Anda melatih dan menyimpulkan model menggunakan Pytorch, atau membuat mesin Tensorrt di Tesla GPU (misalnya V100, T4), maka Anda harus menggunakan cabang ini.

Jika Anda ingin menggunakan model Anda ke perangkat Jetson (misalnya - Jetson Agx Xavier) menjalankan Jetpack versi 4.3, maka Anda harus menggunakan cabang 19.10 dari repo ini.

Referensi

Kehilangan fokus untuk deteksi objek yang padat. Tsung-yi Lin, Priya Goyal, Ross Girshick, Kaiming He, Piotr Dollár. ICCV, 2017.
SGD minibatch yang akurat, pelatihan ImageNet dalam 1 jam. Priya Goyal, Piotr Dollár, Ross Girshick, Pieter Noordhuis, Lukasz Wesolowski, Aapo Kyrola, Andrew Tulloch, Yangqing Jia, Kaiming He. Juni 2017.
Fitur jaringan piramida untuk deteksi objek. Tsung-yi Lin, Piotr Dollár, Ross Girshick, Kaiming He, Bharath Hariharan, Serge milik. CVPR, 2017.
Pembelajaran residu yang mendalam untuk pengenalan gambar. Kaiming He, Xiangyu Zhang, Shaoqing Renm Jian Sun. CVPR, 2016.

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe ular piton
Waktu Pembaruan 2025-07-11
ukuran 98.79KB
Berasal dari Github

Aplikasi Terkait

GitHub sgrebnov/cordova plugin background download

2024-11-05
aspera api examples

2024-11-04
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Kode sumber demonstrasi Contoh OoutSuite (C#/Vb).

2009-05-25

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ToDo Co

ular piton

1.0.0
Python Portfolio

ular piton
Alat bagan data sumber terbuka Redash v24.10.0

ular piton

24.10.0
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua