deep person reid Download - deep person reid Sumber Code Unduh

deep person reid

ular piton

v1.0.6

Unduh

Torchreid

Torchreid adalah perpustakaan untuk identifikasi ulang orang belajar yang dalam, ditulis dalam Pytorch dan dikembangkan untuk proyek ICCV'19 kami, pembelajaran fitur skala omni untuk identifikasi ulang orang.

Fiturnya:

Pelatihan Multi-GPU
Mendukung gambaran gambar dan video
Pelatihan dan evaluasi ujung ke ujung
Persiapan dataset Reid yang sangat mudah
Pelatihan multi-dataset
Evaluasi Dataet Silang
protokol standar yang digunakan oleh sebagian besar makalah penelitian
Sangat ekstensible (mudah ditambahkan model, set data, metode pelatihan, dll.)
Implementasi Model Reid Deep State-of-the-Art
Akses ke model Reid pretrained
Teknik pelatihan lanjutan
Alat Visualisasi (Tensorboard, Ranks, dll.)

Kode: https://github.com/kaiyangzhou/deep-person-reid.

Dokumentasi: https://kaiyangzhou.github.io/deep-person-reid/.

Instruksi cara-cara: https://kaiyangzhou.github.io/deep-person-reid/user_guide.

Model Zoo: https://kaiyangzhou.github.io/deep-person-reid/model_zoo.

Laporan Teknologi: https://arxiv.org/abs/1910.10093.

Anda dapat menemukan beberapa proyek penelitian yang dibangun di atas Torchreid di sini.

Apa yang baru

[Agustus 2022] Kami telah menambahkan kemampuan ekspor model ke kerangka kerja berikut: Onnx, OpenVino dan TFlite. Skrip ekspor dapat ditemukan di sini
[Agustus 2021] Kami telah merilis model ImagEnet-pretrained dari osnet_ain_x0_75 , osnet_ain_x0_5 dan osnet_ain_x0_25 . Pengaturan pretraining mengikuti pycls.
[Apr 2021] Kami telah memperbarui lampiran dalam versi TPAMI OSNET untuk memasukkan hasil dalam pengaturan generalisasi domain multi-sumber. Model terlatih dapat ditemukan di kebun binatang model.
[Apr 2021] Kami telah menambahkan skrip untuk mengotomatiskan proses menghitung hasil rata -rata selama beberapa pemisahan. Untuk detail lebih lanjut silakan lihat tools/parse_test_res.py .
[Apr 2021] v1.4.0 : Kami menambahkan dataset pencarian orang, Cuhk-Sysu. Silakan lihat dokumentasi tentang cara mengunduh dataset (berisi gambar orang yang dipotong).
[Apr 2021] Semua model di Zoo Model telah dipindahkan ke Google Drive. Harap angkat masalah jika kinerja model tidak ada yang tidak konsisten dengan angka yang ditunjukkan di halaman Model Zoo (dapat disebabkan oleh tautan yang salah).
[Mar 2021] Osnet akan muncul di Tpami Journal! Dibandingkan dengan versi konferensi, yang berfokus pada pembelajaran fitur diskriminatif menggunakan blok bangunan skala omni, ekstensi jurnal ini lebih lanjut mempertimbangkan pembelajaran fitur yang dapat digeneralisasikan dengan mengintegrasikan lapisan normalisasi instance dengan arsitektur OSNET. Kami berharap makalah jurnal ini dapat memotivasi lebih banyak pekerjaan di masa depan untuk menangani masalah generalisasi dalam ID kembali dataset silang.
[Mar 2021] Generalisasi lintas domain (set data) secara langsung sangat penting dalam aplikasi dunia nyata, yang terkait erat dengan topik generalisasi domain . Tertarik mempelajari bagaimana bidang generalisasi domain telah berkembang selama dekade terakhir? Periksa survei terbaru kami dalam topik ini di https://arxiv.org/abs/2103.02503, dengan liputan pada sejarah, set data, masalah terkait, metodologi, arah potensial, dan sebagainya ( metode yang dirancang untuk ulang yang dapat digeneralisasikan juga dibahas !).
[FEB 2021] v1.3.6 Menambahkan Universitas-1652, dataset baru untuk multi-view geo-localization multi-sumber (kredit ke Zhedong Zheng).
[Feb 2021] v1.3.5 : Sekarang kode Cython berfungsi pada windows (kredit ke lablabla).
[Jan 2021] Pekerjaan terbaru kami, Mixstyle (mencampur statistik fitur tingkat contoh sampel dari berbagai domain untuk meningkatkan generalisasi domain), telah diterima untuk ICLR'21. Kode ini telah dirilis di https://github.com/kaiyangzhou/mixstyle-release di mana orang tersebut kembali didasarkan pada Torchreid.
[Jan 2021] Metrik evaluasi baru yang disebut Mean Inverse Negative Penalty (MINP) untuk orang ulang orang telah diperkenalkan dalam pembelajaran mendalam untuk identifikasi ulang orang: survei dan pandangan (TPAMI 2021). Kode mereka dapat diakses di https://github.com/mangye16/reid-survey.
[Agustus 2020] v1.3.3 : Memperbaiki bug di visrank (disebabkan oleh tidak membongkar dsetid ).
[Agustus 2020] v1.3.2 : Ditambahkan _junk_pids ke grid dan prid . Ini menghindari penggunaan gambar galeri yang salah berlabel untuk pelatihan saat mengatur combineall=True .
[Agustus 2020] v1.3.0 : (1) Menambahkan dsetid ke sumber data 3-tuple yang ada, yang dihasilkan (impath, pid, camid, dsetid) . Variabel ini menunjukkan ID dataset dan berguna saat menggabungkan beberapa set data untuk pelatihan (sebagai indikator dataset). Misalnya, saat menggabungkan market1501 dan cuhk03 , yang pertama akan ditugaskan dsetid=0 sementara yang terakhir akan ditugaskan dsetid=1 . (2) Menambahkan RandomDatasetSampler . Analog dengan RandomDomainSampler , RandomDatasetSampler Sampel Sejumlah gambar tertentu ( batch_size // num_datasets ) dari masing -masing set data yang ditentukan (jumlah tersebut ditentukan oleh num_datasets ).
[Agustus 2020] v1.2.6 : Menambahkan RandomDomainSampler (itu sampel num_cams masing-masing dengan gambar batch_size // num_cams untuk membentuk mini-batch).
[Juni 2020] v1.2.5 : (1) Output Dataloader dari __getitem__ telah diubah dari list menjadi dict . Sebelumnya, sebuah elemen, misalnya tensor gambar, diambil dengan imgs=data[0] . Sekarang harus diperoleh oleh imgs=data['img'] . Lihat komit ini untuk perubahan terperinci. (2) Menambahkan k_tfm sebagai opsi untuk pemuat data gambar, yang memungkinkan augmentasi data diterapkan k_tfm kali secara independen ke suatu gambar. Jika k_tfm > 1 , imgs=data['img'] mengembalikan daftar dengan tensor gambar k_tfm .
[Mei 2020] Menambahkan kode pengenalan atribut orang yang digunakan dalam pembelajaran fitur skala omni untuk identifikasi ulang orang (ICCV'19). Lihat projects/attribute_recognition/ .
[Mei 2020] v1.2.1 : Menambahkan API sederhana untuk ekstraksi fitur ( torchreid/utils/feature_extractor.py ). Lihat dokumentasi untuk instruksi.
[Apr 2020] Kode untuk mereproduksi eksperimen pembelajaran timbal balik yang mendalam di koran OSNET (Supp. B) telah dirilis di projects/DML .
[Apr 2020] ditingkatkan ke v1.2.0 . Kelas mesin telah dibuat lebih banyak model-agnostik untuk meningkatkan ekstensibilitas. Lihat Mesin dan ImagesoftmaxEngine untuk lebih jelasnya. Kredit untuk dassl.pytorch.
[Des 2019] Makalah OSNET kami telah diperbarui, dengan eksperimen tambahan (di bagian B tambahan) menunjukkan beberapa teknik yang berguna untuk meningkatkan kinerja Osnet dalam praktiknya.
[Nov 2019] ImageDataManager dapat memuat data pelatihan dari dataset target dengan mengatur load_train_targets=True , dan loader kereta dapat diakses dengan train_loader_t = datamanager.train_loader_t . Fitur ini berguna untuk penelitian adaptasi domain.

Instalasi

Pastikan Conda diinstal.

 # cd to your preferred directory and clone this repo
git clone https://github.com/KaiyangZhou/deep-person-reid.git

# create environment
cd deep-person-reid/
conda create --name torchreid python=3.7
conda activate torchreid

# install dependencies
# make sure `which python` and `which pip` point to the correct path
pip install -r requirements.txt

# install torch and torchvision (select the proper cuda version to suit your machine)
conda install pytorch torchvision cudatoolkit=9.0 -c pytorch

# install torchreid (don't need to re-build it if you modify the source code)
python setup.py develop

Cara lain untuk menginstal adalah menjalankan semuanya di dalam wadah Docker:

Build: make build-image
Jalankan: make run

Mulailah: 30 detik untuk Torchreid

Impor torchreid

 import torchreid

Muat Manajer Data

 datamanager = torchreid . data . ImageDataManager (
    root = "reid-data" ,
    sources = "market1501" ,
    targets = "market1501" ,
    height = 256 ,
    width = 128 ,
    batch_size_train = 32 ,
    batch_size_test = 100 ,
    transforms = [ "random_flip" , "random_crop" ]
)

3 Build Model, Optimizer dan LR_SCHEDURER

 model = torchreid . models . build_model (
    name = "resnet50" ,
    num_classes = datamanager . num_train_pids ,
    loss = "softmax" ,
    pretrained = True
)

model = model . cuda ()

optimizer = torchreid . optim . build_optimizer (
    model ,
    optim = "adam" ,
    lr = 0.0003
)

scheduler = torchreid . optim . build_lr_scheduler (
    optimizer ,
    lr_scheduler = "single_step" ,
    stepsize = 20
)

Membangun mesin

 engine = torchreid . engine . ImageSoftmaxEngine (
    datamanager ,
    model ,
    optimizer = optimizer ,
    scheduler = scheduler ,
    label_smooth = True
)

Jalankan pelatihan dan tes

 engine . run (
    save_dir = "log/resnet50" ,
    max_epoch = 60 ,
    eval_freq = 10 ,
    print_freq = 10 ,
    test_only = False
)

Antarmuka terpadu

Dalam "Deep-Person-Reid/Scripts/", kami menyediakan antarmuka terpadu untuk melatih dan menguji model. Lihat "Scripts/Main.py" dan "Scripts/Default_config.py" untuk lebih jelasnya. Folder "Configs/" berisi beberapa konfigurasi yang telah ditentukan yang dapat Anda gunakan sebagai titik awal.

Di bawah ini kami memberikan contoh untuk melatih dan menguji Osnet (Zhou et al. ICCV'19). Asumsikan PATH_TO_DATA adalah direktori yang berisi dataset Reid. Variabel lingkungan CUDA_VISIBLE_DEVICES dihilangkan, yang perlu Anda tentukan jika Anda memiliki kumpulan GPU dan ingin menggunakan satu set tertentu.

Pengaturan konvensional

Untuk melatih Osnet di Market1501, lakukan

python scripts/main.py 
--config-file configs/im_osnet_x1_0_softmax_256x128_amsgrad_cosine.yaml 
--transforms random_flip random_erase 
--root $PATH_TO_DATA

File konfigurasi menetapkan Market1501 sebagai dataset default. Jika Anda ingin menggunakan Dukemtmc-Reid, lakukan

python scripts/main.py 
--config-file configs/im_osnet_x1_0_softmax_256x128_amsgrad_cosine.yaml 
-s dukemtmcreid 
-t dukemtmcreid 
--transforms random_flip random_erase 
--root $PATH_TO_DATA 
data.save_dir log/osnet_x1_0_dukemtmcreid_softmax_cosinelr

Kode akan secara otomatis (mengunduh dan) memuat bobot pretrained imagenet. Setelah pelatihan selesai, model akan disimpan sebagai "log/osnet_x1_0_market1501_softmax_cosinelr/model.pth.tar-250". Di bawah folder yang sama, Anda dapat menemukan file Tensorboard. Untuk memvisualisasikan kurva pembelajaran menggunakan Tensorboard, Anda dapat menjalankan tensorboard --logdir=log/osnet_x1_0_market1501_softmax_cosinelr di terminal dan kunjungi http://localhost:6006/ di browser web Anda.

Evaluasi secara otomatis dilakukan di akhir pelatihan. Untuk menjalankan tes lagi menggunakan model terlatih, lakukan

python scripts/main.py 
--config-file configs/im_osnet_x1_0_softmax_256x128_amsgrad_cosine.yaml 
--root $PATH_TO_DATA 
model.load_weights log/osnet_x1_0_market1501_softmax_cosinelr/model.pth.tar-250 
test.evaluate True

Pengaturan silang domain

Misalkan Anda ingin melatih Osnet di Dukemtmc-Reid dan menguji kinerjanya di Market1501, Anda dapat melakukannya

python scripts/main.py 
--config-file configs/im_osnet_x1_0_softmax_256x128_amsgrad.yaml 
-s dukemtmcreid 
-t market1501 
--transforms random_flip color_jitter 
--root $PATH_TO_DATA

Di sini kami hanya menguji kinerja lintas domain. Namun, jika Anda juga ingin menguji kinerja pada dataset sumber, yaitu Dukemtmc -Reid, Anda dapat mengatur -t dukemtmcreid market1501 , yang akan mengevaluasi model pada dua set data secara terpisah.

Berbeda dari pengaturan domain yang sama, di sini kita mengganti random_erase dengan color_jitter . Ini dapat meningkatkan kinerja generalisasi pada dataset target yang tidak terlihat.

Model pretrain tersedia di kebun binatang model.

Kumpulan data

Dataset Image-Reid

Market1501
CUHK03
Dukemtmc-Reid
Msmt17
Ular berbisa
Kisi
Cuhk01
Sensereid
Qmul-ilids
Prid

Dataset geo-lokalisasi

Universitas-1652

Dataset Video-Reid

MARS
ILIDS-VID
Prid2011
Dukemtmc-videoreid

Model

Model Klasifikasi ImageNet

Resnet
Resnext
Senet
Densenet
Inception-Resnet-V2
Inception-V4
Xception
Ibn-net

Model ringan

Nasnet
MobileNetv2
Shufflenet
Shufflenetv2
Squeezenet

Model khusus Reid

Lenaep
Resnet-mid
Hacnn
PCB
Mlfn
Osnet
Osnet-Ain

Tautan yang berguna

OSNET-IBN1-Lite (Kode Tes saja dengan Lite Docker Container)
Pembelajaran mendalam untuk identifikasi ulang orang: survei dan pandangan

Kutipan

Jika Anda menggunakan kode ini atau model dalam penelitian Anda, harap berikan kredit ke makalah berikut:

@article{torchreid,
  title={Torchreid: A Library for Deep Learning Person Re-Identification in Pytorch},
  author={Zhou, Kaiyang and Xiang, Tao},
  journal={arXiv preprint arXiv:1910.10093},
  year={2019}
}

@inproceedings{zhou2019osnet,
  title={Omni-Scale Feature Learning for Person Re-Identification},
  author={Zhou, Kaiyang and Yang, Yongxin and Cavallaro, Andrea and Xiang, Tao},
  booktitle={ICCV},
  year={2019}
}

@article{zhou2021osnet,
  title={Learning Generalisable Omni-Scale Representations for Person Re-Identification},
  author={Zhou, Kaiyang and Yang, Yongxin and Cavallaro, Andrea and Xiang, Tao},
  journal={TPAMI},
  year={2021}
}

Memperluas

Informasi Tambahan

Versi v1.0.6
Tipe ular piton
Waktu Pembaruan 2025-07-11
ukuran 440.07KB
Berasal dari Github

Aplikasi Terkait

Permainan Informasi Orang Mencurigakan versi Cina

2024-07-20
Lapangan Dalam

2023-07-07
Permainan Pemburu Dalam

2023-07-03
Di dalam

2022-08-30
Balapan Dalam: Pertempuran

2022-08-29
Rune yang dalam

2022-07-25

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ToDo Co

ular piton

1.0.0
Python Portfolio

ular piton
Alat bagan data sumber terbuka Redash v24.10.0

ular piton

24.10.0
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua