deep person reid Download - deep person reid Source Code Download

deep person reid

بايثون

v1.0.6

تنزيل

Torchreid

Torchreid هي مكتبة لإعادة تحديد الشخص المتعلم العميق ، مكتوبة في Pytorch وتم تطويرها لمشروع ICCV'19 ، تعلم الميزات على نطاق Omni لإعادة تحديد الشخص.

يميز:

التدريب متعدد GPU
دعم كل من الصور والفيديو
التدريب والتقييم الشامل
تحضير سهل بشكل لا يصدق لمجموعات بيانات ريد
التدريب متعدد البيانات
تقييم dataset
بروتوكول قياسي تستخدمه معظم الأوراق البحثية
قابلة للتمديد للغاية (من السهل إضافة نماذج ومجموعات بيانات وطرق التدريب وما إلى ذلك)
تطبيقات نماذج ريد العميقة الحديثة
الوصول إلى نماذج ريد المسبق
تقنيات التدريب المتقدمة
أدوات التصور (Tensorboard ، صفوف ، إلخ)

الكود: https://github.com/kaiyangzhou/deep-person-reid.

الوثائق: https://kaiyangzhou.github.io/deep-person-reid/.

إرشادات كيف: https://kaiyangzhou.github.io/deep-person-reid/user_guide.

طراز حديقة الحيوان: https://kaiyangzhou.github.io/deep-person-reid/model_zoo.

التقرير التقني: https://arxiv.org/abs/1910.10093.

يمكنك العثور على بعض المشاريع البحثية التي تم بناؤها على رأس Torchreid هنا.

ما الجديد

[أغسطس 2022] لقد أضفنا قدرات تصدير النماذج إلى الأطر التالية: Onnx و Openvino و Tflite. يمكن العثور على نص التصدير هنا
[أغسطس 2021] لقد أصدرنا نماذج ImageNet التي تم تحديدها لـ osnet_ain_x0_75 و osnet_ain_x0_5 و osnet_ain_x0_25 . يتبع الإعداد المسبق pycls.
[أبريل 2021] قمنا بتحديث التذييل في إصدار TPAMI من OSNET لتضمين النتائج في إعداد تعميم المجال متعدد المصادر. يمكن العثور على النماذج المدربة في حديقة الحيوان النموذجية.
[أبريل 2021] لقد أضفنا البرنامج النصي لأتمتة عملية حساب النتائج المتوسطة عبر انشقاقات متعددة. لمزيد من التفاصيل ، يرجى الاطلاع على tools/parse_test_res.py .
[أبريل 2021] v1.4.0 : لقد أضفنا مجموعة بيانات بحث الشخص ، Cuhk-Sysu. يرجى الاطلاع على الوثائق المتعلقة بكيفية تنزيل مجموعة البيانات (تحتوي على صور شخص محصور).
[أبريل 2021] تم نقل جميع النماذج في حديقة حيوان Model إلى Google Drive. يرجى إثارة مشكلة إذا كان أداء أي نموذج غير متسق مع الأرقام الموضحة في صفحة حديقة حيوانات النموذج (يمكن أن يكون سببها روابط خاطئة).
[مارس 2021] سيظهر Osnet في مجلة Tpami! مقارنةً بإصدار المؤتمر ، الذي يركز على تعلم الميزات التمييزية باستخدام لبنة البناء على نطاق Omni ، فإن امتداد المجلة هذا يعتبر أيضًا تعلم الميزات القابلة للتعميم من خلال دمج طبقات تطبيع المثيل مع بنية OSNET. نأمل أن تتمكن ورقة المجلة هذه من تحفيز المزيد من العمل المستقبلي لتأمل قضية التعميم في إعادة عرض DATASET.
[MAR 2021] التعميم عبر المجالات (مجموعات البيانات) شخصياً يعتبر أمرًا بالغ الأهمية في التطبيقات الواقعية ، والتي ترتبط ارتباطًا وثيقًا بموضوع تعميم المجال . هل أنت مهتم بتعلم كيف تطور مجال تعميم المجال على مدار العقد الماضي؟ تحقق من استطلاعنا الأخير في هذا الموضوع على https://arxiv.org/abs/2103.02503 ، مع تغطية على التاريخ ، ومجموعات البيانات ، والمشاكل ذات الصلة ، والمنهجيات ، والاتجاهات المحتملة ، وهكذا ( الطرق المصممة لإعادة تعميم المعة تغطية !).
[فبراير 2021] v1.3.6 تمت إضافة جامعة-1652 ، وهي مجموعة بيانات جديدة للتوصيل الجغرافي متعدد المصادر متعدد المصادر (الائتمان إلى Zhedong Zheng).
[فبراير 2021] v1.3.5 : يعمل رمز Cython الآن على Windows (الائتمان إلى Lablabla).
[يناير 2021] تم قبول عملنا الأخير ، Mixstyle (خلط إحصائيات ميزة على مستوى المثيل لعينات من المجالات المختلفة لتحسين تعميم المجال) على ICLR'21. تم إصدار الرمز على https://github.com/kaiyangzhou/mixstyle-release حيث يعتمد جزء إعادة المعة على Torchreid.
[يناير 2021] تم إدخال مقياس تقييم جديد يسمى متوسط العقوبة السلبية العكسية (MINP) للشخص في التعلم العميق لإعادة تحديد الشخص: دراسة استقصائية وتوقعات (TPAMI 2021). يمكن الوصول إلى الكود الخاص بهم على https://github.com/mangye16/reid-survey.
[أغسطس 2020] v1.3.3 : خطأ ثابت في visrank (بسبب عدم تفريغ dsetid ).
[أغسطس 2020] v1.3.2 : تمت إضافة _junk_pids إلى grid و prid . هذا يتجنب استخدام صور المعرض الخاطئة للتدريب عند تعيين combineall=True .
[أغسطس 2020] v1.3.0 : (1) أضاف dsetid إلى مصدر البيانات 3-TUPLE الحالي ، مما أدى إلى (impath, pid, camid, dsetid) . يشير هذا المتغير إلى معرف مجموعة البيانات وهو مفيد عند الجمع بين مجموعات بيانات متعددة للتدريب (كمؤشر لمجموعة البيانات). على سبيل المثال ، عند الجمع بين market1501 و cuhk03 ، سيتم تعيين dsetid=0 بينما سيتم تعيين dsetid=1 . (2) تمت إضافة RandomDatasetSampler . مماثلة لـ RandomDomainSampler ، عينات RandomDatasetSampler عدد معين من الصور ( batch_size // num_datasets ) من كل من مجموعات البيانات المحددة (يتم تحديد المبلغ بواسطة num_datasets ).
[أغسطس 2020] v1.2.6 : تمت إضافة RandomDomainSampler (يقوم بتجربة كاميرات num_cams لكل منها مع صور batch_size // num_cams لتشكيل مجموعة صغيرة).
[يونيو 2020] v1.2.5 : (1) تم تغيير إخراج Dataloader من __getitem__ من list إلى dict . في السابق ، تم جلب عنصر ، على سبيل المثال موتر الصورة ، باستخدام imgs=data[0] . الآن يجب الحصول عليها بواسطة imgs=data['img'] . انظر هذا الالتزام للتغييرات التفصيلية. (2) تمت إضافة k_tfm كخيار لعملية تحميل بيانات الصور ، والذي يسمح بتطبيق زيادة البيانات k_tfm بشكل مستقل على صورة. إذا كان k_tfm > 1 ، imgs=data['img'] إرجاع قائمة مع k_tfm صورة الموترات.
[مايو 2020] أضاف رمز التعرف على سمة الشخص المستخدم في تعلم الميزات على نطاق أومني لإعادة تحديد الشخص (ICCV'19). انظر projects/attribute_recognition/ .
[مايو 2020] v1.2.1 : أضيفت واجهة برمجة تطبيقات بسيطة لاستخراج الميزات ( torchreid/utils/feature_extractor.py ). راجع وثائق التعليمات.
[أبريل 2020] تم إصدار كود لإعادة إنتاج تجارب التعلم المتبادل العميق في ورقة OSNET (Supp. B) في projects/DML .
[أبريل 2020] تم ترقيته إلى v1.2.0 . لقد تم جعل فئة المحرك أكثر نماذج من النماذج لتحسين القابلية للتوسعة. انظر Engine و PicturesoftMaxEngine لمزيد من التفاصيل. الائتمان إلى dassl.pytorch.
[ديسمبر 2019] تم تحديث ورقة OSNET الخاصة بنا ، مع تجارب إضافية (في القسم B من التكميلية) تُظهر بعض التقنيات المفيدة لتحسين أداء OSNET في الممارسة العملية.
[نوفمبر 2019] يمكن ImageDataManager تحميل بيانات التدريب من مجموعات البيانات المستهدفة عن طريق إعداد load_train_targets=True ، ويمكن الوصول إلى محمل القطار باستخدام train_loader_t = datamanager.train_loader_t . هذه الميزة مفيدة لأبحاث التكيف مع المجال.

تثبيت

تأكد من تثبيت كوندا.

 # cd to your preferred directory and clone this repo
git clone https://github.com/KaiyangZhou/deep-person-reid.git

# create environment
cd deep-person-reid/
conda create --name torchreid python=3.7
conda activate torchreid

# install dependencies
# make sure `which python` and `which pip` point to the correct path
pip install -r requirements.txt

# install torch and torchvision (select the proper cuda version to suit your machine)
conda install pytorch torchvision cudatoolkit=9.0 -c pytorch

# install torchreid (don't need to re-build it if you modify the source code)
python setup.py develop

هناك طريقة أخرى للتثبيت وهي تشغيل كل شيء داخل حاوية Docker:

البناء: make build-image
تشغيل: make run

ابدأ: 30 ثانية إلى Torchreid

استيراد torchreid

 import torchreid

تحميل مدير البيانات

 datamanager = torchreid . data . ImageDataManager (
    root = "reid-data" ,
    sources = "market1501" ,
    targets = "market1501" ,
    height = 256 ,
    width = 128 ,
    batch_size_train = 32 ,
    batch_size_test = 100 ,
    transforms = [ "random_flip" , "random_crop" ]
)

3 بناء نموذج ، محسن و LR_SCHEDULER

 model = torchreid . models . build_model (
    name = "resnet50" ,
    num_classes = datamanager . num_train_pids ,
    loss = "softmax" ,
    pretrained = True
)

model = model . cuda ()

optimizer = torchreid . optim . build_optimizer (
    model ,
    optim = "adam" ,
    lr = 0.0003
)

scheduler = torchreid . optim . build_lr_scheduler (
    optimizer ,
    lr_scheduler = "single_step" ,
    stepsize = 20
)

بناء المحرك

 engine = torchreid . engine . ImageSoftmaxEngine (
    datamanager ,
    model ,
    optimizer = optimizer ,
    scheduler = scheduler ,
    label_smooth = True
)

تشغيل التدريب والاختبار

 engine . run (
    save_dir = "log/resnet50" ,
    max_epoch = 60 ,
    eval_freq = 10 ,
    print_freq = 10 ,
    test_only = False
)

واجهة موحدة

في "Deep-Person-Reid/Scripts/" ، نقدم واجهة موحدة لتدريب واختبار نموذج. راجع "البرامج النصية/main.py" و "Scripts/Default_Config.py" لمزيد من التفاصيل. يحتوي المجلد "Configs/" على بعض التكوينات المحددة مسبقًا التي يمكنك استخدامها كنقطة انطلاق.

أدناه نقدم مثالًا لتدريب واختبار Osnet (Zhou et al. ICCV'19). افترض أن PATH_TO_DATA هو الدليل الذي يحتوي على مجموعات بيانات REID. تم حذف المتغير البيئي CUDA_VISIBLE_DEVICES ، وهو ما تحتاج إلى تحديد ما إذا كان لديك مجموعة من وحدات معالجة الرسومات وترغب في استخدام مجموعة محددة منها.

الإعداد التقليدي

لتدريب osnet على Market1501 ، افعل

python scripts/main.py 
--config-file configs/im_osnet_x1_0_softmax_256x128_amsgrad_cosine.yaml 
--transforms random_flip random_erase 
--root $PATH_TO_DATA

يقوم ملف التكوين بتعيين Market1501 كمجموعة بيانات افتراضية. إذا كنت تريد استخدام dukemtmc-reid ، افعل

python scripts/main.py 
--config-file configs/im_osnet_x1_0_softmax_256x128_amsgrad_cosine.yaml 
-s dukemtmcreid 
-t dukemtmcreid 
--transforms random_flip random_erase 
--root $PATH_TO_DATA 
data.save_dir log/osnet_x1_0_dukemtmcreid_softmax_cosinelr

سوف الرمز تلقائيًا (تنزيل و) تحميل الأوزان المسبقة لـ ImageNet. بعد الانتهاء من التدريب ، سيتم حفظ النموذج كـ "log/osnet_x1_0_market1501_softmax_cosinelr/model.pth.tar-250". تحت نفس المجلد ، يمكنك العثور على ملف Tensorboard. لتصور منحنيات التعلم باستخدام Tensorboard ، يمكنك تشغيل tensorboard --logdir=log/osnet_x1_0_market1501_softmax_cosinelr في المحطة وزيارة http://localhost:6006/ في مستعرض الويب الخاص بك.

يتم إجراء التقييم تلقائيًا في نهاية التدريب. لتشغيل الاختبار مرة أخرى باستخدام النموذج المدرب ، قم

python scripts/main.py 
--config-file configs/im_osnet_x1_0_softmax_256x128_amsgrad_cosine.yaml 
--root $PATH_TO_DATA 
model.load_weights log/osnet_x1_0_market1501_softmax_cosinelr/model.pth.tar-250 
test.evaluate True

إعداد المجال المتقاطع

لنفترض أنك تريد تدريب osnet على dukemtmc-reid واختبر أدائها على Market1501 ، يمكنك القيام بذلك

python scripts/main.py 
--config-file configs/im_osnet_x1_0_softmax_256x128_amsgrad.yaml 
-s dukemtmcreid 
-t market1501 
--transforms random_flip color_jitter 
--root $PATH_TO_DATA

هنا نختبر فقط أداء المجال المتقاطع. ومع ذلك ، إذا كنت ترغب أيضًا في اختبار الأداء على مجموعة البيانات المصدر ، IE Dukemtmc -Reid ، فيمكنك تعيين -t dukemtmcreid market1501 ، والتي ستقوم بتقييم النموذج على مجموعتي البيانات بشكل منفصل.

يختلف عن إعداد نفس المجال ، هنا نستبدل random_erase بـ color_jitter . هذا يمكن أن يحسن أداء التعميم على مجموعة البيانات المستهدفة غير المرئية.

النماذج المسبقة متوفرة في حديقة الحيوان النموذجية.

مجموعات البيانات

صور بيانات الصور

Market1501
CUHK03
dukemtmc-reid
MSMT17
أفعى
شبكة
CUHK01
sensereid
Qmul-Ilids
بيد

مجموعات البيانات الجيولوجية

جامعة -1652

مجموعات بيانات إعادة الفيديو

المريخ
ilids-vid
PRID2011
dukemtmc-videoroid

النماذج

نماذج تصنيف ImageNet

Resnet
RESNEXT
سينت
Densenet
بدء RESCENET-V2
Inception-V4
Xception
ابن نيت

نماذج خفيفة الوزن

nasnet
mobilenetv2
Shufflenet
Shufflenetv2
القوسنيت

نماذج محددة ريد

mudeep
Resnet-mid
هاكن
PCB
MLFN
osnet
osnet-ain

روابط مفيدة

OSNET-IBN1-LITE (رمز اختبار فقط مع حاوية Docker Lite)
التعلم العميق لإعادة تحديد الشخص: مسح وتوقعات

اقتباس

إذا كنت تستخدم هذا الرمز أو النماذج في بحثك ، فيرجى إعطاء الائتمان للأوراق التالية:

@article{torchreid,
  title={Torchreid: A Library for Deep Learning Person Re-Identification in Pytorch},
  author={Zhou, Kaiyang and Xiang, Tao},
  journal={arXiv preprint arXiv:1910.10093},
  year={2019}
}

@inproceedings{zhou2019osnet,
  title={Omni-Scale Feature Learning for Person Re-Identification},
  author={Zhou, Kaiyang and Yang, Yongxin and Cavallaro, Andrea and Xiang, Tao},
  booktitle={ICCV},
  year={2019}
}

@article{zhou2021osnet,
  title={Learning Generalisable Omni-Scale Representations for Person Re-Identification},
  author={Zhou, Kaiyang and Yang, Yongxin and Cavallaro, Andrea and Xiang, Tao},
  journal={TPAMI},
  year={2021}
}

يوسع

معلومات إضافية

الإصدار v1.0.6
النوع بايثون
وقت التحديث 2025-07-11
الحجم 440.07KB
من Github

تطبيقات ذات صلة

لعبة معلومات الشخص المشبوه النسخة الصينية

2024-07-20
المجال العميق

2023-07-07
لعبة ديب هانتر

2023-07-03
ديب دي

2022-08-30
السباق العميق: المعركة

2022-08-29
رون عميق

2022-07-25

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ToDo Co

بايثون

1.0.0
Python Portfolio

بايثون
Redash أداة مخطط البيانات مفتوحة المصدر v24.10.0

بايثون

24.10.0
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل