تنزيل semantic segmentation - تنزيل رمز مصدر semantic segmentation

semantic segmentation

بايثون

v0.2.6

تنزيل

تجزئة الدلالية

نماذج تجزئة SOTA الدلالية سهلة الاستخدام وتخصيصها مع مجموعات بيانات وفيرة في Pytorch

لافتة

إعادة صياغة رئيسية! ابقوا متابعين...

تم تغيير الكثير منذ عام 2022 ، في الوقت الحاضر هناك حتى نماذج تجزئة العالم المفتوح (شريحة أي شيء). ومع ذلك ، لا تزال نماذج التجزئة التقليدية مطلوبة على دقة عالية وحالات الاستخدام المخصص. سيتم تحديث هذا الريبو وفقًا لإصدار Pytorch الجديد ، والنماذج المحدثة ، والوثائق لكيفية الاستخدام مع مجموعة بيانات مخصصة ، إلخ.

تاريخ الإصدار المتوقع -> مايو 2024

الميزات المخطط لها:

إعادة صياغة خط أنابيب التدريب بأكمله
نموذج خط الأساس قبل التدريب
أفكار محدثة جديدة
سهلة التكامل مع نماذج العمود الفقري SOTA (مع البرامج التعليمية)
البرنامج التعليمي لمجموعة البيانات المخصصة
التدريب الموزع

الميزات الحالية التي يجب التخلص منها:

سيتم تقليل كمية مجموعات البيانات المقدمة. ولكن بدلاً من ذلك ، سيبقى تلك التمثيلية مع برنامج تعليمي لمجموعة البيانات المخصصة.
سيتم تخفيض كمية النماذج المقدمة. بدلاً من ذلك ، ستظل الحيل والوحدات النمطية القيمة ، ويمكن دمجها بسهولة مع أي نماذج.
سيتم استبدال التعزيزات بتحويلات torchvisionv2 الرسمية.
التحويل والاستدلال مع الأطر الأخرى

سمات

ينطبق على المهام التالية:
- تحليل المشهد
- تحليل الإنسان
- الوجه التحليل
- تجزئة الصور الطبية (قريبًا)
20+ مجموعات بيانات
15+ SOTA العمود الفقري
10+ نماذج تجزئة SOTA
Pytorch ، onnx ، tflite ، Openvino orport and Interference

طراز حديقة الحيوان

العمود الفقري المدعوم:

Resnet (CVPR 2016)
RESNETD (ARXIV 2018)
Mobilenetv2 (CVPR 2018)
Mobilenetv3 (ICCV 2019)
MIT (Neups 2021)
الباقي (Neups 2021)
Micronet (ICCV 2021)
Resnet+ (Arxiv 2021)
PVTV2 (CVMJ 2022)
poolformer (CVPR 2022)
Convnext (CVPR 2022)
زي موحد (Arxiv 2022)
فان (Arxiv 2022)
Davit (Arxiv 2022)

الرؤوس/الأساليب المدعومة:

FCN (CVPR 2015)
Upernet (ECCV 2018)
BISENETV1 (ECCV 2018)
FPN (CVPR 2019)
SFNET (ECCV 2020)
Segformer (Neups 2021)
FAPN (ICCV 2021)
condnet (IEEE SPL 2021)
Light-HAM (ICLR 2021)
Lawin (Arxiv 2022)
Topformer (CVPR 2022)

النماذج المستقلة المدعومة:

BISENETV2 (IJCV 2021)
Ddrnet (Arxiv 2021)

الوحدات المدعومة:

PPM (CVPR 2017)
PSA (Arxiv 2021)

ارجع إلى نماذج للمعايير والنماذج المتوفرة مسبقًا.

وتحقق من العمود الفقري للعمود الفقري المدعوم.

ملاحظات: لا تحتوي معظم الطرق على نماذج مدربة مسبقًا. من الصعب للغاية الجمع بين النماذج المختلفة والأوزان المدربة مسبقًا في مستودع واحد ومورد محدود لإعادة تدريب نفسي.

مجموعات البيانات المدعومة

تحليل المشهد:

ADE20K
مناظر المدينة
كوكو
camvid
Pascal-Context
آفاق مابيلاري
صن rgb-d

تحليل الإنسان:

MHPV2
MHPV1
شفة
CCIHP
CIHP
ATR

تحليل الوجه:

هيلين
لابا
Ibugmask
CelebamaskHq
Facesynthetics

آحرون:

سيم

ارجع إلى مجموعات البيانات لمزيد من التفاصيل وإعداد مجموعة البيانات.

التعزيزات المتاحة (انقر للتوسع)

تحقق من دفتر الملاحظات هنا لاختبار تأثيرات التعزيز.

يتحول مستوى البكسل:

ColorJitter (السطوع ، التباين ، التشبع ، اللون)
جاما ، الحدة ، المتبادل التلقائي ، تعادل ، ملصق
Gaussianblur ، رمادي

يتحول المستوى المكاني:

Affine ، العشوائية
الأفقي ، العمودي
CenterCrop ، عشوائي
Pad ، Resizepad ، تغيير الحجم
عشوائي

الاستخدام

تثبيت

بيثون> = 3.6
الشعلة> = 1.8.1
torchvision> = 0.9.1

ثم ، استنساخ الريبو وتثبيت المشروع مع:

$ git clone https://github.com/sithu31296/semantic-segmentation
$ cd semantic-segmentation
$ pip install -e .

التكوين (انقر للتوسع)

إنشاء ملف تكوين في configs . يمكن العثور على تكوين عينة لمجموعة بيانات ADE20K هنا. ثم قم بتحرير الحقول التي تفكر فيها إذا كانت هناك حاجة. هناك حاجة إلى ملف التكوين هذا لجميع البرامج النصية للتدريب والتقييم والتنبؤ.

التدريب (انقر للتوسع)

للتدريب مع وحدة معالجة الرسومات الواحدة:

$ python tools/train.py --cfg configs/CONFIG_FILE.yaml

للتدريب مع وحدات معالجة الرسومات المتعددة ، قم بتعيين حقل DDP في ملف التكوين إلى true وتشغيله على النحو التالي:

$ python -m torch.distributed.launch --nproc_per_node=2 --use_env tools/train.py --cfg configs/ < CONFIG_FILE_NAME > .yaml

التقييم (انقر للتوسع)

تأكد من تعيين MODEL_PATH لملف التكوين على دليل النموذج المدرب.

$ python tools/val.py --cfg configs/ < CONFIG_FILE_NAME > .yaml

للتقييم مع متعدد النطاق وقلب ، تمكين تغيير ENABLE في MSF إلى true وتشغيل نفس الأمر على النحو الوارد أعلاه.

الاستدلال

لجعل الاستدلال ، قم بتحرير معلمات ملف التكوين من أدناه.

تغيير MODEL >> NAME والعمود BACKBONE لنموذج ما قبل المراوغة.
تغيير DATASET >> NAME إلى اسم مجموعة البيانات اعتمادًا على النموذج المسبق.
قم بتعيين TEST >> MODEL_PATH على الأوزان المسبقة لنموذج الاختبار.
قم بتغيير TEST >> FILE إلى مسار الملف أو المجلد الذي تريد اختباره.
سيتم حفظ نتائج الاختبار في SAVE_DIR .

 # # example using ade20k pretrained models
$ python tools/infer.py --cfg configs/ade20k.yaml

مثال نتائج الاختبار (Segformer-B2):

test_result

تحويل إلى أطر أخرى (OnNx ، Coreml ، Openvino ، Tflite)

للتحويل إلى Onnx و Coreml ، قم بتشغيل:

$ python tools/export.py --cfg configs/ < CONFIG_FILE_NAME > .yaml

للتحويل إلى Openvino و Tflite ، انظر Torch_optimize.

الاستدلال (Onnx ، Openvino ، tflite)

 # # ONNX Inference
$ python scripts/onnx_infer.py --model < ONNX_MODEL_PATH > --img-path < TEST_IMAGE_PATH >

# # OpenVINO Inference
$ python scripts/openvino_infer.py --model < OpenVINO_MODEL_PATH > --img-path < TEST_IMAGE_PATH >

# # TFLite Inference
$ python scripts/tflite_infer.py --model < TFLite_MODEL_PATH > --img-path < TEST_IMAGE_PATH >

المراجع (انقر للتوسع)

https://github.com/coincheung/bisenet
https://github.com/open-mmlab/mmsegressation
https://github.com/rwightman/pytorch-emage-models

الاستشهادات (انقر للتوسع)

 @article{xie2021segformer,
  title={SegFormer: Simple and Efficient Design for Semantic Segmentation with Transformers},
  author={Xie, Enze and Wang, Wenhai and Yu, Zhiding and Anandkumar, Anima and Alvarez, Jose M and Luo, Ping},
  journal={arXiv preprint arXiv:2105.15203},
  year={2021}
}

@misc{xiao2018unified,
  title={Unified Perceptual Parsing for Scene Understanding}, 
  author={Tete Xiao and Yingcheng Liu and Bolei Zhou and Yuning Jiang and Jian Sun},
  year={2018},
  eprint={1807.10221},
  archivePrefix={arXiv},
  primaryClass={cs.CV}
}

@article{hong2021deep,
  title={Deep Dual-resolution Networks for Real-time and Accurate Semantic Segmentation of Road Scenes},
  author={Hong, Yuanduo and Pan, Huihui and Sun, Weichao and Jia, Yisong},
  journal={arXiv preprint arXiv:2101.06085},
  year={2021}
}

@misc{zhang2021rest,
  title={ResT: An Efficient Transformer for Visual Recognition}, 
  author={Qinglong Zhang and Yubin Yang},
  year={2021},
  eprint={2105.13677},
  archivePrefix={arXiv},
  primaryClass={cs.CV}
}

@misc{huang2021fapn,
  title={FaPN: Feature-aligned Pyramid Network for Dense Image Prediction}, 
  author={Shihua Huang and Zhichao Lu and Ran Cheng and Cheng He},
  year={2021},
  eprint={2108.07058},
  archivePrefix={arXiv},
  primaryClass={cs.CV}
}

@misc{wang2021pvtv2,
  title={PVTv2: Improved Baselines with Pyramid Vision Transformer}, 
  author={Wenhai Wang and Enze Xie and Xiang Li and Deng-Ping Fan and Kaitao Song and Ding Liang and Tong Lu and Ping Luo and Ling Shao},
  year={2021},
  eprint={2106.13797},
  archivePrefix={arXiv},
  primaryClass={cs.CV}
}

@article{Liu2021PSA,
  title={Polarized Self-Attention: Towards High-quality Pixel-wise Regression},
  author={Huajun Liu and Fuqiang Liu and Xinyi Fan and Dong Huang},
  journal={Arxiv Pre-Print arXiv:2107.00782 },
  year={2021}
}

@misc{chao2019hardnet,
  title={HarDNet: A Low Memory Traffic Network}, 
  author={Ping Chao and Chao-Yang Kao and Yu-Shan Ruan and Chien-Hsiang Huang and Youn-Long Lin},
  year={2019},
  eprint={1909.00948},
  archivePrefix={arXiv},
  primaryClass={cs.CV}
}

@inproceedings{sfnet,
  title={Semantic Flow for Fast and Accurate Scene Parsing},
  author={Li, Xiangtai and You, Ansheng and Zhu, Zhen and Zhao, Houlong and Yang, Maoke and Yang, Kuiyuan and Tong, Yunhai},
  booktitle={ECCV},
  year={2020}
}

@article{Li2020SRNet,
  title={Towards Efficient Scene Understanding via Squeeze Reasoning},
  author={Xiangtai Li and Xia Li and Ansheng You and Li Zhang and Guang-Liang Cheng and Kuiyuan Yang and Y. Tong and Zhouchen Lin},
  journal={ArXiv},
  year={2020},
  volume={abs/2011.03308}
}

@ARTICLE{Yucondnet21,
  author={Yu, Changqian and Shao, Yuanjie and Gao, Changxin and Sang, Nong},
  journal={IEEE Signal Processing Letters}, 
  title={CondNet: Conditional Classifier for Scene Segmentation}, 
  year={2021},
  volume={28},
  number={},
  pages={758-762},
  doi={10.1109/LSP.2021.3070472}
}

@misc{yan2022lawin,
  title={Lawin Transformer: Improving Semantic Segmentation Transformer with Multi-Scale Representations via Large Window Attention}, 
  author={Haotian Yan and Chuang Zhang and Ming Wu},
  year={2022},
  eprint={2201.01615},
  archivePrefix={arXiv},
  primaryClass={cs.CV}
}

@misc{yu2021metaformer,
  title={MetaFormer is Actually What You Need for Vision}, 
  author={Weihao Yu and Mi Luo and Pan Zhou and Chenyang Si and Yichen Zhou and Xinchao Wang and Jiashi Feng and Shuicheng Yan},
  year={2021},
  eprint={2111.11418},
  archivePrefix={arXiv},
  primaryClass={cs.CV}
}

@misc{wightman2021resnet,
  title={ResNet strikes back: An improved training procedure in timm}, 
  author={Ross Wightman and Hugo Touvron and Hervé Jégou},
  year={2021},
  eprint={2110.00476},
  archivePrefix={arXiv},
  primaryClass={cs.CV}
}

@misc{liu2022convnet,
  title={A ConvNet for the 2020s}, 
  author={Zhuang Liu and Hanzi Mao and Chao-Yuan Wu and Christoph Feichtenhofer and Trevor Darrell and Saining Xie},
  year={2022},
  eprint={2201.03545},
  archivePrefix={arXiv},
  primaryClass={cs.CV}
}

@misc{li2022uniformer,
  title={UniFormer: Unifying Convolution and Self-attention for Visual Recognition}, 
  author={Kunchang Li and Yali Wang and Junhao Zhang and Peng Gao and Guanglu Song and Yu Liu and Hongsheng Li and Yu Qiao},
  year={2022},
  eprint={2201.09450},
  archivePrefix={arXiv},
  primaryClass={cs.CV}
}

يوسع

معلومات إضافية

الإصدار v0.2.6
النوع بايثون
وقت التحديث 2025-07-12
الحجم 2.32MB
من Github

تطبيقات ذات صلة

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub the via/releases

2024-11-01

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ToDo Co

بايثون

1.0.0
Python Portfolio

بايثون
Redash أداة مخطط البيانات مفتوحة المصدر v24.10.0

بايثون

24.10.0
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل