Unduh semantic segmentation - Unduh Kode Sumber semantic segmentation

semantic segmentation

ular piton

v0.2.6

Unduh

Segmentasi semantik

Model SOTA SOMICTION SUMITASI MUDAH MUDAH DIGUNAKAN DAN DIKEBAIKAN DENGAN DATASET DI LURUS DI PYTORCH

spanduk

Kerajaan besar! Pantau terus...

Banyak yang telah diubah sejak 2022, saat ini bahkan ada model segmentasi dunia terbuka (segmen apa pun). Namun, model segmentasi tradisional masih diminati untuk kasus akurasi tinggi dan penggunaan khusus. Repo ini akan diperbarui sesuai dengan versi Pytorch baru, model yang diperbarui, dan dokumentasi untuk cara menggunakan dengan dataset khusus, dll.

Tanggal rilis yang diharapkan -> Mei 2024

Fitur yang direncanakan:

Kerjakan ulang pada seluruh pipa pelatihan
Model pra-terlatih awal
Ide baru yang diperbarui
Integrasi Mudah Dengan Model Backbone SOTA (dengan Tutorial)
Tutorial untuk Dataset Kustom
Pelatihan Terdistribusi

Fitur saat ini yang harus dibuang:

Jumlah dataset yang disediakan akan dikurangi. Tetapi sebaliknya, yang perwakilan akan tetap dengan tutorial untuk dataset khusus.
Jumlah model yang disediakan akan dikurangi. Sebaliknya, trik dan modul yang berharga akan tetap ada, dan dapat dengan mudah diintegrasikan dengan model apa pun.
Augmentasi akan diganti dengan transformasi TorchVisionV2 resmi.
Konversi dan inferensi dengan kerangka kerja lainnya

Fitur

Berlaku untuk tugas -tugas berikut:
- Adegan parsing
- Parsing manusia
- Wajah parsing
- Segmentasi gambar medis (segera hadir)
20+ set data
15+ tulang punggung sota
10+ model segmentasi semantik sota
Pytorch, Onnx, Tflite, Ekspor & Inferensi Openvino

Model Zoo

Backbones yang Didukung:

Resnet (CVPR 2016)
Resnetd (ARXIV 2018)
MobileNetV2 (CVPR 2018)
MobileNetV3 (ICCV 2019)
MIT (Neurips 2021)
Istirahat (Neurips 2021)
Micronet (ICCV 2021)
Resnet+ (arxiv 2021)
PVTV2 (CVMJ 2022)
Poolformer (CVPR 2022)
ConvNext (CVPR 2022)
Seragam (Arxiv 2022)
Van (Arxiv 2022)
Davit (Arxiv 2022)

Kepala/Metode yang Didukung:

FCN (CVPR 2015)
Upernet (ECCV 2018)
Bisenetv1 (ECCV 2018)
FPN (CVPR 2019)
SFNET (ECCV 2020)
Segformer (Neurips 2021)
FAPN (ICCV 2021)
Condnet (IEEE SPL 2021)
Light-Ham (ICLR 2021)
Lawin (Arxiv 2022)
Topformer (CVPR 2022)

Model mandiri yang didukung:

Bisenetv2 (IJCV 2021)
DDRNET (ARXIV 2021)

Modul yang Didukung:

PPM (CVPR 2017)
PSA (ARXIV 2021)

Lihat model untuk tolok ukur dan model pra-terlatih yang tersedia.

Dan periksa tulang punggung untuk tulang punggung yang didukung.

Catatan: Sebagian besar metode tidak memiliki model pra-terlatih. Sangat sulit untuk menggabungkan model yang berbeda dengan bobot pra-terlatih dalam satu repositori dan sumber daya terbatas untuk melatih kembali diri saya.

Dataset yang Didukung

Adegan Parsing:

Ade20k
Cityscapes
Coco-suap
Camvid
Pascal-Context
Vistas Mapillary
Sun RGB-D

Parsing manusia:

MHPV2
MHPV1
BIBIR
Ccihp
Cihp
ATR

Face Parsing:

Helen
Lapa
Ibugask
Celebamaskhq
Facesynthetics

Yang lain:

Suim

Lihat dataset untuk detail lebih lanjut dan persiapan dataset.

Augmentasi yang tersedia (klik untuk memperluas)

Periksa buku catatan di sini untuk menguji efek augmentasi.

Transformasi Level Pixel:

ColorJitter (kecerahan, kontras, saturasi, rona)
Gamma, ketajaman, autocontrast, menyamakan, posterisasi
Gaussianblur, skala abu -abu

Transformasi tingkat spasial:

Affine, acak
Horizontalflip, vertikalflip
Centercrop, RandomCrop
Pad, Penyisihan, mengubah ukuran
RandomResizedCrop

Penggunaan

Instalasi

Python> = 3.6
obor> = 1.8.1
TorchVision> = 0.9.1

Kemudian, klon repo dan instal proyek dengan:

$ git clone https://github.com/sithu31296/semantic-segmentation
$ cd semantic-segmentation
$ pip install -e .

Konfigurasi (klik untuk memperluas)

Buat file konfigurasi di configs . Konfigurasi sampel untuk dataset ADE20K dapat ditemukan di sini. Kemudian edit bidang yang Anda pikirkan jika diperlukan. File konfigurasi ini diperlukan untuk semua skrip pelatihan, evaluasi dan prediksi.

Pelatihan (klik untuk memperluas)

Untuk berlatih dengan satu GPU:

$ python tools/train.py --cfg configs/CONFIG_FILE.yaml

Untuk berlatih dengan beberapa GPU, atur bidang DDP di file config ke true dan run sebagai berikut:

$ python -m torch.distributed.launch --nproc_per_node=2 --use_env tools/train.py --cfg configs/ < CONFIG_FILE_NAME > .yaml

Evaluasi (klik untuk memperluas)

Pastikan untuk mengatur MODEL_PATH dari file konfigurasi ke direktori model terlatih Anda.

$ python tools/val.py --cfg configs/ < CONFIG_FILE_NAME > .yaml

Untuk mengevaluasi dengan multi-skala dan flip, ubah ENABLE Field di MSF menjadi true dan jalankan perintah yang sama seperti di atas.

Kesimpulan

Untuk membuat inferensi, edit parameter file konfigurasi dari bawah.

Ubah MODEL >> NAME dan BACKBONE ke model pretrained yang Anda inginkan.
Ubah DATASET >> NAME ke nama dataset tergantung pada model pretrained.
Atur TEST >> MODEL_PATH ke bobot pretrained dari model pengujian.
Ubah TEST >> FILE ke jalur file atau folder gambar yang ingin Anda uji.
Hasil pengujian akan disimpan di SAVE_DIR .

 # # example using ade20k pretrained models
$ python tools/infer.py --cfg configs/ade20k.yaml

Contoh Hasil Tes (Segformer-B2):

test_result

Konversi ke kerangka kerja lain (Onnx, Coreml, Openvino, Tflite)

Untuk mengonversi ke Onnx dan Coreml, jalankan:

$ python tools/export.py --cfg configs/ < CONFIG_FILE_NAME > .yaml

Untuk mengonversi ke OpenVino dan Tflite, lihat Torch_optimize.

Inferensi (onnx, openvino, tflite)

 # # ONNX Inference
$ python scripts/onnx_infer.py --model < ONNX_MODEL_PATH > --img-path < TEST_IMAGE_PATH >

# # OpenVINO Inference
$ python scripts/openvino_infer.py --model < OpenVINO_MODEL_PATH > --img-path < TEST_IMAGE_PATH >

# # TFLite Inference
$ python scripts/tflite_infer.py --model < TFLite_MODEL_PATH > --img-path < TEST_IMAGE_PATH >

Referensi (klik untuk memperluas)

https://github.com/coincheung/bisenet
https://github.com/open-mmlab/mmsmegmentation
https://github.com/rwightman/pytorch-image-odels

Kutipan (klik untuk memperluas)

 @article{xie2021segformer,
  title={SegFormer: Simple and Efficient Design for Semantic Segmentation with Transformers},
  author={Xie, Enze and Wang, Wenhai and Yu, Zhiding and Anandkumar, Anima and Alvarez, Jose M and Luo, Ping},
  journal={arXiv preprint arXiv:2105.15203},
  year={2021}
}

@misc{xiao2018unified,
  title={Unified Perceptual Parsing for Scene Understanding}, 
  author={Tete Xiao and Yingcheng Liu and Bolei Zhou and Yuning Jiang and Jian Sun},
  year={2018},
  eprint={1807.10221},
  archivePrefix={arXiv},
  primaryClass={cs.CV}
}

@article{hong2021deep,
  title={Deep Dual-resolution Networks for Real-time and Accurate Semantic Segmentation of Road Scenes},
  author={Hong, Yuanduo and Pan, Huihui and Sun, Weichao and Jia, Yisong},
  journal={arXiv preprint arXiv:2101.06085},
  year={2021}
}

@misc{zhang2021rest,
  title={ResT: An Efficient Transformer for Visual Recognition}, 
  author={Qinglong Zhang and Yubin Yang},
  year={2021},
  eprint={2105.13677},
  archivePrefix={arXiv},
  primaryClass={cs.CV}
}

@misc{huang2021fapn,
  title={FaPN: Feature-aligned Pyramid Network for Dense Image Prediction}, 
  author={Shihua Huang and Zhichao Lu and Ran Cheng and Cheng He},
  year={2021},
  eprint={2108.07058},
  archivePrefix={arXiv},
  primaryClass={cs.CV}
}

@misc{wang2021pvtv2,
  title={PVTv2: Improved Baselines with Pyramid Vision Transformer}, 
  author={Wenhai Wang and Enze Xie and Xiang Li and Deng-Ping Fan and Kaitao Song and Ding Liang and Tong Lu and Ping Luo and Ling Shao},
  year={2021},
  eprint={2106.13797},
  archivePrefix={arXiv},
  primaryClass={cs.CV}
}

@article{Liu2021PSA,
  title={Polarized Self-Attention: Towards High-quality Pixel-wise Regression},
  author={Huajun Liu and Fuqiang Liu and Xinyi Fan and Dong Huang},
  journal={Arxiv Pre-Print arXiv:2107.00782 },
  year={2021}
}

@misc{chao2019hardnet,
  title={HarDNet: A Low Memory Traffic Network}, 
  author={Ping Chao and Chao-Yang Kao and Yu-Shan Ruan and Chien-Hsiang Huang and Youn-Long Lin},
  year={2019},
  eprint={1909.00948},
  archivePrefix={arXiv},
  primaryClass={cs.CV}
}

@inproceedings{sfnet,
  title={Semantic Flow for Fast and Accurate Scene Parsing},
  author={Li, Xiangtai and You, Ansheng and Zhu, Zhen and Zhao, Houlong and Yang, Maoke and Yang, Kuiyuan and Tong, Yunhai},
  booktitle={ECCV},
  year={2020}
}

@article{Li2020SRNet,
  title={Towards Efficient Scene Understanding via Squeeze Reasoning},
  author={Xiangtai Li and Xia Li and Ansheng You and Li Zhang and Guang-Liang Cheng and Kuiyuan Yang and Y. Tong and Zhouchen Lin},
  journal={ArXiv},
  year={2020},
  volume={abs/2011.03308}
}

@ARTICLE{Yucondnet21,
  author={Yu, Changqian and Shao, Yuanjie and Gao, Changxin and Sang, Nong},
  journal={IEEE Signal Processing Letters}, 
  title={CondNet: Conditional Classifier for Scene Segmentation}, 
  year={2021},
  volume={28},
  number={},
  pages={758-762},
  doi={10.1109/LSP.2021.3070472}
}

@misc{yan2022lawin,
  title={Lawin Transformer: Improving Semantic Segmentation Transformer with Multi-Scale Representations via Large Window Attention}, 
  author={Haotian Yan and Chuang Zhang and Ming Wu},
  year={2022},
  eprint={2201.01615},
  archivePrefix={arXiv},
  primaryClass={cs.CV}
}

@misc{yu2021metaformer,
  title={MetaFormer is Actually What You Need for Vision}, 
  author={Weihao Yu and Mi Luo and Pan Zhou and Chenyang Si and Yichen Zhou and Xinchao Wang and Jiashi Feng and Shuicheng Yan},
  year={2021},
  eprint={2111.11418},
  archivePrefix={arXiv},
  primaryClass={cs.CV}
}

@misc{wightman2021resnet,
  title={ResNet strikes back: An improved training procedure in timm}, 
  author={Ross Wightman and Hugo Touvron and Hervé Jégou},
  year={2021},
  eprint={2110.00476},
  archivePrefix={arXiv},
  primaryClass={cs.CV}
}

@misc{liu2022convnet,
  title={A ConvNet for the 2020s}, 
  author={Zhuang Liu and Hanzi Mao and Chao-Yuan Wu and Christoph Feichtenhofer and Trevor Darrell and Saining Xie},
  year={2022},
  eprint={2201.03545},
  archivePrefix={arXiv},
  primaryClass={cs.CV}
}

@misc{li2022uniformer,
  title={UniFormer: Unifying Convolution and Self-attention for Visual Recognition}, 
  author={Kunchang Li and Yali Wang and Junhao Zhang and Peng Gao and Guanglu Song and Yu Liu and Hongsheng Li and Yu Qiao},
  year={2022},
  eprint={2201.09450},
  archivePrefix={arXiv},
  primaryClass={cs.CV}
}

Memperluas

Informasi Tambahan

Versi v0.2.6
Tipe ular piton
Waktu Pembaruan 2025-07-12
ukuran 2.32MB
Berasal dari Github

Aplikasi Terkait

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub the via/releases

2024-11-01

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ToDo Co

ular piton

1.0.0
Python Portfolio

ular piton
Alat bagan data sumber terbuka Redash v24.10.0

ular piton

24.10.0
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua