awesome semantic segmentation pytorch
1.0.0
Inglés | 简体中文
Este proyecto tiene como objetivo proporcionar una implementación de referencia concisa, fácil de usar y modificable para modelos de segmentación semántica utilizando Pytorch.

# semantic-segmentation-pytorch dependencies
pip install ninja tqdm
# follow PyTorch installation in https://pytorch.org/get-started/locally/
conda install pytorch torchvision -c pytorch
# install PyTorch Segmentation
git clone https://github.com/Tramac/awesome-semantic-segmentation-pytorch.git
# for example, train fcn32_vgg16_pascal_voc:
python train.py --model fcn32s --backbone vgg16 --dataset pascal_voc --lr 0.0001 --epochs 50
# for example, train fcn32_vgg16_pascal_voc with 4 GPUs:
export NGPUS=4
python -m torch.distributed.launch --nproc_per_node=$NGPUS train.py --model fcn32s --backbone vgg16 --dataset pascal_voc --lr 0.0001 --epochs 50
# for example, evaluate fcn32_vgg16_pascal_voc
python eval.py --model fcn32s --backbone vgg16 --dataset pascal_voc
# for example, evaluate fcn32_vgg16_pascal_voc with 4 GPUs:
export NGPUS=4
python -m torch.distributed.launch --nproc_per_node=$NGPUS eval.py --model fcn32s --backbone vgg16 --dataset pascal_voc
cd ./scripts
#for new users:
python demo.py --model fcn32s_vgg16_voc --input-pic ../tests/test_img.jpg
#you should add 'test.jpg' by yourself
python demo.py --model fcn32s_vgg16_voc --input-pic ../datasets/test.jpg
.{SEG_ROOT}
├── scripts
│ ├── demo.py
│ ├── eval.py
│ └── train.py
Detalles para el modelo y la columna vertebral.
.{SEG_ROOT}
├── core
│ ├── models
│ │ ├── bisenet.py
│ │ ├── danet.py
│ │ ├── deeplabv3.py
│ │ ├── deeplabv3+.py
│ │ ├── denseaspp.py
│ │ ├── dunet.py
│ │ ├── encnet.py
│ │ ├── fcn.py
│ │ ├── pspnet.py
│ │ ├── icnet.py
│ │ ├── enet.py
│ │ ├── ocnet.py
│ │ ├── psanet.py
│ │ ├── cgnet.py
│ │ ├── espnet.py
│ │ ├── lednet.py
│ │ ├── dfanet.py
│ │ ├── ......
Puede ejecutar Script para descargar DataSet, como:
cd ./core/data/downloader
python ade20k.py --download-dir ../datasets/ade
| Conjunto de datos | set de entrenamiento | conjunto de validación | conjunto de pruebas |
|---|---|---|---|
| VOC2012 | 1464 | 1449 | ✘ |
| Vocaugal | 11355 | 2857 | ✘ |
| ADK20K | 20210 | 2000 | ✘ |
| Paisajes urbanos | 2975 | 500 | ✘ |
| PALMA DE COCO | |||
| Sbu-shadow | 4085 | 638 | ✘ |
| Labio (mira a la persona) | 30462 | 10000 | 10000 |
.{SEG_ROOT}
├── core
│ ├── data
│ │ ├── dataloader
│ │ │ ├── ade.py
│ │ │ ├── cityscapes.py
│ │ │ ├── mscoco.py
│ │ │ ├── pascal_aug.py
│ │ │ ├── pascal_voc.py
│ │ │ ├── sbu_shadow.py
│ │ └── downloader
│ │ ├── ade20k.py
│ │ ├── cityscapes.py
│ │ ├── mscoco.py
│ │ ├── pascal_voc.py
│ │ └── sbu_shadow.py
| Métodos | Columna vertebral | Conjunto de trenes | Evalor | CROPS_SIZE | épocas | Jpu | Significa iou | pixacc |
|---|---|---|---|---|---|---|---|---|
| FCN32S | VGG16 | tren | Val | 480 | 60 | ✘ | 47.50 | 85.39 |
| FCN16S | VGG16 | tren | Val | 480 | 60 | ✘ | 49.16 | 85.98 |
| FCN8S | VGG16 | tren | Val | 480 | 60 | ✘ | 48.87 | 85.02 |
| FCN32S | resnet50 | tren | Val | 480 | 50 | ✘ | 54.60 | 88.57 |
| PSPNET | resnet50 | tren | Val | 480 | 60 | ✘ | 63.44 | 89.78 |
| DeepLabv3 | resnet50 | tren | Val | 480 | 60 | ✘ | 60.15 | 88.36 |
Nota: lr=1e-4, batch_size=4, epochs=80 .
Consulte la prueba para obtener más detalles.
.{SEG_ROOT}
├── tests
│ └── test_model.py