Скачать PSMNet - PSMNet исходный код скачать

PSMNet

Питон

1.0.0

Скачать

Пирамида

Этот репозиторий содержит код (в Pytorch) для статьи «Пирамида-стереоподобная сеть» (CVPR 2018) Цзя-Рен Чанг и Юн-Шенг Чен.

изменение

2020/12/20: обновление PSMNET: теперь поддержите TORCH 1.6.0/TOCHVISION 0.5.0 и Python 3.7, удалено непоследовательное отступление.

2020/12/20: Наш предложенную стереосистему в режиме реального времени можно найти здесь, стерео в режиме реального времени.

Цитирование

 @inproceedings{chang2018pyramid,
  title={Pyramid Stereo Matching Network},
  author={Chang, Jia-Ren and Chen, Yong-Sheng},
  booktitle={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition},
  pages={5410--5418},
  year={2018}
}

Содержимое

Введение
Использование
Результаты
Контакты

Введение

Недавняя работа показала, что оценка глубины из стерео -пары изображений может быть сформулирована в качестве контролируемой учебной задачи, которая должна быть решена с помощью сверточных нейронных сетей (CNN). Тем не менее, текущие архитектуры полагаются на патч-сиамские сети, не имеющие средств для использования контекстной информации для поиска соответствия в непоколебленных регионах. Чтобы решить эту проблему, мы предлагаем PSMNET, пирамидную стерео, соответствующую сети, состоящей из двух основных модулей: объединение пространственной пирамиды и 3D CNN. Пространственный модуль объединения пирамиды использует возможности глобальной контекстной информации, агрегируя контекст в различных масштабах и местоположениях, чтобы сформировать объем стоимости. 3D CNN учится регулярно использовать объем стоимости с использованием сложенных сетей для нескольких песочных часов в сочетании с промежуточным надзором.

Использование

Зависимости

Python 3.7
Pytorch (1,6,0+)
TOCLEVISION 0.5.0
Китти стерео
Сцена

 Usage of Scene Flow dataset
Download RGB cleanpass images and its disparity for three subset: FlyingThings3D, Driving, and Monkaa.
Put them in the same folder.
And rename the folder as: "driving_frames_cleanpass", "driving_disparity", "monkaa_frames_cleanpass", "monkaa_disparity", "frames_cleanpass", "frames_disparity".

Уведомление

Предупреждение о функции upsAmple в Pytorch 0.4.1+: добавьте «align_corners = true» в функции opsample.
Выходное несоответствие может быть лучше с мультиплингом на 1,17. Сообщается из вопросов № 135 и № 113.

Тренироваться

В качестве примера используйте следующую команду для обучения PSMNET на сцене.

 python main.py --maxdisp 192 
               --model stackhourglass 
               --datapath (your scene flow data folder)
               --epochs 10 
               --loadmodel (optional)
               --savemodel (path for saving model)

В качестве другого примера, используйте следующую команду для Finetune A PSMNet на Kitti 2015

 python finetune.py --maxdisp 192 
                   --model stackhourglass 
                   --datatype 2015 
                   --datapath (KITTI 2015 training data folder) 
                   --epochs 300 
                   --loadmodel (pretrained PSMNet) 
                   --savemodel (path for saving model)

Вы также можете увидеть эти примеры в Run.sh.

Оценка

Используйте следующую команду для оценки обученного PSMNET на тестовых данных Kitti 2015

 python submission.py --maxdisp 192 
                     --model stackhourglass 
                     --KITTI 2015 
                     --datapath (KITTI 2015 test data folder) 
                     --loadmodel (finetuned PSMNet)

Предварительная модель

※ ПРИМЕЧАНИЕ: Предварительная модель была сохранена в .tar; Тем не менее, вам не нужно это растереть. Используйте Torch.load (), чтобы загрузить его.

ОБНОВЛЕНИЕ: 2018/9/6 Мы выпустили предварительно обученную модель Kitti 2012.

Обновление: 2021/9/22. Предварительная модель с использованием Torch 1.8.1 (вес предыдущей модели обучен факел 0.4.1)

Китти 2015	Сцена	Китти 2012	Поток сцены (факел 1.8.1)
Google Drive	Google Drive	Google Drive	Google Drive

Проверьте свою собственную стерео пару

 python Test_img.py --loadmodel (finetuned PSMNet) --leftimg ./left.png --rightimg ./right.png

Результаты

Оценка PSMNET с различными настройками

※ Обратите внимание, что сообщенные ошибки проверки 3-PX были рассчитаны с использованием официального кода Matlab Kitti, а не нашего кода.

Результаты на таблицу лидеров Kitti 2015

Ссылка на лидеры

Метод	D1-all (все)	D1-All (NOC)	Время выполнения (ы)
Psmnet	2,32 %	2,14 %	0,41
Iresnet-I2	2,44 %	2,19 %	0,12
GC-Net	2,87 %	2,61 %	0,90
MC-CNN	3,89 %	3,33 %	67

Качественные результаты

Левое изображение

Прогнозируемое несоответствие

Ошибка

Визуализация восприимчивого поля

Мы визуализируем восприимчивые поля различных настройки PSMNET, полного настройки и базового уровня.

Полная настройка: расширенная конвей, SPP, сложенные песочные часы

Базовая линия: нет расширенного конвейса, без SPP, без сложенных песочных часов

Рецептивные поля были рассчитаны для пикселя в центре изображения, обозначенного Красным Крестом.

Контакты

Следуйте по адресу @gmail.com

Любые обсуждения или проблемы приветствуются!

Расширять

Дополнительная информация

Версия 1.0.0
Тип Питон
Время обновления 2025-07-12
размер 47.32KB
От Github

Связанные приложения

ToDo Co

2025-03-22
Python Portfolio

2024-11-10
Инструмент диаграмм данных с открытым исходным кодом Redash v24.10.0

2024-11-27
datamule python

2024-11-08
платформа визуализации данных смарт-диаграмм v6.9

2024-11-27
Инструмент нагрузочного тестирования Locus v2.32.0

2024-11-27

PSMNet

Пирамида

изменение

Цитирование

Содержимое

Введение

Использование

Зависимости

Уведомление

Тренироваться

Оценка

Предварительная модель

Проверьте свою собственную стерео пару

Результаты

Оценка PSMNET с различными настройками

Результаты на таблицу лидеров Kitti 2015

Качественные результаты

Левое изображение

Прогнозируемое несоответствие

Ошибка

Визуализация восприимчивого поля

Контакты

ToDo Co

Python Portfolio

Инструмент диаграмм данных с открытым исходным кодом Redash v24.10.0

datamule python

платформа визуализации данных смарт-диаграмм v6.9

Инструмент нагрузочного тестирования Locus v2.32.0

chat.petals.dev

GPT Prompt Templates

GPTyped

ToDo Co

Python Portfolio

Инструмент диаграмм данных с открытым исходным кодом Redash v24.10.0

Google Dorks

shepherd

mongo express