PSMNet 다운로드 - PSMNet 소스 코드 다운로드

PSMNet

파이썬

1.0.0

다운로드

피라미드 스테레오 매칭 네트워크

이 저장소에는 Jia-Ren Chang 및 Yong-Sheng Chen의 "Pyramid Stereo Matching Network"용지 (CVPR 2018)에 대한 코드 (Pytorch)가 포함되어 있습니다.

changelog

2020/12/20 : PSMNet 업데이트 : 이제 Torch 1.6.0/Torchvision 0.5.0 및 Python 3.7을 지원하여 일관되지 않은 압입.

2020/12/20 : 제안 된 실시간 스테레오는 여기에서 실시간 스테레오를 찾을 수 있습니다.

소환

 @inproceedings{chang2018pyramid,
  title={Pyramid Stereo Matching Network},
  author={Chang, Jia-Ren and Chen, Yong-Sheng},
  booktitle={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition},
  pages={5410--5418},
  year={2018}
}

내용물

소개
용법
결과
콘택트 렌즈

소개

최근의 연구에 따르면 스테레오 이미지 쌍의 깊이 추정은 CNN (Convolutional Neural Networks)으로 해결되는 감독 학습 과제로 공식화 될 수 있습니다. 그러나 현재의 아키텍처는 패치 기반 시암 네트워크에 의존하며, 부실한 지역에서 서신을 찾기위한 컨텍스트 정보를 이용할 수있는 수단이 부족합니다. 이 문제를 해결하기 위해 공간 피라미드 풀링과 3D CNN의 두 가지 주요 모듈로 구성된 피라미드 스테레오 일치 네트워크 인 PSMNet을 제안합니다. 공간 피라미드 풀링 모듈은 다른 척도와 위치에서 컨텍스트를 집계하여 비용 부피를 형성함으로써 글로벌 컨텍스트 정보의 용량을 활용합니다. 3D CNN은 중간 감독과 함께 스택 된 여러 모래 시계 네트워크를 사용하여 비용 볼륨을 정규화하는 법을 배웁니다.

용법

의존성

파이썬 3.7
Pytorch (1.6.0+)
Torchvision 0.5.0
키티 스테레오
장면 흐름

 Usage of Scene Flow dataset
Download RGB cleanpass images and its disparity for three subset: FlyingThings3D, Driving, and Monkaa.
Put them in the same folder.
And rename the folder as: "driving_frames_cleanpass", "driving_disparity", "monkaa_frames_cleanpass", "monkaa_disparity", "frames_cleanpass", "frames_disparity".

알아채다

Pytorch 0.4.1+의 업 샘플 기능 경고 : "align_corners = true"를 업 샘플 함수에 추가하십시오.
1.17을 곱하면 출력 불균형이 더 나을 수 있습니다. 문제 #135 및 #113에서보고되었습니다.

기차

예를 들어, 다음 명령을 사용하여 장면 흐름에서 psmnet을 훈련하십시오.

 python main.py --maxdisp 192 
               --model stackhourglass 
               --datapath (your scene flow data folder)
               --epochs 10 
               --loadmodel (optional)
               --savemodel (path for saving model)

또 다른 예로, 다음 명령을 사용하여 Kitti 2015의 PSMNet을 미정하십시오.

 python finetune.py --maxdisp 192 
                   --model stackhourglass 
                   --datatype 2015 
                   --datapath (KITTI 2015 training data folder) 
                   --epochs 300 
                   --loadmodel (pretrained PSMNet) 
                   --savemodel (path for saving model)

Run.sh에서 해당 예제를 볼 수 있습니다.

평가

Kitti 2015 테스트 데이터에서 훈련 된 PSMNet을 평가하려면 다음 명령을 사용하십시오.

 python submission.py --maxdisp 192 
                     --model stackhourglass 
                     --KITTI 2015 
                     --datapath (KITTI 2015 test data folder) 
                     --loadmodel (finetuned PSMNet)

사방 모델

※ 참고 : 사전 예방 모델은 .tar에 저장되었습니다. 그러나, 당신은 그것을 극복 할 필요가 없습니다. Torch.load ()를 사용하여로드하십시오.

업데이트 : 2018/9/6 우리는 미리 훈련 된 Kitti 2012 모델을 출시했습니다.

업데이트 : 2021/9/22 Torch 1.8.1을 사용한 사전 취사 모델 (이전 모델 무게는 훈련 된 Torch 0.4.1)

Kitti 2015	장면 흐름	Kitti 2012	장면 흐름 (토치 1.8.1)
구글 드라이브	구글 드라이브	구글 드라이브	구글 드라이브

스테레오 쌍을 테스트하십시오

 python Test_img.py --loadmodel (finetuned PSMNet) --leftimg ./left.png --rightimg ./right.png

결과

다른 설정으로 PSMNET 평가

보고 된 3-PX 유효성 검사 오류는 코드가 아닌 Kitti의 공식 MATLAB 코드를 사용하여 계산되었습니다.

Kitti 2015 리더 보드의 결과

리더 보드 링크

방법	D1-ALL (모두)	D1-ALL (NOC)	런타임
psmnet	2.32 %	2.14 %	0.41
Iresnet-I2	2.44 %	2.19 %	0.12
GC-NET	2.87 %	2.61 %	0.90
MC-CNN	3.89 %	3.33 %	67

질적 결과

왼쪽 이미지

예측 된 차이

오류

수용 분야의 시각화

PSMNET, 전체 설정 및 기준선의 다양한 설정의 수용 필드를 시각화합니다.

전체 설정 : 확장 된 Conv, spp, 쌓인 모래 시계

기준선 : 확장 된 설득력, SPP, 스택 모래 시계 없음 없음

수용 필드는 적십자로 표시된 이미지 센터의 픽셀에 대해 계산되었습니다.

콘택트 렌즈

[email protected]

토론이나 우려 사항은 환영됩니다!

확장하다

추가 정보

버전 1.0.0
유형 파이썬
업데이트 시간 2025-07-12
크기 47.32KB
출처 Github

PSMNet

피라미드 스테레오 매칭 네트워크

changelog

소환

내용물

소개

용법

의존성

알아채다

기차

평가

사방 모델

스테레오 쌍을 테스트하십시오

결과

다른 설정으로 PSMNET 평가

Kitti 2015 리더 보드의 결과

질적 결과

왼쪽 이미지

예측 된 차이

오류

수용 분야의 시각화

콘택트 렌즈

ToDo Co

Python Portfolio

Redash 오픈 소스 데이터 차트 도구 v24.10.0

datamule python

스마트차트 데이터 시각화 플랫폼 v6.9

Locust 부하 테스트 도구 v2.32.0

chat.petals.dev

GPT Prompt Templates

GPTyped

ToDo Co

Python Portfolio

Redash 오픈 소스 데이터 차트 도구 v24.10.0

Google Dorks

shepherd

mongo express