PSMNet下載PSMNet源代碼下載

PSMNet

Python

1.0.0

下載

金字塔立體聲匹配網絡

該存儲庫包含“金字塔立體聲匹配網絡”論文（CVPR 2018）的代碼（在Pytorch中），Jia-Ren Chang和Yong-Sheng Chen。

ChangElog

2020/12/20：更新PSMNET：現在支持Torch 1.6.0/Torchvision 0.5.5和Python 3.7，刪除了不一致的凹痕。

2020/12/20：我們提出的實時立體聲可以在此處實時立體聲找到。

引用

 @inproceedings{chang2018pyramid,
  title={Pyramid Stereo Matching Network},
  author={Chang, Jia-Ren and Chen, Yong-Sheng},
  booktitle={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition},
  pages={5410--5418},
  year={2018}
}

內容

介紹
用法
結果
聯繫人

介紹

最近的工作表明，可以從立體聲對的深度估計可以作為監督的學習任務配製，以通過卷積神經網絡（CNN）解決。但是，當前的體系結構依賴於基於補丁的暹羅網絡，缺乏利用上下文信息以在不張力區域查找信件的手段。為了解決這個問題，我們提出了PSMNet，這是一個由兩個主要模塊組成的金字塔立體聲匹配網絡：空間金字塔池和3D CNN。空間金字塔池模塊通過在不同尺度和位置匯總上下文以形成成本量來利用全球上下文信息的能力。 3D CNN學會了使用堆疊的多個沙漏網絡與中間監督相結合的成本量。

用法

依賴性

Python 3.7
Pytorch（1.6.0+）
火炬0.5.0
Kitti立體聲
場景流

 Usage of Scene Flow dataset
Download RGB cleanpass images and its disparity for three subset: FlyingThings3D, Driving, and Monkaa.
Put them in the same folder.
And rename the folder as: "driving_frames_cleanpass", "driving_disparity", "monkaa_frames_cleanpass", "monkaa_disparity", "frames_cleanpass", "frames_disparity".

注意

pytorch 0.4.1+中的upmample函數的警告：添加“ align_corners = true”到上樣本函數。
乘以1.17，輸出差異可能會更好。從第135期和＃113報告中報告。

火車

例如，使用以下命令在場景流程上訓練PSMNET

 python main.py --maxdisp 192 
               --model stackhourglass 
               --datapath (your scene flow data folder)
               --epochs 10 
               --loadmodel (optional)
               --savemodel (path for saving model)

作為另一個示例，請使用以下命令在2015年對psmnet進行捕獲

 python finetune.py --maxdisp 192 
                   --model stackhourglass 
                   --datatype 2015 
                   --datapath (KITTI 2015 training data folder) 
                   --epochs 300 
                   --loadmodel (pretrained PSMNet) 
                   --savemodel (path for saving model)

您還可以在Run.sh中看到這些示例。

評估

使用以下命令在Kitti 2015測試數據上評估受過訓練的PSMNET

 python submission.py --maxdisp 192 
                     --model stackhourglass 
                     --KITTI 2015 
                     --datapath (KITTI 2015 test data folder) 
                     --loadmodel (finetuned PSMNet)

預驗證的模型

※注意：預驗證的模型保存在.tar中；但是，您不需要解開它。使用Torch.load（）加載它。

更新：2018/9/6我們發布了預先訓練的Kitti 2012模型。

更新：2021/9/22使用Torch 1.8.1的驗證模型（先前的型號重量是訓練的火炬0.4.1）

Kitti 2015	場景流	Kitti 2012	場景流（火炬1.8.1）
Google Drive	Google Drive	Google Drive	Google Drive

用自己的立體聲測試

 python Test_img.py --loadmodel (finetuned PSMNet) --leftimg ./left.png --rightimg ./right.png

結果

具有不同設置的PSMNET的評估

※請注意，報告的3-PX驗證錯誤是使用Kitti的官方MATLAB代碼計算的，而不是我們的代碼。

Kitti 2015排行榜的結果

排行榜鏈接

方法	d1-all（全部）	D1-ALL（NOC）	運行時間
psmnet	2.32％	2.14％	0.41
IRESNET-I2	2.44％	2.19％	0.12
GC-NET	2.87％	2.61％	0.90
MC-CNN	3.89％	3.33％	67

定性結果

左圖

預測差距

錯誤

接收場的可視化

我們可視化PSMNET，完整設置和基線的不同設置的接收場。

完整設置：擴張的Conv，SPP，堆疊的沙漏

基線：沒有擴張的轉換，沒有spp，沒有堆疊的沙漏

計算了圖像中心的像素的接收場，由紅十字會指示。

聯繫人

關注[email protected]

歡迎任何討論或疑慮！

展開

附加信息

版本 1.0.0
類型 Python
更新時間 2025-07-12
大小 47.32KB
來自於 Github

相關應用

爲您推薦

chat.petals.dev

其他源碼

1.0.0
GPT Prompt Templates

其他源碼

1.0.0
GPTyped

其他源碼

GPTyped 1.0.5
ToDo Co

Python

1.0.0
Python Portfolio

Python
Redash開源的資料圖表工具v24.10.0

Python

24.10.0
Google Dorks

其他源碼

1.0
shepherd

其他源碼

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

其他源碼

v1.1.0-rc-3

相關資訊全部

PSMNet

金字塔立體聲匹配網絡

ChangElog

引用

內容

介紹

用法

依賴性

注意

火車

評估

預驗證的模型

用自己的立體聲測試

結果

具有不同設置的PSMNET的評估

Kitti 2015排行榜的結果

定性結果

左圖

預測差距

錯誤

接收場的可視化

聯繫人

ToDo Co

Python Portfolio

Redash開源的資料圖表工具v24.10.0

datamule python

smartchart資料視覺化平台v6.9

Locust負載測試工具v2.32.0

chat.petals.dev

GPT Prompt Templates

GPTyped

ToDo Co

Python Portfolio

Redash開源的資料圖表工具v24.10.0

Google Dorks

shepherd

mongo express