ดาวน์โหลด PSMNet - ดาวน์โหลดซอร์สโค้ด PSMNet

PSMNet

หลาม

1.0.0

ดาวน์โหลด

เครือข่ายการจับคู่สเตอริโอพีระมิด

ที่เก็บนี้มีรหัส (ใน Pytorch) สำหรับ "เครือข่ายการจับคู่สเตอริโอพีระมิด" (CVPR 2018) โดย Jia-Ren Chang และ Yong-Sheng Chen

การเปลี่ยนแปลง

2020/12/20: อัปเดต PSMNET: ตอนนี้รองรับ Torch 1.6.0/Torchvision 0.5.0 และ Python 3.7, ลบการเยื้องที่ไม่สอดคล้องกัน

2020/12/20: สเตอริโอแบบเรียลไทม์ที่เราเสนอสามารถพบได้ที่นี่สเตอริโอแบบเรียลไทม์

การอ้างอิง

 @inproceedings{chang2018pyramid,
  title={Pyramid Stereo Matching Network},
  author={Chang, Jia-Ren and Chen, Yong-Sheng},
  booktitle={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition},
  pages={5410--5418},
  year={2018}
}

สารบัญ

การแนะนำ
การใช้งาน
ผลลัพธ์
ผู้ติดต่อ

การแนะนำ

งานล่าสุดได้แสดงให้เห็นว่าการประมาณค่าความลึกจากภาพสเตอริโอคู่สามารถกำหนดเป็นงานการเรียนรู้ภายใต้การดูแลเพื่อแก้ไขด้วยเครือข่ายประสาท (CNNs) อย่างไรก็ตามสถาปัตยกรรมปัจจุบันขึ้นอยู่กับเครือข่ายสยามที่ใช้แพทช์โดยไม่มีวิธีการใช้ประโยชน์จากข้อมูลบริบทสำหรับการค้นหาการติดต่อในภูมิภาคที่ไม่ดี เพื่อแก้ไขปัญหานี้เราเสนอ PSMNET ซึ่งเป็นเครือข่ายการจับคู่สเตอริโอปิรามิดประกอบด้วยสองโมดูลหลัก: การรวมปิรามิดเชิงพื้นที่และ 3D CNN โมดูลการรวมปิรามิดเชิงพื้นที่ใช้ประโยชน์จากความสามารถของข้อมูลบริบททั่วโลกโดยการรวมบริบทในระดับและสถานที่ต่าง ๆ เพื่อสร้างปริมาณต้นทุน 3D CNN เรียนรู้ที่จะทำให้ปริมาณค่าใช้จ่ายเป็นปกติโดยใช้เครือข่ายนาฬิกาทรายหลายชุดที่ซ้อนกันร่วมกับการกำกับดูแลระดับกลาง

การใช้งาน

การพึ่งพาอาศัยกัน

Python 3.7
Pytorch (1.6.0+)
Torchvision 0.5.0
สเตอริโอ Kitti
การไหลของฉาก

 Usage of Scene Flow dataset
Download RGB cleanpass images and its disparity for three subset: FlyingThings3D, Driving, and Monkaa.
Put them in the same folder.
And rename the folder as: "driving_frames_cleanpass", "driving_disparity", "monkaa_frames_cleanpass", "monkaa_disparity", "frames_cleanpass", "frames_disparity".

สังเกต

คำเตือนของฟังก์ชั่น upsample ใน pytorch 0.4.1+: เพิ่ม "align_corners = true" กับฟังก์ชันอัพเจอร์
ความไม่เท่าเทียมกันของผลผลิตอาจดีกว่าด้วยการทวีคูณด้วย 1.17 รายงานจากปัญหา #135 และ #113

รถไฟ

ตัวอย่างเช่นใช้คำสั่งต่อไปนี้เพื่อฝึก psmnet ในการไหลของฉาก

 python main.py --maxdisp 192 
               --model stackhourglass 
               --datapath (your scene flow data folder)
               --epochs 10 
               --loadmodel (optional)
               --savemodel (path for saving model)

เป็นอีกตัวอย่างหนึ่งให้ใช้คำสั่งต่อไปนี้เพื่อ finetune psmnet บน Kitti 2015

 python finetune.py --maxdisp 192 
                   --model stackhourglass 
                   --datatype 2015 
                   --datapath (KITTI 2015 training data folder) 
                   --epochs 300 
                   --loadmodel (pretrained PSMNet) 
                   --savemodel (path for saving model)

คุณยังสามารถดูตัวอย่างเหล่านั้นใน Run.sh

การประเมิน

ใช้คำสั่งต่อไปนี้เพื่อประเมิน PSMNET ที่ผ่านการฝึกอบรมเกี่ยวกับข้อมูลทดสอบ Kitti 2015

 python submission.py --maxdisp 192 
                     --model stackhourglass 
                     --KITTI 2015 
                     --datapath (KITTI 2015 test data folder) 
                     --loadmodel (finetuned PSMNet)

แบบจำลอง

※หมายเหตุ: แบบจำลองที่ถูกตั้งไว้ถูกบันทึกไว้ใน. tar; อย่างไรก็ตามคุณไม่จำเป็นต้องถอดมัน ใช้ Torch.load () เพื่อโหลด

อัปเดต: 2018/9/6 เราเปิดตัวรุ่น Kitti 2012 ที่ผ่านการฝึกอบรมมาแล้ว

อัปเดต: 2021/9/22 รูปแบบที่ผ่านการฝึกฝนโดยใช้ Torch 1.8.1 (น้ำหนักรุ่นก่อนหน้านี้ได้รับการฝึกฝน Torch 0.4.1)

Kitti 2015	การไหลของฉาก	Kitti 2012	Scene Flow (Torch 1.8.1)
Google Drive	Google Drive	Google Drive	Google Drive

ทดสอบคู่สเตอริโอของคุณเอง

 python Test_img.py --loadmodel (finetuned PSMNet) --leftimg ./left.png --rightimg ./right.png

ผลลัพธ์

การประเมินผลของ PSMNET ด้วยการตั้งค่าที่แตกต่างกัน

※โปรดทราบว่าข้อผิดพลาดการตรวจสอบความถูกต้อง 3-PX ที่รายงานถูกคำนวณโดยใช้รหัส MATLAB อย่างเป็นทางการของ Kitti ไม่ใช่รหัสของเรา

ผลลัพธ์เกี่ยวกับกระดานผู้นำ Kitti 2015

ลิงค์บอร์ดลีดเดอร์

วิธี	d1-all (ทั้งหมด)	D1-ALL (NOC)	รันไทม์
psmnet	2.32 %	2.14 %	0.41
IRESNET-I2	2.44 %	2.19 %	0.12
GC-net	2.87 %	2.61 %	0.90
MC-CNN	3.89 %	3.33 %	67

ผลการศึกษาเชิงคุณภาพ

ภาพซ้าย

ทำนายความไม่เท่าเทียมกัน

ข้อผิดพลาด

การสร้างภาพของสนามที่เปิดกว้าง

เราเห็นภาพฟิลด์ที่เปิดกว้างของการตั้งค่าที่แตกต่างกันของ PSMNET การตั้งค่าเต็มรูปแบบและพื้นฐาน

การตั้งค่าเต็มรูปแบบ: Delated Conv, SPP, นาฬิกาทรายเรียงซ้อนกัน

พื้นฐาน: ไม่มีความเชื่อมั่นที่ขยายตัวไม่มี SPP ไม่มีนาฬิกาทรายแบบเรียงซ้อนกัน

ฟิลด์ที่เปิดกว้างถูกคำนวณสำหรับพิกเซลที่ศูนย์ภาพที่ระบุโดยสภากาชาด

ผู้ติดต่อ

[email protected]

ยินดีต้อนรับการอภิปรายหรือข้อกังวลใด ๆ !

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท หลาม
เวลาอัปเดต 2025-07-12
ขนาด 47.32KB
มาจาก Github

แอปที่เกี่ยวข้อง

ToDo Co

2025-03-22
Python Portfolio

2024-11-10
เครื่องมือแผนภูมิข้อมูลโอเพ่นซอร์ส Redash v24.10.0

2024-11-27
datamule python

2024-11-08
แพลตฟอร์มการแสดงภาพข้อมูล smartchart เวอร์ชัน 6.9

2024-11-27
เครื่องมือทดสอบโหลดตั๊กแตน v2.32.0

2024-11-27

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ToDo Co

หลาม

1.0.0
Python Portfolio

หลาม
เครื่องมือแผนภูมิข้อมูลโอเพ่นซอร์ส Redash v24.10.0

หลาม

24.10.0
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด