ดาวน์โหลด SReC - ดาวน์โหลดซอร์สโค้ด SReC

SReC

หลาม

1.0.0

ดาวน์โหลด

การบีบอัดภาพที่ไม่สูญเสียผ่านความละเอียดสูง

Sheng Cao, Chao-Yuan Wu, Philipp Krähenbühl

[กระดาษ]

การอ้างอิง

 @article { cao2020lossless ,
  title = { Lossless Image Compression through Super-Resolution } ,
  author = { Cao, Sheng and Wu, Chao-Yuan and and Kr{"a}henb{"u}hl, Philipp } ,
  year = { 2020 } ,
  journal = { arXiv preprint arXiv:2004.02872 } ,
}

หากคุณใช้ codebase ของเราโปรดพิจารณาอ้าง L3C ด้วย

ภาพรวม

นี่คือการดำเนินการอย่างเป็นทางการของ SREC ใน Pytorch SREC เฟรมการบีบอัดแบบไม่สูญเสียเป็นปัญหาที่มีความละเอียดสูงและใช้เครือข่ายประสาทเพื่อบีบอัดภาพ SREC สามารถบรรลุอัตราการบีบอัดที่ล้ำสมัยในชุดข้อมูลขนาดใหญ่ที่มีการใช้งานจริง การฝึกอบรมการบีบอัดและการบีบอัดได้รับการสนับสนุนอย่างเต็มที่และเปิดโล่ง

เริ่มต้น

เราขอแนะนำขั้นตอนต่อไปนี้สำหรับการเริ่มต้น

ติดตั้งการพึ่งพาที่จำเป็น
ดาวน์โหลดชุดการตรวจสอบภาพเปิด
เรียกใช้การบีบอัดบนชุดการตรวจสอบภาพเปิดด้วยน้ำหนักรุ่นที่ผ่านการฝึกอบรม

การติดตั้ง

ดูที่นี่สำหรับคำแนะนำในการติดตั้ง

น้ำหนักแบบจำลอง

เราได้เปิดตัวโมเดลที่ผ่านการฝึกอบรมสำหรับทั้ง ImageNet64 และ Open Images (PNG) ผลการบีบอัดทั้งหมดวัดเป็นบิตต่อพิกเซลย่อย (BPSP)

ชุดข้อมูล	BPSP	น้ำหนักแบบจำลอง
ImageNet64	4.29	Models/Imagenet64.pth
เปิดภาพ	2.70	โมเดล/openimages.pth

การฝึกอบรม

ในการเรียกใช้รหัสคุณต้องอยู่ในไดเรกทอรีระดับสูงสุด

 python3 -um src.train 
  --train-path "path to directory of training images" 
  --train-file "list of filenames of training images, one filename per line" 
  --eval-path "path to directory of eval images" 
  --eval-file "list of filenames of eval images, one filename per line" 
  --plot "directory to store model output" 
  --batch "batch size"

ภาพการฝึกอบรมจะต้องจัดในรูปแบบของ train-path/filename จากชื่อไฟล์ในไฟล์รถไฟ สิ่งเดียวกันนี้ใช้กับภาพประเมิน

เราได้รวมไฟล์การฝึกอบรมและการประเมินของเราที่ใช้สำหรับ ImageNet64 และ Open Images (PNG) ในไดเรกทอรีชุด datasets

สำหรับ ImageNet64 เราใช้ชุดพารามิเตอร์ที่แตกต่างกันเล็กน้อยกว่าภาพไฮเปอร์พารามิเตอร์แบบเปิดซึ่งเป็นค่าเริ่มต้น เพื่อฝึก Imagenet64 ตามการตั้งค่าจากกระดาษของเรา Run

 python3 -um src.train 
  --train-path "path to directory of training images" 
  --train-file "list of filenames of training images, one filename per line" 
  --eval-path "path to directory of eval images" 
  --eval-file "list of filenames of eval images, one filename per line" 
  --plot "directory to store model output" 
  --batch "batch size" 
  --epochs 10 
  --lr-epochs 1 
  --crop 64

เรียกใช้ python3 -um src.train --help สำหรับรายการของ hyperparameters ที่ปรับได้

การประเมิน

ด้วยจุดตรวจสอบแบบจำลองสิ่งนี้จะประเมินบิตทฤษฎี/พิกเซลย่อย (BPSP) ตามความน่าจะเป็นบันทึก logelihood bpsp ต่ำกว่าขอบเขตการบีบอัด BPSP จริง

 python3 -um src.eval 
  --path "path to directory of images" 
  --file "list of filenames of images, one filename per line" 
  --load "path to model weights"

การบีบอัด/การบีบอัด

ด้วยการติดตั้ง Torchac คุณสามารถเรียกใช้การบีบอัด/การบีบอัดเพื่อแปลงภาพใด ๆ เป็นไฟล์. SREC ต่อไปนี้บีบอัดไดเรกทอรีของภาพ

 python3 -um src.encode 
  --path "path to directory of images"  
  --file "list of filenames of images, one filename per line" 
  --save-path "directory to save new .srec files" 
  --load "path to model weights"

หากคุณต้องการรันไทม์ที่แม่นยำเราขอแนะนำให้ใช้ Python ด้วย -O Flag เพื่อปิดการใช้งานการยืนยัน นอกจากนี้เรายังรวมการตั้งค่าสถานะ --decode รหัสเสริมเพื่อให้คุณสามารถตรวจสอบว่าการบีบอัดไฟล์. SREC ให้ภาพต้นฉบับหรือไม่รวมถึงให้รันไทม์สำหรับการถอดรหัส

ในการแปลงไฟล์. SREC เป็น PNG คุณสามารถรันได้

 python3 -um src.decode 
  --path "path to directory of .srec images"  
  --file "list of filenames of .srec images, one filename per line" 
  --save-path "directory to save png files" 
  --load "path to model weights"

ดาวน์โหลด imageNet64

คุณสามารถดาวน์โหลดชุดการฝึกอบรมและการตรวจสอบความถูกต้องของ Imagenet64 ได้ที่นี่

การเตรียมชุดข้อมูล Open Images (PNG)

เราใช้ชุดการฝึกอบรมและการตรวจสอบภาพเดียวกันของภาพเปิดเป็น L3C

สำหรับ ภาพการตรวจสอบ คุณสามารถ ดาวน์โหลดได้ที่นี่

สำหรับ ภาพการฝึกอบรม โปรดโคลน L3C repo และเรียกใช้สคริปต์จากที่นี่

ดูปัญหานี้สำหรับความแตกต่างระหว่าง Open Images JPEG และ Open Images PNG

การรับทราบ

ขอบคุณ L3C สำหรับการใช้งานของ EDSR การผสมโลจิสติกและการเข้ารหัสทางคณิตศาสตร์ ขอขอบคุณเป็นพิเศษสำหรับ Fabian Mentzer ที่แจ้งให้เราทราบเกี่ยวกับปัญหาเกี่ยวกับสคริปต์การประมวลผลล่วงหน้าสำหรับภาพเปิด jpeg และแก้ไขพวกเขาอย่างรวดเร็ว

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท หลาม
เวลาอัปเดต 2025-07-15
ขนาด 41.66MB
มาจาก Github

แอปที่เกี่ยวข้อง

ToDo Co

2025-03-22
Python Portfolio

2024-11-10
datamule python

2024-11-08
เครื่องมือแผนภูมิข้อมูลโอเพ่นซอร์ส Redash v24.10.0

2024-11-27
แพลตฟอร์มการแสดงภาพข้อมูล smartchart เวอร์ชัน 6.9

2024-11-27
เครื่องมือทดสอบโหลดตั๊กแตน v2.32.0

2024-11-27

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ToDo Co

หลาม

1.0.0
Python Portfolio

หลาม
datamule python

หลาม
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด