ดาวน์โหลด PConv Keras - ดาวน์โหลดซอร์สโค้ด PConv Keras

PConv Keras

ซอร์สโค้ดอื่น ๆ

1.0.0

ดาวน์โหลด

convolutions บางส่วนสำหรับ Image inpainting โดยใช้ keras

การใช้งาน Keras ของ " Image Inpainting สำหรับหลุมที่ผิดปกติโดยใช้ convolutions บางส่วน ", https://arxiv.org/abs/1804.07723 เสียงตะโกนครั้งใหญ่ของผู้เขียน Guilin Liu, Fitsum A. Reda, Kevin J. Shih, Ting-Chun Wang, Andrew Tao และ Bryan Catanzaro จาก Nvidia Corporation เพื่อปล่อยกระดาษที่ยอดเยี่ยมนี้มันเป็นประสบการณ์การเรียนรู้ที่ยอดเยี่ยมสำหรับฉันที่จะนำสถาปัตยกรรมมาใช้ เลเยอร์ convolutional บางส่วนและฟังก์ชั่นการสูญเสีย

การพึ่งพาอาศัยกัน

Python 3.6
Keras 2.2.4
Tensorflow 1.12

วิธีใช้ที่เก็บนี้

วิธีที่ง่ายที่สุดในการลองทำนายสองสามอย่างกับอัลกอริทึมนี้คือไปที่ www.fixmyphoto.ai ซึ่งฉันได้ปรับใช้กับแอปพลิเคชัน React ที่ไม่มีเซิร์ฟเวอร์ด้วย AWS Lambda ฟังก์ชั่นการจัดการการอนุมาน

หากคุณต้องการขุดลงในรหัสการใช้งานหลักของเลเยอร์ PConv2D KERAS ใหม่รวมถึงสถาปัตยกรรมที่มีลักษณะเหมือน UNet โดยใช้เลเยอร์ convolutional บางส่วนเหล่านี้สามารถพบได้ใน libs/pconv_layer.py และ libs/pconv_model.py ตามลำดับ เป็นที่ที่พบการใช้งานจำนวนมาก นอกเหนือจากนี้ฉันได้ตั้งค่าสมุดบันทึก Jupyter สี่รายการซึ่งมีรายละเอียดหลายขั้นตอนที่ฉันทำในขณะที่ใช้เครือข่ายคือ:

ขั้นตอนที่ 1: การสร้างหน้ากากที่ผิดปกติแบบสุ่ม
ขั้นตอนที่ 2: การใช้งานและทดสอบการใช้งานของเลเยอร์ PConv2D
ขั้นตอนที่ 3: การใช้และทดสอบสถาปัตยกรรม UNET ด้วยเลเยอร์ PConv2D
ขั้นตอนที่ 4: การฝึกอบรมและทดสอบสถาปัตยกรรมขั้นสุดท้ายบน ImageNet
ขั้นตอนที่ 5: ความพยายามแบบง่าย ๆ ในการทำนายขนาดภาพโดยพลการผ่านการถ่ายภาพ

น้ำหนักที่ได้รับการฝึกอบรมล่วงหน้า

ฉันได้รับน้ำหนัก VGG16 จาก Pytorch ไปยัง Keras; ซึ่งหมายความว่า 1/255. การปรับขนาดพิกเซลสามารถใช้สำหรับเครือข่าย VGG16 เช่นเดียวกับ Pytorch

พอร์ต VGG 16 น้ำหนัก
PCONV บน Imagenet
PCONV on Places2 [ต้องการการฝึกอบรม]
PCONV บน celebahq [ต้องการการฝึกอบรม]

การฝึกอบรมในชุดข้อมูลของคุณเอง

คุณสามารถไปที่โน้ตบุ๊กขั้นตอนที่ 4 หรือใช้ CLI โดยตรง (ตรวจสอบให้แน่ใจว่าได้ดาวน์โหลดน้ำหนัก VGG16 ที่แปลงแล้ว):

 python main.py 
    --name MyDataset 
    --train TRAINING_PATH 
    --validation VALIDATION_PATH 
    --test TEST_PATH 
    --vgg_path './data/logs/pytorch_to_keras_vgg16.h5'

รายละเอียดการใช้งาน

รายละเอียดของการใช้งานอยู่ในกระดาษเอง แต่ฉันจะพยายามสรุปรายละเอียดบางอย่างที่นี่

การสร้างหน้ากาก

ในกระดาษพวกเขาใช้เทคนิคโดยใช้การบดเคี้ยว/การออกจากกันระหว่างสองเฟรมติดต่อกันในวิดีโอสำหรับการสร้างมาสก์ที่ผิดปกติแบบสุ่ม-แทนฉันเลือกที่จะสร้างฟังก์ชัน Generator หน้ากากอย่างง่ายซึ่งใช้ OpenCV เพื่อวาดรูปร่างที่ผิดปกติแบบสุ่ม จากนั้นฉันใช้สำหรับหน้ากาก การเสียบเทคนิคการสร้างหน้ากากใหม่ในภายหลังไม่ควรเป็นปัญหาและฉันคิดว่าผลลัพธ์สุดท้ายค่อนข้างดีในการใช้วิธีนี้เช่นกัน

เลเยอร์ convolution บางส่วน

องค์ประกอบสำคัญในการใช้งานนี้คือเลเยอร์ convolutional บางส่วน โดยพื้นฐานแล้วเนื่องจากตัวกรอง convolutional W และอคติที่สอดคล้องกัน B การ convolution บางส่วนต่อไปนี้จะถูกนำไปใช้แทนการ convolution ปกติ:

โดยที่⊙คือการคูณองค์ประกอบที่ชาญฉลาดและ m เป็นหน้ากากไบนารีของ 0s และ 1s ที่สำคัญหลังจากการประชุมบางส่วนบางส่วนหน้ากากจะได้รับการอัปเดตด้วยดังนั้นหากการแปลงสามารถปรับสภาพเอาต์พุตได้อย่างน้อยหนึ่งอินพุตที่ถูกต้องแล้วหน้ากากจะถูกลบออกในตำแหน่งนั้นเช่น

ผลที่ตามมาคือด้วยเครือข่ายที่ลึกพอสมควรหน้ากากจะเป็นคนทั้งหมด (เช่นหายไป)

สถาปัตยกรรม UNET

รายละเอียดเฉพาะของสถาปัตยกรรมสามารถพบได้ในกระดาษ แต่โดยพื้นฐานแล้วมันขึ้นอยู่กับโครงสร้างที่คล้ายกับ UNET ซึ่งชั้น convolutional ปกติทั้งหมดจะถูกแทนที่ด้วยเลเยอร์ convolutional บางส่วนเช่นในทุกกรณีภาพจะถูกส่งผ่านเครือข่ายข้างหน้ากาก . ต่อไปนี้ให้ภาพรวมของสถาปัตยกรรม

ฟังก์ชั่นการสูญเสีย

ฟังก์ชั่นการสูญเสียที่ใช้ในกระดาษนั้นค่อนข้างรุนแรงและสามารถตรวจสอบได้ในกระดาษ ในระยะสั้นรวมถึง:

การสูญเสียต่อพิกเซลทั้งสำหรับหน้ากากและภูมิภาคที่ไม่มีหน้ากาก
การสูญเสียการรับรู้ตาม Imagenet ที่ผ่านการฝึกอบรมล่วงหน้า VGG-16 ( Pool1, Pool2 และ Pool3 Layers )
การสูญเสียสไตล์บนคุณสมบัติ VGG-16 ทั้งสำหรับภาพที่คาดการณ์และสำหรับภาพที่คำนวณ
การสูญเสียการแปรผันทั้งหมดสำหรับการขยายพื้นที่ 1 พิกเซล

การถ่วงน้ำหนักของเงื่อนไขการสูญเสียทั้งหมดเหล่านี้มีดังนี้:

ขั้นตอนการฝึกอบรม

เครือข่ายได้รับการฝึกฝนเกี่ยวกับ Imagenet ที่มีขนาดแบทช์ 1 และแต่ละยุคถูกระบุว่ามีความยาว 10,000 แบตช์ การฝึกอบรมยังดำเนินการโดยใช้ Adam Optimizer ในสองขั้นตอนเนื่องจากการทำให้เป็นมาตรฐานแบบแบทช์แสดงปัญหาสำหรับการสวมหน้ากาก (เนื่องจากค่าเฉลี่ยและความแปรปรวนคำนวณสำหรับพิกเซลหลุม)

อัตราการเรียนรู้ ขั้นตอนที่ 1 ของ 0.0001 สำหรับ 50 Epochs ที่เปิดใช้งานแบทช์ปกติในทุกเลเยอร์

อัตราการเรียนรู้ ขั้นตอนที่ 2 ของ 0.00005 สำหรับ 50 Epochs ที่การทำให้เป็นมาตรฐานเป็นชุดในเลเยอร์การเข้ารหัสทั้งหมดถูกปิดใช้งาน

เวลาการฝึกซ้อมสำหรับภาพที่แสดงนั้นบ้าไปนานอย่างแน่นอน แต่นั่นอาจเป็นเพราะการตั้งค่าส่วนตัวที่ไม่ดีของฉัน การทดสอบไม่กี่ครั้งที่ฉันได้ลองใน 1080TI (ที่มีขนาดแบทช์ 4) บ่งชี้ว่าเวลาการฝึกอบรมอาจประมาณ 10 วันตามที่ระบุไว้ในกระดาษ

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-02-23
ขนาด 17.39MB
มาจาก Github

แอปที่เกี่ยวข้อง

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub the via/releases

2024-11-01

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

ซอร์สโค้ดอื่น ๆ

1.0.0
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

ซอร์สโค้ดอื่น ๆ

1.0.0

ข้อมูลที่เกี่ยวข้อง ทั้งหมด