repo นี้มีบทเรียนที่ครอบคลุมการจำแนกรูปภาพโดยใช้ Pytorch 1.7, Torchvision 0.8, Matplotlib 3.3 และ Scikit-Learn 0.24 พร้อม Python 3.8
เราจะเริ่มต้นด้วยการใช้ Multilayer Perceptron (MLP) จากนั้นย้ายไปยังสถาปัตยกรรมโดยใช้เครือข่ายประสาท (CNNS) โดยเฉพาะเราจะใช้ Lenet, Alexnet, VGG และ Resnet
หากคุณพบข้อผิดพลาดหรือไม่เห็นด้วยกับคำอธิบายใด ๆ โปรดอย่าลังเลที่จะส่งปัญหา ฉันยินดีรับข้อเสนอแนะบวกหรือลบ!
ในการติดตั้ง pytorch ดูคำแนะนำการติดตั้งบนเว็บไซต์ Pytorch
คำแนะนำในการติดตั้ง pytorch ควรให้รายละเอียดเกี่ยวกับวิธีการติดตั้ง torchvision แต่ยังสามารถติดตั้งได้ผ่าน:
pip install torchvision1 - Multilayer Perceptron
บทช่วยสอนนี้ให้คำแนะนำเกี่ยวกับ Pytorch และ Torchvision เราจะได้เรียนรู้วิธีการ: โหลดชุดข้อมูล, ข้อมูลเพิ่ม, กำหนด multilayer perceptron (MLP), ฝึกอบรมแบบจำลอง, ดูผลลัพธ์ของโมเดลของเรา, เห็นภาพการเป็นตัวแทนของโมเดลและดูน้ำหนักของโมเดล การทดลองจะดำเนินการในชุดข้อมูล MNIST - ชุดตัวเลขสีเทาที่เขียนด้วยลายมือ 28x28
2 - Lenet
ในบทช่วยสอนนี้เราจะใช้สถาปัตยกรรม Lenet คลาสสิก เราจะตรวจสอบเครือข่ายประสาทแบบ convolutional และเลเยอร์และการรวมกลุ่ม (AKA Pooling) อย่างไร
3 - Alexnet
ในบทช่วยสอนนี้เราจะใช้ Alexnet สถาปัตยกรรมเครือข่ายประสาท Convolutional ที่ช่วยเริ่มต้นความสนใจในการเรียนรู้อย่างลึกซึ้งในปัจจุบัน เราจะย้ายไปยังชุดข้อมูล CIFAR10 - ภาพสี 32x32 ในสิบคลาส เราแสดง: วิธีการกำหนดสถาปัตยกรรมโดยใช้ nn.Sequential วิธีเริ่มต้นพารามิเตอร์ของเครือข่ายประสาทของคุณและวิธีการใช้ตัวค้นหาอัตราการเรียนรู้เพื่อกำหนดอัตราการเรียนรู้เริ่มต้นที่ดี
4 - VGG
บทช่วยสอนนี้จะครอบคลุมการใช้โมเดล VGG อย่างไรก็ตามแทนที่จะฝึกอบรมแบบจำลองตั้งแต่เริ่มต้นเราจะโหลดโมเดล VGG ที่ผ่านการฝึกอบรมไว้ล่วงหน้าบนชุดข้อมูล Imagenet และแสดงวิธีการถ่ายโอนการเรียนรู้เพื่อปรับน้ำหนักให้เข้ากับชุดข้อมูล CIFAR10 โดยใช้เทคนิคที่เรียกว่าการปรับแต่งการเลือกปฏิบัติ นอกจากนี้เรายังอธิบายว่าเลเยอร์การรวมตัวที่ปรับตัวได้อย่างไรและการทำให้เป็นมาตรฐานเป็นชุด
5 - resnet
ในบทช่วยสอนนี้เราจะใช้โมเดล RESNET เราจะแสดงวิธีการโหลดชุดข้อมูลของคุณเองโดยใช้ชุดข้อมูล CUB200 เป็นตัวอย่างและวิธีการใช้ตารางอัตราการเรียนรู้ซึ่งเปลี่ยนอัตราการเรียนรู้ของแบบจำลองของคุณแบบไดนามิกในขณะที่การฝึกอบรม โดยเฉพาะอย่างยิ่งเราจะใช้นโยบายวงจรหนึ่งที่แนะนำในบทความนี้และตอนนี้เริ่มที่จะใช้สำหรับการฝึกอบรมแบบจำลองการมองเห็นคอมพิวเตอร์
นี่คือบางสิ่งที่ฉันดูในขณะที่ทำแบบฝึกหัดเหล่านี้ บางส่วนอาจล้าสมัย