การเริ่มต้นของปัญญาประดิษฐ์ Luma เพิ่งเปิดตัวเทคโนโลยีการฝึกอบรมภาพโอเพนซอร์สที่เรียกว่าการจับคู่ช่วงเวลาอุปถัมภ์ (IMM) บนแพลตฟอร์ม X เทคโนโลยีนี้ได้รับความสนใจอย่างกว้างขวางในด้านการกำเนิดของ AI เพื่อประสิทธิภาพและความมั่นคงและถือเป็นความก้าวหน้าครั้งสำคัญในสาขานี้
ตาม X ผู้ใช้ LINQI_ZHOU IMM เป็นกระบวนทัศน์รุ่นใหม่ที่สามารถฝึกอบรมได้อย่างมั่นคงตั้งแต่เริ่มต้นผ่านรุ่นเดียวและเป้าหมายเดียว เมื่อเทียบกับวิธีการดั้งเดิม IMMS ทำงานได้ดีขึ้นในการสุ่มตัวอย่างประสิทธิภาพและคุณภาพตัวอย่าง เขากล่าวถึงในโพสต์: "IMM ประสบความสำเร็จ 1.99fid ในเพียง 8 ขั้นตอนในชุดข้อมูล ImageNet256 × 256 และ 1.98Fid ในเพียง 2 ขั้นตอนใน CIFAR-10" ความสำเร็จนี้ไม่เพียง แต่ฟื้นฟูมาตรฐานอุตสาหกรรม แต่ยังแสดงให้เห็นถึงศักยภาพที่ยิ่งใหญ่ของ IMM ในด้านการสร้างภาพ
เมื่อเทียบกับแบบจำลองการแพร่กระจายกระแสหลักในปัจจุบัน IMM ได้เพิ่มประสิทธิภาพการสุ่มตัวอย่างมากกว่า 10 เท่าในขณะที่รักษาคุณภาพตัวอย่างที่สูงขึ้น X ผู้ใช้ OP7418 อธิบายเพิ่มเติมหลักการทางเทคนิคของ IMM: แบบจำลองการแพร่กระจายแบบดั้งเดิมนั้นมีประสิทธิภาพน้อยกว่าเนื่องจากข้อ จำกัด ของการแก้ไขเชิงเส้นและการบรรจบกันหลายขั้นตอนในขณะที่ IMM ปรับปรุงความยืดหยุ่นอย่างมีนัยสำคัญโดยการประมวลผลขั้นตอนเวลาปัจจุบันและขั้นตอนเวลาเป้าหมายในระหว่างกระบวนการอนุมาน การออกแบบ“ การใช้เหตุผลครั้งแรก” นี้ช่วยให้แบบจำลองสามารถสร้างภาพที่มีคุณภาพสูงในขั้นตอนที่น้อยลงดังนั้นจึงผ่านคอขวดอัลกอริทึมของโมเดลการแพร่กระจาย
นอกจากนี้ IMM ยังดีกว่าแบบจำลองที่สอดคล้องกันในแง่ของความมั่นคงในการฝึกอบรม OP7418 ชี้ให้เห็นว่าแบบจำลองความสอดคล้องมีแนวโน้มที่จะมีการเปลี่ยนแปลงที่ไม่แน่นอนในระหว่างการฝึกอบรมในขณะที่ IMMs แสดงความแข็งแกร่งที่แข็งแกร่งและสามารถปรับให้เข้ากับพารามิเตอร์ไฮเปอร์พารามิเตอร์ที่หลากหลายและสถาปัตยกรรมแบบจำลอง คุณสมบัตินี้ทำให้ IMM มีความน่าเชื่อถือมากขึ้นในการใช้งานจริง
โครงการ IMM โอเพ่นซอร์สของ Luma ได้รับการยกย่องอย่างสูงจากชุมชน x ผู้ใช้ FinanceYF5 แสดงความคิดเห็น: "เทคโนโลยี IMM ของ Luma Labs ได้ปรับปรุงประสิทธิภาพการสร้างภาพ 10 เท่าเมื่อเทียบกับวิธีการที่มีอยู่ประสบความสำเร็จในการฝ่าคอขวดอัลกอริทึมของแบบจำลองการแพร่กระจาย!" นอกจากนี้เขายังแนบลิงค์ไปสู่การแนะนำเทคโนโลยีที่เกี่ยวข้องซึ่งก่อให้เกิดการอภิปรายเพิ่มเติมระหว่างผู้ใช้ รหัสและจุดตรวจของ IMM ได้รับการเผยแพร่ผ่าน GitHub และรายละเอียดทางเทคนิคได้รับการอธิบายอย่างละเอียดในเอกสารที่เกี่ยวข้องสะท้อนความมุ่งมั่นของ Luma อย่างเต็มที่เพื่อส่งเสริมการเปิดกว้างของการวิจัย AI
ข้อมูลประสิทธิภาพของ IMM พิสูจน์ให้เห็นถึงตำแหน่งผู้นำ ในชุดข้อมูล ImageNet256 × 256 IMM เหนือกว่ารูปแบบการแพร่กระจาย (2.27FID) และการจับคู่การไหล (2.15FID) ด้วย 1.99FID และขั้นตอนการสุ่มตัวอย่างลดลง 30 ครั้ง ในชุดข้อมูล CIFAR-10 IMM ได้รับ 1.98FID ในการสุ่มตัวอย่างเพียง 2 ขั้นตอนโดยตั้งค่าระเบียนที่ดีที่สุดสำหรับชุดข้อมูลนี้ OP7418 ยังกล่าวอีกว่า IMM มีความสามารถในการคำนวณที่ยอดเยี่ยม ด้วยการเพิ่มขึ้นของการฝึกอบรมและการประมวลผลการอนุมานประสิทธิภาพยังคงปรับปรุงอย่างต่อเนื่องวางรากฐานสำหรับแอพพลิเคชั่นขนาดใหญ่ในอนาคต
เป็นที่เชื่อกันอย่างกว้างขวางในอุตสาหกรรมว่าแหล่งโอเพ่นซอร์สของ IMMS อาจทำให้เกิดการเปลี่ยนกระบวนทัศน์ในเทคโนโลยีการสร้างภาพ ด้วยคุณสมบัติที่มีประสิทธิภาพคุณภาพสูงและมีเสถียรภาพ IMM ไม่เพียง แต่เหมาะสำหรับการสร้างภาพเท่านั้น ทีมงานของ Luma กล่าวว่า IMM เป็นเพียงก้าวแรกสู่โมเดลพื้นฐานหลายรูปแบบและพวกเขาหวังว่าจะปลดล็อคความเป็นไปได้ที่สร้างสรรค์มากขึ้นผ่านเทคโนโลยีนี้
ด้วยการเปิดตัว IMM ตำแหน่งของ Luma ในการแข่งขัน AI ทั่วโลกได้กลายเป็นที่โดดเด่นมากขึ้นเรื่อย ๆ โอกาสที่แอปพลิเคชันที่แพร่หลายของเทคโนโลยีนี้และผลกระทบที่ก่อกวนต่อโมเดลที่มีอยู่คาดว่าจะยังคงจุดประกายการอภิปรายที่ร้อนแรงในอีกไม่กี่เดือนข้างหน้า