ในวันที่สามของ "โอเพนซอร์สสัปดาห์" บริษัท ปัญญาประดิษฐ์จีน Deepseek ประกาศห้องสมุดโอเพนซอร์สชื่อ DeepGemm ซึ่งรองรับ FP8 Universal Matrix Multiplication (GEMM) ออกแบบมาสำหรับการดำเนินงานเมทริกซ์ผู้เชี่ยวชาญอย่างเข้มข้นและไฮบริด (MOE) เครื่องมือนี้ได้รับการออกแบบมาเพื่อให้การสนับสนุนที่แข็งแกร่งสำหรับการฝึกอบรมและการอนุมานสำหรับรุ่น Deepseek V3 และ R1 หลังจากข่าวอย่างเป็นทางการได้รับการปล่อยตัวผ่านแพลตฟอร์ม X มันกระตุ้นความสนใจอย่างกว้างขวางและการอภิปรายอย่างรุนแรงจากชุมชนเทคโนโลยี

ตามโพสต์ที่เผยแพร่โดยบัญชีอย่างเป็นทางการของ Deepseek DeepGemm สามารถบรรลุประสิทธิภาพการคำนวณ FP8 ได้สูงถึง 1,350+ TFLOPS บน Nvidia Hopper GPU แม้ว่าตรรกะหลักของมันจะมีรหัสเพียงประมาณ 300 บรรทัด แต่ห้องสมุดยังทำงานได้เกินกว่าเมล็ดที่ปรับแต่งอย่างเชี่ยวชาญในขนาดเมทริกซ์ส่วนใหญ่แสดงประสิทธิภาพและความเรียบง่ายสูงมาก DeepGemm ไม่ต้องการการพึ่งพาที่ซับซ้อนและใช้เทคโนโลยีที่ทันเวลารองรับเค้าโครงที่เข้มข้นและเลย์เอาต์ MOE สองแบบ มันถูกออกแบบมาให้เป็น "สะอาดเหมือนการสอน" และเป็นเรื่องง่ายสำหรับนักพัฒนาที่จะเรียนรู้และใช้งาน
X ผู้ใช้ @TechBitDaily แสดงความคิดเห็น: "การเปิดตัว DeepGemm เป็นไฮไลต์ของสัปดาห์โอเพ่นซอร์สของ Deepseek ด้วยประสิทธิภาพ FP8 ที่น่าประทับใจและการออกแบบที่เรียบง่าย" ผู้ใช้อีกคน @aiobservercn ชี้ให้เห็นว่าห้องสมุดมีข้อได้เปรียบที่สำคัญในการสนับสนุนการฝึกอบรมที่มีประสิทธิภาพของโมเดล MOE และอาจส่งเสริมนวัตกรรมเพิ่มเติมในชุมชน AI ในสถาปัตยกรรมกระโดด
ในฐานะส่วนหนึ่งของสัปดาห์โอเพ่นซอร์สการเปิดตัว DeepGemm ยังคงมุ่งมั่นที่จะส่งเสริมความโปร่งใสในเทคโนโลยี AI และการทำงานร่วมกันของชุมชน ก่อนหน้านี้ บริษัท ได้เปิดตัว FlashMLA และ Deepep Tools สองวันก่อนสัปดาห์โอเพ่นซอร์สโดยมุ่งเน้นไปที่สถาปัตยกรรมรูปแบบภาษาที่รวดเร็วและการสื่อสารแบบขนานของผู้เชี่ยวชาญตามลำดับ การเปิดตัวของ DeepGemm แสดงให้เห็นถึงความแข็งแกร่งทางเทคนิคของ Deepseek ในการก่อสร้างโครงสร้างพื้นฐาน AI คนวงในอุตสาหกรรมเชื่อว่าห้องสมุดนี้จะไม่เพียง แต่ปรับปรุงประสิทธิภาพของโมเดลของ Deepseek เท่านั้น แต่ยังช่วยให้นักพัฒนาทั่วโลกมีเครื่องมือคอมพิวเตอร์เมทริกซ์ที่มีประสิทธิภาพและใช้งานง่ายพร้อมกับแอปพลิเคชันในอนาคต ขณะนี้ผู้ใช้สามารถรับ DeepGemm ผ่าน GitHub เพื่อสำรวจศักยภาพในการฝึกอบรม AI และการใช้เหตุผล
ที่อยู่โครงการ: https://github.com/deepseek-ai/deepgemm