Hugging Face ได้เปิดตัวโมเดลภาษาขนาดกะทัดรัด SmollM2 ซึ่งเป็นความก้าวหน้าที่น่าตื่นเต้น SmollM2 มีรุ่นพารามิเตอร์ขนาดพารามิเตอร์ที่แตกต่างกันสามรุ่นที่ให้ประสิทธิภาพที่ทรงพลังแม้ในอุปกรณ์ที่มีทรัพยากรที่ จำกัด ซึ่งมีความสำคัญอย่างยิ่งสำหรับการคำนวณขอบและแอพพลิเคชั่นอุปกรณ์มือถือ มันเก่งในการเปรียบเทียบหลายแบบเหนือกว่าโมเดลที่คล้ายกันแสดงให้เห็นถึงข้อดีในการให้เหตุผลทางวิทยาศาสตร์และงานสามัญสำนึก ใบอนุญาตโอเพ่นซอร์สและ Apache 2.0 ของ SmollM2 ยังช่วยให้เข้าถึงและใช้งานได้ง่ายขึ้น
Hugging Face วันนี้เปิดตัว SmollM2 ซึ่งเป็นชุดภาษาขนาดกะทัดรัดชุดใหม่ที่บรรลุประสิทธิภาพที่น่าประทับใจในขณะที่ต้องการทรัพยากรการคำนวณน้อยกว่ารุ่นใหญ่ รุ่นใหม่ได้รับการเผยแพร่ภายใต้ใบอนุญาต Apache 2.0 และมีสามขนาด - พารามิเตอร์ 135m, 360m และ 1.7b - เหมาะสำหรับการปรับใช้บนสมาร์ทโฟนและอุปกรณ์ขอบอื่น ๆ ที่มีกำลังการประมวลผลและหน่วยความจำ จำกัด

โมเดล SMOLLM2-1B มีประสิทธิภาพสูงกว่าโมเดล Meta LLAMA1B ในเกณฑ์มาตรฐานที่สำคัญหลายประการโดยเฉพาะอย่างยิ่งในการให้เหตุผลทางวิทยาศาสตร์และงานสามัญสำนึก โมเดลนี้มีประสิทธิภาพสูงกว่าแบบจำลองการแข่งขันขนาดใหญ่บนเกณฑ์มาตรฐานทางปัญญาส่วนใหญ่โดยใช้ชุดข้อมูลที่หลากหลายรวมถึง Fineweb-Edu และชุดข้อมูลทางคณิตศาสตร์และการเข้ารหัสพิเศษ
การเปิดตัว SmollM2 มาในช่วงเวลาที่สำคัญเมื่ออุตสาหกรรม AI กำลังดิ้นรนเพื่อรับมือกับการคำนวณจำเป็นต้องใช้แบบจำลองภาษาขนาดใหญ่ (LLMS) ในขณะที่ บริษัท เช่น OpenAI และมานุษยวิทยายังคงผลักดันขอบเขตของขนาดรุ่น แต่ก็มีการรับรู้ที่เพิ่มขึ้นของความจำเป็นสำหรับ AI ที่มีประสิทธิภาพและมีน้ำหนักเบาที่สามารถทำงานได้ในเครื่องบนอุปกรณ์

SmollM2 นำเสนอวิธีการที่แตกต่างในการนำความสามารถของ AI ที่ทรงพลังโดยตรงไปยังอุปกรณ์ส่วนบุคคลชี้ไปที่อนาคตที่ผู้ใช้และ บริษัท จำนวนมากสามารถใช้เครื่องมือ AI ขั้นสูงไม่ใช่แค่ยักษ์ใหญ่ด้านเทคโนโลยีที่มีศูนย์ข้อมูลขนาดใหญ่ โมเดลเหล่านี้รองรับแอปพลิเคชันที่หลากหลายรวมถึงการเขียนข้อความสรุปและการเรียกใช้ฟังก์ชันที่เหมาะสำหรับการปรับใช้ในสถานการณ์ที่ความเป็นส่วนตัวเวลาแฝงหรือการ จำกัด การเชื่อมต่อทำให้โซลูชั่น AI บนคลาวด์ไม่สามารถทำได้
ในขณะที่โมเดลขนาดเล็กเหล่านี้ยังคงมีข้อ จำกัด แต่ก็เป็นส่วนหนึ่งของแนวโน้มที่กว้างในโมเดล AI ที่มีประสิทธิภาพมากขึ้น การเปิดตัว SmollM2 แสดงให้เห็นว่าอนาคตของปัญญาประดิษฐ์อาจไม่เพียง แต่เป็นของโมเดลขนาดใหญ่เท่านั้น แต่ยังมีสถาปัตยกรรมที่มีประสิทธิภาพมากขึ้น
การเกิดขึ้นของ SmollM2 ได้เปิดโอกาสใหม่สำหรับแอพพลิเคชั่น AI ที่มีน้ำหนักเบาซึ่งบ่งชี้ว่าเทคโนโลยี AI จะถูกนำมาใช้อย่างกว้างขวางมากขึ้นในอุปกรณ์และสถานการณ์ต่าง ๆ ทำให้ผู้ใช้มีประสบการณ์ที่สะดวกและมีประสิทธิภาพมากขึ้น คุณสมบัติโอเพ่นซอร์สได้ส่งเสริมการพัฒนาและนวัตกรรมเพิ่มเติมของชุมชน AI ในอนาคตเราคาดว่าจะเห็นโมเดล AI ที่มีประสิทธิภาพมากขึ้นและมีขนาดกะทัดรัดมากขึ้นเพื่อส่งเสริมความนิยมและความก้าวหน้าของเทคโนโลยี AI