IBM เพิ่งเปิดตัวโมเดลภาษา Granite3.2 ล่าสุดที่ออกแบบมาเพื่อให้องค์กรและชุมชนโอเพนซอร์สด้วยโซลูชัน AI องค์กรขนาดเล็กมีประสิทธิภาพและใช้งานได้จริง” รุ่นนี้ไม่เพียง แต่มีความสามารถในการใช้เหตุผลหลายรูปแบบและการใช้เหตุผล แต่ยังช่วยเพิ่มความยืดหยุ่นและความคุ้มค่าทำให้ผู้ใช้สามารถนำมาใช้ได้ง่ายขึ้น การเปิดตัว Granite3.2 เป็นจุดเริ่มต้นใหม่ในสาขาปัญญาประดิษฐ์ของไอบีเอ็มโดยเฉพาะอย่างยิ่งในการปฏิบัติจริงและประสิทธิภาพในการใช้งานระดับองค์กร
Granite3.2 แนะนำรูปแบบภาษาภาพ (VLM) สำหรับการประมวลผลเอกสารดำเนินการจำแนกข้อมูลและการแยกข้อมูล ไอบีเอ็มอ้างว่ารุ่นใหม่นี้มีประสิทธิภาพเข้าถึงหรือเกินกว่ารุ่นที่ใหญ่กว่าในเกณฑ์มาตรฐานที่สำคัญบางอย่างเช่น LLAMA3.211B และ PIXTRAL12B นอกจากนี้โมเดล 8B ของ Granite3.2 ยังแสดงให้เห็นถึงความสามารถในการจับคู่หรือเหนือกว่าโมเดลขนาดใหญ่ในมาตรฐานการใช้เหตุผลทางคณิตศาสตร์มาตรฐาน การพัฒนานี้ทำให้หินแกรนิต 3.2 มีประสิทธิภาพมากขึ้นเมื่อจัดการงานที่ซับซ้อนในขณะที่ลดการใช้ทรัพยากร
เพื่อปรับปรุงความสามารถในการใช้เหตุผลบางรูปแบบของ Granite3.2 ยังมีฟังก์ชั่น "Think Chain" ซึ่งสามารถชี้แจงขั้นตอนการใช้เหตุผลระดับกลางได้ แม้ว่าคุณสมบัตินี้จะต้องใช้กำลังคอมพิวเตอร์จำนวนมาก แต่ผู้ใช้สามารถเปิดใช้งานหรือปิดการใช้งานได้ตลอดเวลาตามต้องการเพื่อเพิ่มประสิทธิภาพและลดต้นทุนโดยรวม Sriram Raghavan รองประธานฝ่ายวิจัยของ IBM AI กล่าวในงานแถลงข่าวว่าการมุ่งเน้นของปัญญาประดิษฐ์ยุคต่อไปคือประสิทธิภาพการรวมและผลกระทบในทางปฏิบัติทำให้องค์กรต่างๆสามารถบรรลุผลลัพธ์ที่แข็งแกร่งโดยไม่ต้องใช้จ่ายมากเกินไป การแนะนำคุณลักษณะนี้ทำให้หินแกรนิต 3.2 มีความโปร่งใสและตีความได้มากขึ้นเมื่อต้องรับมือกับงานการอนุมานที่ซับซ้อน
นอกเหนือจากการปรับปรุงความสามารถในการใช้เหตุผลแล้ว Granite3.2 ยังเปิดตัวโมเดลความปลอดภัย "Granite Guardian" รุ่นจิ๋ว แม้ว่าปริมาณจะลดลง 30%แต่ประสิทธิภาพของมันยังคงอยู่ในระดับของรุ่นรุ่นก่อนหน้า นอกจากนี้ IBM ได้แนะนำความสามารถที่เรียกว่า "ความเชื่อมั่นทางวาจา" ซึ่งช่วยให้สามารถประเมินรายละเอียดเพิ่มเติมเกี่ยวกับความเสี่ยงและพิจารณาความไม่แน่นอนในการตรวจสอบความปลอดภัย นวัตกรรมนี้ทำให้ Granite3.2 มีความน่าเชื่อถือมากขึ้นในแง่ของความปลอดภัยในขณะที่ลดการใช้ทรัพยากร
GRANITE3.2 ได้รับการฝึกฝนเกี่ยวกับชุดเครื่องมือ DOCLING โอเพนซอร์สของ IBM ซึ่งช่วยให้นักพัฒนาสามารถแปลงเอกสารเป็นข้อมูลเฉพาะที่จำเป็นสำหรับโมเดล AI องค์กรที่กำหนดเอง ในระหว่างกระบวนการฝึกอบรมแบบจำลองไฟล์ PDF 85 ล้านไฟล์และคู่ถามและคำตอบสังเคราะห์ 26 ล้านคู่ได้รับการประมวลผลเพื่อเพิ่มความสามารถของ VLM ในการจัดการเวิร์กโฟลว์เอกสารที่ซับซ้อน กระบวนการฝึกอบรมนี้ทำให้ Granite3.2 มีประสิทธิภาพและแม่นยำยิ่งขึ้นเมื่อประมวลผลเอกสารจำนวนมาก
ไอบีเอ็มยังประกาศรุ่นต่อไปของโมเดล TinyTimemixers (TTM) รุ่นต่อไปซึ่งเป็นแบบจำลองที่ได้รับการฝึกฝนมาก่อนที่มีขนาดกะทัดรัดโดยมุ่งเน้นไปที่การทำนายอนุกรมเวลาหลายตัวแปรที่มีความสามารถในการทำนายระยะยาวถึงสองปี การเปิดตัวรุ่นนี้จะขยายขอบเขตแอปพลิเคชันของ IBM ในด้านการวิเคราะห์อนุกรมเวลาและให้เครื่องมือการทำนายที่แม่นยำยิ่งขึ้น
บล็อกอย่างเป็นทางการ: https://www.ibm.com/new/announcements/ibm-granite-3-2-open-source-reasoninging-and-vision
ประเด็นสำคัญ:
Granite3.2 แนะนำรูปแบบภาษาภาพเพื่อปรับปรุงการประมวลผลเอกสารและความสามารถในการแยกข้อมูล
โมเดลใหม่มีฟังก์ชั่นของห่วงโซ่การคิดซึ่งสามารถชี้แจงกระบวนการให้เหตุผลและเพิ่มความสามารถในการใช้เหตุผล
รูปแบบความปลอดภัยของ Granit Guardian นั้นมีขนาดเล็กกว่า 30% แต่ประสิทธิภาพของมันไม่ได้รับผลกระทบและยังแนะนำฟังก์ชั่นการประเมินความเสี่ยงที่สามารถใช้ความมั่นใจได้ด้วยวาจา