Kunlun Wanwei ร่วมมือกับ Nanyang Technological University ในสิงคโปร์ และประสบความสำเร็จในการพัฒนาอัลกอริทึมที่เรียกว่า Q* ซึ่งสามารถปรับปรุงความสามารถในการให้เหตุผลของโมเดลขนาดใหญ่ที่มีอยู่ได้อย่างมีนัยสำคัญ การพัฒนาที่ก้าวล้ำนี้ช่วยให้โมเดลขนาดเล็กสามารถเข้าถึงหรือเหนือกว่าความสามารถในการให้เหตุผลของโมเดลที่มีพารามิเตอร์ที่ใหญ่กว่าหลายสิบหรือหลายร้อยเท่า ในขณะเดียวกันก็ลดความต้องการทรัพยากรการประมวลผลลงอย่างมาก การเกิดขึ้นของอัลกอริธึม Q* ได้เปิดบทใหม่สำหรับการประยุกต์ใช้ปัญญาประดิษฐ์อย่างกว้างขวาง ถือเป็นการประกาศการมาถึงของยุคใหม่ของปัญญาประดิษฐ์ที่มีประสิทธิภาพ ผลการวิจัยนี้ได้รับการตีพิมพ์ในรายงานเรื่อง "Q*: Improving Multi-step Reasoning for LLMs with Deliberative Planning" และให้คำอธิบายทางเทคนิคโดยละเอียด

นักวิจัยได้ปรับปรุงประสิทธิภาพของโมเดลโอเพ่นซอร์สในงานอนุมานอย่างชาญฉลาด โดยการแยกย่อยวิถีการอนุมานของโมเดลภาษาขนาดใหญ่ออกเป็นหลายสถานะ และใช้อัลกอริธึมการค้นหา A* เพื่อให้บรรลุการวางแผนโดยรวม ด้วยการกำหนดฟังก์ชันต้นทุนเส้นทางและฟังก์ชันรางวัลสะสม ทำให้การพิจารณาผลตอบแทนของสถานะในอดีตและผลตอบแทนที่คาดหวังในอนาคตอย่างครอบคลุม และปรับปรุงความแม่นยำอย่างมีนัยสำคัญในการทดลอง ซึ่งเหนือกว่าโมเดลที่รู้จักกันดีบางรุ่น ปัจจุบัน การวิจัยเกี่ยวกับ Q* ยังอยู่ในช่วงเริ่มต้น แต่มีศักยภาพสูงมาก ในอนาคต การวิจัยดังกล่าวคาดว่าจะปรับปรุงความสามารถในการให้เหตุผลของโมเดลโอเพ่นซอร์สในประเทศ และมีส่วนช่วยในการพัฒนาเทคโนโลยีปัญญาประดิษฐ์มากขึ้น
โดยเฉพาะอย่างยิ่ง Q* ปรับกระบวนการให้เหตุผลให้เหมาะสมโดยการพิจารณาผลตอบแทนของสถานะในอดีตและผลตอบแทนที่คาดหวังในอนาคตอย่างครอบคลุม ผลการทดลองแสดงให้เห็นว่า Q* ได้รับการปรับปรุงประสิทธิภาพอย่างมีนัยสำคัญในชุดข้อมูลหลายชุด ซึ่งเป็นแนวทางใหม่สำหรับความก้าวหน้าของเทคโนโลยีปัญญาประดิษฐ์
ปัจจุบัน การวิจัยเกี่ยวกับ Q* ยังอยู่ในช่วงเริ่มต้นและยังมีช่องว่างสำหรับการปรับปรุง ในอนาคต Kunlun Wanwei จะดำเนินการวิจัยเชิงลึกต่อไป เพื่อปรับปรุงความสามารถในการให้เหตุผลของโมเดลโอเพ่นซอร์สในประเทศ และนำความเป็นไปได้มาสู่การพัฒนาเทคโนโลยีปัญญาประดิษฐ์มากขึ้น
ลิงค์กระดาษ:
https://arxiv.org/abs/2406.14283
การพัฒนาอัลกอริธึม Q* ที่ประสบความสำเร็จถือเป็นความก้าวหน้าที่สำคัญในด้านปัญญาประดิษฐ์ และชี้ให้เห็นทิศทางสำหรับการพัฒนาเทคโนโลยีปัญญาประดิษฐ์ในอนาคต เป็นสิ่งที่ควรค่าแก่การรอคอยการใช้งานและความก้าวหน้าในสาขาอื่นๆ มากขึ้น