โมเดลการให้เหตุผลปัญหาโอเพ่นซอร์สของทีม AI นานาชาติของ Alibaba International AI Marco-o1

ผู้เขียน：Eve Cole เวลาอัปเดต：2025-02-14 14:36:01

โมเดลการอนุมาน Marco-o1 ที่ทีมงาน AI นานาชาติของอาลีบาบาเปิดตัวเมื่อเร็วๆ นี้ มุ่งเน้นไปที่การแก้ปัญหาปลายเปิด ทำลายข้อจำกัดของโมเดลแบบดั้งเดิมที่จำกัดอยู่เฉพาะในช่องคำตอบมาตรฐาน และแสดงให้เห็นถึงศักยภาพในการจัดการงานที่ซับซ้อนและยากต่อการหาปริมาณ . เครื่องมือแก้ไข Downcodes จะทำให้คุณมีความเข้าใจเชิงลึกเกี่ยวกับคุณลักษณะ การใช้งาน และการใช้งานโมเดลนี้ รวมถึงนวัตกรรมที่นำมาสู่สาขาปัญญาประดิษฐ์

เมื่อเร็วๆ นี้ ทีม AI นานาชาติของอาลีบาบาได้เปิดตัวโมเดลการให้เหตุผลใหม่ที่เรียกว่า Marco-o1 ซึ่งให้ความสนใจเป็นพิเศษกับการแก้ปัญหาแบบเปิด และไม่จำกัดเฉพาะสาขาวิชาที่มีคำตอบมาตรฐาน เช่น การเขียนโปรแกรมและคณิตศาสตร์ ทีมวิจัยมุ่งมั่นที่จะสำรวจว่าแบบจำลองดังกล่าวสามารถสรุปได้อย่างมีประสิทธิภาพในพื้นที่ที่ยากต่อการหาปริมาณและขาดผลตอบแทนที่ชัดเจนหรือไม่

คุณลักษณะของโมเดล Marco-o1 ได้แก่ การใช้ข้อมูล CoT ที่ยาวเป็นพิเศษสำหรับการปรับแต่งอย่างละเอียด การใช้ MCTS เพื่อขยายพื้นที่โซลูชัน และการขยายพื้นที่โซลูชันแบบละเอียด โมเดลนี้ใช้การเล่นด้วยตนเอง+MCTS เพื่อสร้างชุดข้อมูล CoT ที่ยาวเป็นพิเศษพร้อมความสามารถในการสะท้อนและแก้ไข และได้รับการฝึกร่วมกับข้อมูลโอเพ่นซอร์สอื่นๆ นอกจากนี้ ทีมวิจัยยังกำหนดขั้นตอนย่อยเพื่อขยายพื้นที่โซลูชันของแบบจำลองเพิ่มเติม และชี้แนะแบบจำลองเพื่อให้ได้คำตอบที่ดีขึ้น

ในงานแปล แบบจำลอง Marco-o1 แสดงให้เห็นถึงความสามารถในการจัดการการแปลประโยคที่ยาวและยาก นี่เป็นครั้งแรกที่มีการนำการขยายเวลาการอนุมานไปใช้กับงานการแปลด้วยเครื่อง ทีมวิจัยได้โอเพ่นซอร์สข้อมูล CoT บางส่วนและแบบจำลองปัจจุบันที่ดีที่สุด และวางแผนที่จะเปิดข้อมูลและแบบจำลองเพิ่มเติมในอนาคต

แบบจำลองจะคิดอย่างลึกซึ้งเกี่ยวกับการตอบสนองเมื่อให้เหตุผล เช่น เมื่อส่งออกตัวเลข 'r's ในคำว่า 'strawberry' แบบจำลองจะค่อยๆ แยกตัวอักษรแต่ละตัวในคำนั้นออกแล้วเปรียบเทียบ และผลลัพธ์ที่ได้ก็ถูกต้องในที่สุด ในด้านการแปลด้วยเครื่อง แบบจำลองจะระบุจุดที่ยากได้อย่างถูกต้องผ่านลิงก์อนุมาน และแปลทีละคำ ซึ่งช่วยเพิ่มความแม่นยำในการแปลโดยรวม

ทีมวิจัยยังได้ทดลองในสาขาอื่นๆ อีกด้วย ซึ่งพิสูจน์ให้เห็นถึงความสามารถของแบบจำลองในการแก้ปัญหาทั่วไปอื่นๆ ในโลกแห่งความเป็นจริง โครงสร้างโดยรวมของ Marco-o1 ใช้การเล่นด้วยตนเอง+MCTS เพื่อสร้างชุดข้อมูล CoT ที่ยาวเป็นพิเศษพร้อมความสามารถในการสะท้อนและแก้ไข และฝึกร่วมกับข้อมูลโอเพ่นซอร์สอื่นๆ ทีมวิจัยยังได้รวมชุดข้อมูลการปฏิบัติตามคำสั่งบางอย่างจากตระกูล MarcoPolo เพื่อปรับปรุงความสามารถในการปฏิบัติตามคำสั่งของโมเดล

ในแง่ของการใช้งาน ทีมวิจัยจะจัดเตรียมโค้ดการอนุมานและโค้ดการปรับแต่ง ผู้ใช้สามารถโหลดโมเดลและโทเค็นไนเซอร์ และเริ่มแชทหรือปรับแต่งโมเดลได้อย่างง่ายดาย นอกจากนี้ โมเดลยังสามารถรันได้โดยตรงบนเวอร์ชัน GGUF บน ModelScope ซึ่งช่วยให้สัมผัสประสบการณ์ได้รวดเร็วยิ่งขึ้น

การเปิดตัวโมเดล Marco-o1 ถือเป็นก้าวสำคัญที่ทีม AI นานาชาติของอาลีบาบาดำเนินการในด้านโมเดลการอนุมาน โดยให้แนวคิดและเครื่องมือใหม่ๆ ในการแก้ปัญหาแบบเปิด

ขอบเขตโมเดล:

https://modelscope.cn/models/AIDC-AI/Marco-o1

อาร์ซิฟ:

https://arxiv.org/abs/2411.14405

Github:

https://github.com/AIDC-AI/Marco-o1

กอดใบหน้า:

https://huggingface.co/AIDC-AI/Marco-o1

โอเพ่นซอร์สของโมเดล Marco-o1 มอบทรัพยากรอันมีค่าสำหรับนักวิจัยและนักพัฒนา เชื่อกันว่าแอปพลิเคชั่นที่เป็นนวัตกรรมใหม่ ๆ ที่ใช้โมเดลนี้จะเกิดขึ้นในอนาคต เพื่อส่งเสริมการพัฒนาเทคโนโลยีปัญญาประดิษฐ์อย่างต่อเนื่อง รอคอยที่จะมีกรณีการใช้งานเพิ่มเติมและผลการวิจัยเกี่ยวกับ Marco-o1!