Meta กำลังพัฒนาโมเดลภาษา Llama ขนาดใหญ่อย่างจริงจัง และมุ่งมั่นที่จะครองตำแหน่งผู้นำในด้าน AI บรรณาธิการของ Downcodes จะให้คำอธิบายโดยละเอียดเกี่ยวกับความคืบหน้าล่าสุดของ Meta ในแบบจำลอง Llama รวมถึงความก้าวหน้าล่าสุดในด้านความสามารถในการให้เหตุผล ความฉลาดในตนเองและการฝึกแบบจำลอง ตลอดจนแผนสำหรับเวอร์ชันในอนาคต บทความนี้จะให้การวิเคราะห์เชิงลึกว่า Meta สามารถปรับปรุงประสิทธิภาพของแบบจำลอง Llama และสำรวจศักยภาพในการใช้งานจริงได้อย่างไร
เมื่อเร็ว ๆ นี้ Yann LeCun หัวหน้านักวิทยาศาสตร์ AI ของ Meta กล่าวว่าระบบอัจฉริยะของเครื่องจักรอัตโนมัติ (AMI) สามารถช่วยเหลือชีวิตประจำวันของผู้คนได้อย่างแท้จริง Meta กำลังทำงานอย่างหนักเพื่อปรับปรุงความสามารถในการอนุมานของโมเดล Llama โดยหวังว่าจะเทียบได้กับโมเดลชั้นนำ เช่น GPT-4o

Manohar Paluri รองประธานของ Meta กล่าวว่าพวกเขากำลังสำรวจวิธีต่างๆ สำหรับโมเดล Llama ที่ไม่เพียงแต่ "วางแผน" แต่ยังประเมินการตัดสินใจแบบเรียลไทม์ และปรับเปลี่ยนเมื่อเงื่อนไขเปลี่ยนแปลง วิธีการทำซ้ำนี้รวมเอาเทคโนโลยี "ห่วงโซ่การคิด" เข้าด้วยกัน และมีเป้าหมายเพื่อให้เกิดความชาญฉลาดของเครื่องจักรอัตโนมัติ ซึ่งสามารถผสมผสานการรับรู้ การใช้เหตุผล และการวางแผนได้อย่างมีประสิทธิภาพ
นอกจากนี้ Paluri เน้นย้ำว่าในการให้เหตุผลของ AI ใน "โดเมนที่ไม่สามารถตรวจสอบได้" โมเดลจำเป็นต้องแบ่งงานที่ซับซ้อนออกเป็นขั้นตอนที่สามารถจัดการได้เพื่อปรับเปลี่ยนแบบไดนามิก ตัวอย่างเช่น การวางแผนการเดินทางไม่เพียงแต่เกี่ยวข้องกับการจองเที่ยวบินเท่านั้น แต่ยังต้องรับมือกับการเปลี่ยนแปลงสภาพอากาศแบบเรียลไทม์ ซึ่งอาจส่งผลให้มีการเปลี่ยนเส้นทาง นอกจากนี้ Meta ยังได้เปิดตัวโมเดล Dualformer ซึ่งสามารถสลับระหว่างสัญชาตญาณที่รวดเร็วและการไตร่ตรองที่ช้าแบบไดนามิกในระหว่างกระบวนการรับรู้ของมนุษย์ เพื่อแก้ปัญหางานที่ซับซ้อนได้อย่างมีประสิทธิภาพ
ในส่วนของการฝึกอบรมโมเดล Llama นั้น Meta ใช้การเรียนรู้แบบมีผู้ดูแลด้วยตนเอง (SSL) เพื่อช่วยให้โมเดลเรียนรู้การนำเสนอข้อมูลที่หลากหลายในหลายสาขา ทำให้มีความยืดหยุ่น ในเวลาเดียวกัน การเรียนรู้แบบเสริมกำลังและการตอบสนองของมนุษย์ (RLHF) ช่วยให้โมเดลปรับแต่งประสิทธิภาพในงานเฉพาะได้ การรวมกันของทั้งสองทำให้แบบจำลองลามะมีความโดดเด่นในการสร้างข้อมูลสังเคราะห์คุณภาพสูง โดยเฉพาะอย่างยิ่งในพื้นที่ที่คุณลักษณะทางภาษายังไม่เพียงพอ
เกี่ยวกับการเปิดตัว Llama4 นั้น Mark Zuckerberg ซีอีโอของ Meta เปิดเผยในการให้สัมภาษณ์ว่าทีมงานได้เริ่มการฝึกอบรมล่วงหน้าสำหรับ Llama4 แล้ว นอกจากนี้เขายังกล่าวอีกว่า Meta กำลังสร้างคลัสเตอร์การประมวลผลและโครงสร้างพื้นฐานข้อมูลสำหรับ Llama4 ซึ่งคาดว่าจะเป็นความก้าวหน้าครั้งสำคัญ Paluri กล่าวอย่างติดตลกว่าหากซักเคอร์เบิร์กถูกถามว่าจะออกเมื่อใด เขาคงจะพูดว่า "วันนี้" โดยเน้นย้ำถึงความก้าวหน้าอย่างรวดเร็วของบริษัทในการพัฒนา AI
Meta หวังว่าจะเปิดตัว Llama เวอร์ชันใหม่ต่อไปในอีกไม่กี่เดือนข้างหน้าเพื่อปรับปรุงความสามารถของ AI อย่างต่อเนื่อง ด้วยการอัปเดตบ่อยครั้ง นักพัฒนาสามารถคาดหวังการอัปเกรดที่สำคัญในแต่ละรุ่นได้
โดยรวมแล้ว การลงทุนและนวัตกรรมอย่างต่อเนื่องของ Meta ในแบบจำลอง Llama ถือเป็นการประกาศทิศทางการพัฒนาในอนาคตที่ทะเยอทะยานในด้านปัญญาประดิษฐ์ การพัฒนาอย่างต่อเนื่องของโมเดลลามะจะนำมาซึ่งความเป็นไปได้มากขึ้นสำหรับความก้าวหน้าและการประยุกต์ใช้เทคโนโลยี AI รอดูการเปิดตัวของ Llama4 และเวอร์ชันต่อๆ ไปกันได้เลย!