เมื่อเร็ว ๆ นี้ Microsoft ได้เปิดตัวโมเดล Basic Ag ตัวแทน AI Multimodal อย่างเป็นทางการที่เรียกว่า "Magma" บนเว็บไซต์ทางการ ปัญญาประดิษฐ์ใหม่นี้มีความสามารถในการขยายโลกดิจิตอลและทางกายภาพและสามารถประมวลผลข้อมูลหลายประเภทเช่นรูปภาพวิดีโอข้อความ ฯลฯ ในเวลาเดียวกัน เมื่อเปรียบเทียบกับผู้ช่วย AI แบบดั้งเดิมแมกมามีความโดดเด่นในฟังก์ชั่นการทำนายทางจิตวิทยาทำให้สามารถเข้าใจความตั้งใจและพฤติกรรมในอนาคตของตัวละครหรือวัตถุในวิดีโอได้อย่างแม่นยำยิ่งขึ้น

แมกมามีสถานการณ์แอปพลิเคชันที่หลากหลายและผู้ใช้สามารถใช้ AI นี้เพื่อสั่งซื้อคำสั่งซื้อและตรวจสอบสภาพอากาศและการดำเนินงานอื่น ๆ โดยอัตโนมัติ นอกจากนี้ยังสามารถควบคุมหุ่นยนต์ทางกายภาพโดยอัตโนมัติและให้ความช่วยเหลือแบบเรียลไทม์แก่ผู้ใช้ในระหว่างกิจกรรมต่าง ๆ เช่นหมากรุก ความสามารถในหลายรูปแบบนี้ช่วยให้แมกมาทำงานได้ดีในสภาพแวดล้อมที่แตกต่างกันและสามารถปรับให้เข้ากับงานที่ซับซ้อนได้หลากหลาย
ตามรายงานอย่างเป็นทางการแมกมาเหมาะอย่างยิ่งสำหรับผู้ช่วยหรือหุ่นยนต์ที่ขับเคลื่อนด้วย AI ช่วยให้พวกเขาเข้าใจสภาพแวดล้อมของพวกเขาได้ดีขึ้นและดำเนินการที่สอดคล้องกัน ตัวอย่างเช่นสามารถแนะนำหุ่นยนต์ที่บ้านเพื่อเรียนรู้วิธีการจัดระเบียบรายการที่คุณไม่เคยเห็นมาก่อนหรือช่วยผู้ช่วยเสมือนจริงสร้างคำแนะนำทีละขั้นตอนสำหรับผู้ใช้ คุณลักษณะนี้ช่วยเพิ่มความสามารถในการเรียนรู้และการใช้งานจริงของหุ่นยนต์อย่างมาก
โมเดลแมกมาเป็นหนึ่งในซีรี่ส์ VLA (การแสดงภาษาภาพ) โดยการเรียนรู้ข้อมูลภาพสาธารณะและภาษาจำนวนมากมันสามารถรวมภาษาพื้นที่และเวลาสติปัญญาซึ่งตอบสนองต่องานและความท้าทายที่ซับซ้อนในชีวิตจริงได้อย่างมีประสิทธิภาพ ด้วยการพัฒนาเทคโนโลยีปัญญาประดิษฐ์การเปิดตัว Magma เป็นอีกก้าวสำคัญสำหรับผู้ช่วยอัจฉริยะและหุ่นยนต์
ลิงค์โครงการ: https://microsoft.github.io/magma/
ประเด็นสำคัญ:
ความสามารถข้ามโมดอล: แมกมาสามารถประมวลผลประเภทข้อมูลที่หลากหลายเช่นรูปภาพวิดีโอและข้อความปรับปรุงฟังก์ชั่นของผู้ช่วยอัจฉริยะ
แอปพลิเคชันอัจฉริยะ: ผู้ใช้สามารถสั่งซื้อคำสั่งซื้อตรวจสอบสภาพอากาศและควบคุมหุ่นยนต์ทางกายภาพผ่านแมกมา
การเรียนรู้การปรับตัว: แมกมาช่วยให้หุ่นยนต์เรียนรู้งานใหม่และสร้างคู่มือการปฏิบัติงานสำหรับผู้ช่วยเสมือนเพิ่มประโยชน์