AI21 เปิดตัวโมเดลระดับการผลิตรุ่นแรกของโลกของ Mamba, Jamba ซึ่งรองรับความยาวบริบท 256K

ผู้เขียน：Eve Cole เวลาอัปเดต：2025-02-20 12:00:03

เมื่อเร็วๆ นี้ บริษัทปัญญาประดิษฐ์ชั้นนำหลายแห่งมีความก้าวหน้าอย่างมากในด้านโมเดลภาษาขนาดใหญ่ และได้เปิดตัวโมเดลและฟีเจอร์ใหม่ๆ ที่มุ่งปรับปรุงประสิทธิภาพของโมเดลและประสบการณ์ผู้ใช้ การอัปเดตเหล่านี้ครอบคลุมการปรับปรุงความยาวบริบท การปรับปรุงสถาปัตยกรรมโมเดล และการรองรับแอปพลิเคชันระดับองค์กร ซึ่งแสดงถึงการพัฒนาอย่างต่อเนื่องและความสมบูรณ์ของเทคโนโลยี AI บทความนี้จะเน้นที่ผลลัพธ์ล่าสุดที่ AI21 Labs, Mistral AI และ Cohere เปิดตัวเมื่อเร็วๆ นี้

AI21 เปิดตัว Jamba โมเดลระดับการผลิต Mamba ตัวแรกของโลก ซึ่งใช้สถาปัตยกรรม SSM-Transformer มีพารามิเตอร์ 52B และรองรับความยาวบริบท 256K โมเดล Jamba ผสมผสานเทคโนโลยี SSM และสถาปัตยกรรม Transformer และทำงานได้ดีในการประมวลผลงานข้อความขนาดยาว MistralAI เปิดตัว Mistral7Bv0.2BaseModel ซึ่งเพิ่มบริบทเป็น 32K และมุ่งมั่นที่จะมอบโซลูชัน AI ที่ดีขึ้น Cohere เปิดตัว Command-R โดยมุ่งเน้นไปที่การนำปัญญาประดิษฐ์มาใช้ในระดับการผลิต และมอบโมเดลกำเนิดที่ปรับขนาดได้ให้กับองค์กรต่างๆ

การเปิดตัวโมเดลใหม่เหล่านี้แสดงให้เห็นถึงความมีชีวิตชีวาของนวัตกรรมอย่างต่อเนื่องในด้านปัญญาประดิษฐ์ และยังบ่งชี้ว่าโมเดลภาษาขนาดใหญ่จะพัฒนาไปในทิศทางที่มีประสิทธิภาพและทรงพลังมากขึ้นในอนาคต หน้าต่างบริบทที่ยาวขึ้นและสถาปัตยกรรมโมเดลที่ทรงพลังยิ่งขึ้นจะทำให้ผู้ใช้ได้รับประสบการณ์การใช้งานแอพพลิเคชั่นที่สมบูรณ์ยิ่งขึ้น และมอบรากฐานที่แข็งแกร่งยิ่งขึ้นสำหรับแอพพลิเคชั่น AI ระดับองค์กร เราหวังว่าจะได้เห็นนวัตกรรมเพิ่มเติมในอนาคต