AI21Labs เพิ่งเปิดตัวรุ่น Jamba 1.6 Series รุ่นใหญ่ล่าสุดซึ่งเป็นที่รู้จักกันในชื่อโมเดลการประมวลผลข้อความยาวที่ทรงพลังและมีประสิทธิภาพที่สุดในตลาด เมื่อเปรียบเทียบกับโมเดลหม้อแปลงแบบดั้งเดิมแบบจำลอง Jamba แสดงความเร็วและคุณภาพที่สูงขึ้นเมื่อจัดการกับบริบทที่ยาวนานและความเร็วการอนุมานนั้นเร็วกว่ารุ่นที่คล้ายกัน 2.5 เท่า
ซีรี่ส์ Jamba 1.6 รวมถึง Jamba Mini (พารามิเตอร์ 1.2 พันล้านพารามิเตอร์) และ Jamba Large (พารามิเตอร์ 9.4 พันล้านพารามิเตอร์) และได้รับการปรับให้เหมาะสมสำหรับแอปพลิเคชันเชิงพาณิชย์ด้วยการเรียกใช้ฟังก์ชั่นเอาต์พุตที่มีโครงสร้าง (เช่น JSON) และความสามารถในการสร้างที่ใช้ความเป็นจริง แบบจำลองเหล่านี้มีแอพพลิเคชั่นที่หลากหลายตั้งแต่ผู้ช่วยอัจฉริยะระดับองค์กรไปจนถึงการวิจัยเชิงวิชาการและสามารถมีบทบาทสำคัญ
โมเดลนี้ใช้ข้อตกลงใบอนุญาตโอเพ่นซอร์สที่เรียกว่า Jamba Open Model License ช่วยให้ผู้ใช้สามารถดำเนินการวิจัยและใช้ในเชิงพาณิชย์ภายใต้หลักฐานของข้อกำหนดที่เกี่ยวข้องต่อไปนี้ นอกจากนี้ซีรี่ส์ JAMBA1.6 มีกำหนดเส้นตายความรู้เมื่อวันที่ 5 มีนาคม 2567 และสนับสนุนหลายภาษารวมถึงภาษาอังกฤษสเปนฝรั่งเศสโปรตุเกสภาษาอิตาลีดัตช์เยอรมันอาหรับและฮีบรูเพื่อให้มั่นใจว่ามันปรับให้เข้ากับความต้องการของผู้ใช้ทั่วโลก
ในแง่ของการประเมินประสิทธิภาพ JAMBA ขนาดใหญ่ 1.6 ทำงานได้ดีในหลายเกณฑ์มาตรฐาน ในการทดสอบมาตรฐานเช่น Arena Hard, Crag และ Financebench คะแนนของพวกเขาเกินกว่าคู่แข่งของพวกเขาแสดงความเข้าใจภาษาที่โดดเด่นและความสามารถในการสร้าง โมเดล Jamba โดดเด่นเป็นพิเศษในการจัดการกับข้อความยาว
เพื่อให้แน่ใจว่าการอนุมานที่มีประสิทธิภาพผู้ใช้ที่ใช้รุ่น JAMBA จำเป็นต้องติดตั้งไลบรารี Python ที่เกี่ยวข้องก่อนและจำเป็นต้องใช้อุปกรณ์ CUDA เพื่อรองรับการทำงานของรุ่น ผู้ใช้สามารถเรียกใช้โมเดลผ่านเฟรมเวิร์ก VLLM หรือ Transformers ด้วยการสนับสนุน GPU ขนาดใหญ่ Jamba ขนาดใหญ่ 1.6 สามารถจัดการบริบทได้สูงถึง 256K ซึ่งเป็นไปไม่ได้ในรุ่นก่อนหน้า
รุ่น: https://huggingface.co/ai21labs/ai21-jamba-large-1.6
ประเด็นสำคัญ:
โมเดล JAMBA1.6 นั้นเร็วขึ้นและมีคุณภาพมากขึ้นสำหรับการประมวลผลข้อความยาวและรองรับหลายภาษา
ข้อตกลงสิทธิ์การใช้งานโอเพ่นซอร์สอนุญาตให้มีการวิจัยและการใช้งานเชิงพาณิชย์และอำนวยความสะดวกในการแบ่งปันเทคโนโลยี
ผลิตภัณฑ์แข่งขันที่มีประสิทธิภาพสูงกว่าในการเปรียบเทียบหลายแบบ