วันนี้ Arcee AI เปิดตัวโมเดลภาษาขนาดใหญ่พารามิเตอร์ 70,000 ล้านพารามิเตอร์ SuperNova ซึ่งเป็นโมเดล AI ที่สามารถนำไปใช้งานภายในองค์กร และได้รับการออกแบบมาเพื่อจัดการกับข้อกังวลขององค์กรเกี่ยวกับความเป็นส่วนตัวของข้อมูล ความเสถียรของโมเดล และการปรับแต่ง ต่างจากบริการที่ใช้ API เช่น OpenAI และ Anthropic ตรงที่ SuperNova ช่วยให้องค์กรต่างๆ ปรับใช้และปรับแต่งโมเดลบนโครงสร้างพื้นฐานของตนเองได้ด้วยการควบคุมที่สมบูรณ์ บรรณาธิการของ Downcodes จะให้คำอธิบายโดยละเอียดเกี่ยวกับนวัตกรรมทางเทคโนโลยีของ SuperNova วิธีการปรับใช้ ความสามารถในการปรับแต่ง และผลกระทบต่อกลยุทธ์ AI ขององค์กร
วันนี้ Arcee AI เปิดตัว SuperNova ซึ่งเป็นโมเดลภาษาขนาด 7 หมื่นล้านพารามิเตอร์ที่นำเสนอการใช้งานระดับองค์กร ความสามารถในการปฏิบัติตามคำสั่งขั้นสูง และตัวเลือกการปรับแต่งเต็มรูปแบบ โมเดลนี้ออกแบบมาเพื่อมอบทางเลือกที่มีประสิทธิภาพและราคาไม่แพงสำหรับปัญหาหลักด้วยบริการที่ใช้ API เช่น OpenAI และ Anthropic สำหรับความเป็นส่วนตัวของข้อมูลองค์กร ความเสถียรของโมเดล และการปรับแต่ง

ในพื้นที่ AI ที่ถูกครอบงำโดย Cloud API นั้น Arcee AI กำลังใช้แนวทางที่แตกต่างกับ SuperNova โมเดลภาษาขนาดใหญ่ (LLM) นี้สามารถติดตั้งและปรับแต่งภายในโครงสร้างพื้นฐานขององค์กรได้ SuperNova ซึ่งเปิดตัวในวันนี้ อิงตามสถาปัตยกรรม Llama-3.1-70B-Instruct ของ Meta และนำเสนอสิ่งที่ Arcee อ้างว่าเป็นความสามารถในการปฏิบัติตามคำสั่งที่เหนือกว่า และกระบวนการหลังการฝึกอบรมแบบใหม่ที่ปรับให้เข้ากับความต้องการทางธุรกิจเฉพาะ
นวัตกรรมทางเทคโนโลยี
การพัฒนา SuperNova เกี่ยวข้องกับแนวทางหลังการฝึกอบรมที่หลากหลาย
Lucas Atkins หัวหน้าวิศวกรของโครงการเปิดเผยความลับ: "เราฝึกโมเดลสามโมเดล โดยโมเดลหนึ่งกลั่นจากแก่นแท้ของ Llama405B โมเดลหนึ่งป้อนข้อมูลขนาดใหญ่ด้วยชุดข้อมูลที่สร้างโดย EvolKit ของเรา และอีกโมเดลหนึ่งมี DPO ระดับลึกในการแปลงคำสั่ง Llama3instruct ในที่สุด เราได้รวมมันเข้ากับเวทย์มนตร์ใหม่ที่ยังคงรักษาพลังวิเศษของแต่ละรุ่นไว้”
Arcee อ้างว่าสิ่งนี้มีส่วนทำให้ SuperNova มีความสามารถในการปฏิบัติตามคำสั่งของ SuperNova โดยเฉพาะอย่างยิ่งการกลั่นจากโมเดลพาราเมตริก 405B ซึ่งไม่เพียงแต่แสดงให้เห็นว่า SuperNova สามารถจับแก่นแท้ของโมเดลขนาดใหญ่ในขณะที่ยังคงใช้งานฮาร์ดแวร์เพียงเล็กน้อย
การใช้งานและการปรับแต่งระดับองค์กร
SuperNova ได้รับการออกแบบมาให้ปรับใช้ในสภาพแวดล้อมคลาวด์ขององค์กร และจะพร้อมใช้งานเป็นอันดับแรกบน AWS Marketplace Arcee กำลังดำเนินการเพื่อให้สามารถใช้งานได้บนตลาด Google และ Azure
Mark McQuade ผู้ร่วมก่อตั้ง Arcee AI เน้นย้ำถึงประโยชน์ของวิธีการปรับใช้นี้: "แบบจำลองนี้ถูกนำไปใช้งานใน AWS VPC ของคุณ แต่ยังรวมเว็บเซิร์ฟเวอร์ อินเทอร์เฟซการแชท และฐานข้อมูลเพื่อจัดเก็บประวัติการแชทของคุณอีกด้วย องค์กร ทุกคนสามารถโต้ตอบกับมันได้อย่างใกล้ชิด”
วิธีการปรับใช้นี้ช่วยแก้ปัญหาข้อกังวลขององค์กรเกี่ยวกับความเป็นส่วนตัวของข้อมูลและความเสถียรของโมเดล ต่างจากบริการที่ใช้ API ซึ่งอาจเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบ SuperNova ช่วยให้องค์กรควบคุมได้อย่างสมบูรณ์ McQuade ตั้งข้อสังเกตว่าสิ่งนี้สำคัญอย่างยิ่งเมื่อพิจารณาจากความวุ่นวายในอุตสาหกรรม AI เมื่อเร็ว ๆ นี้: "OpenAI เพิ่งทิ้ง 3.5...บริษัทจำนวนมากสร้างธุรกิจของตนโดยใช้ 3.5 API ดังนั้นเมื่อ API เปลี่ยนแปลง แอปพลิเคชันของคุณจะใช้งานไม่ได้ แต่ ใน "ในโลกของเรา ไม่มีอะไรเปลี่ยนแปลง เว้นแต่คุณต้องการให้มันเปลี่ยนแปลง เพราะมันเป็นโมเดลของคุณและวิธีการดำเนินการของคุณ"
การปรับแต่งและการปรับปรุงอย่างต่อเนื่อง
จุดขายประการหนึ่งของ SuperNova คือความสามารถในการปรับแต่งและฝึกอบรมใหม่ในสภาพแวดล้อมขององค์กร
Atkins อธิบายกระบวนการและคุณประโยชน์ของมัน: "เมื่อเวลาผ่านไป เราสามารถฝึกโมเดลใหม่ได้ทั้งหมดในสภาพแวดล้อมของคุณเองเพื่อให้ตรงกับความต้องการของคุณมากขึ้น ขณะที่เราบันทึกการสนทนาเหล่านี้ หากคุณต้องการให้โมเดลอิงตามการตั้งค่าเฉพาะของคุณในฐานะธุรกิจ ปรับปรุงให้ดีขึ้นโดยรวม และเรามีความสามารถในการทำเช่นนั้นได้โดยไม่ต้องมีข้อมูลออกจากระบบของคุณ”
ความสามารถนี้ช่วยให้ทีมเทคนิคสามารถปรับโมเดลให้เข้ากับความรู้เฉพาะโดเมนหรือข้อกำหนดเฉพาะของบริษัทได้ นี่เป็นข้อได้เปรียบที่เหนือกว่าบริการ API บนคลาวด์ซึ่งโดยทั่วไปจะไม่อนุญาตให้ปรับแต่งในระดับนี้
ส่วนประกอบโอเพ่นซอร์ส
แม้ว่าโมเดล 70B แบบเต็มจะไม่ใช่โอเพ่นซอร์ส แต่ Arcee กำลังปล่อยส่วนประกอบหลายอย่างสำหรับชุมชนนักพัฒนา:
API ฟรีสำหรับการทดสอบและประเมินผล: ช่วยให้นักพัฒนาสามารถทดลองใช้ SuperNova ได้โดยไม่ต้องดำเนินการปรับใช้เต็มรูปแบบ
SuperNova-Lite: เวอร์ชันโอเพ่นซอร์สของโมเดลที่มีพารามิเตอร์ 8B โมเดลขนาดเล็กนี้อาจมีประโยชน์สำหรับนักพัฒนาที่ทำงานในสภาพแวดล้อมที่จำกัดทรัพยากร หรือผู้ที่ต้องการทำความเข้าใจสถาปัตยกรรมก่อนที่จะปรับใช้โมเดลแบบเต็ม
EvolKit: ไปป์ไลน์การสร้างชุดข้อมูลสำหรับการสร้างคู่ QA ที่ซับซ้อน เครื่องมือนี้มีประโยชน์สำหรับองค์กรที่ต้องการสร้างข้อมูลการฝึกอบรมแบบกำหนดเองสำหรับกรณีการใช้งานเฉพาะของตน
ด้วยการใช้ส่วนประกอบเหล่านี้แบบโอเพ่นซอร์ส Arcee มีส่วนสนับสนุนชุมชน AI ในวงกว้าง ในขณะเดียวกันก็มอบเครื่องมือให้ผู้มีโอกาสเป็นลูกค้าในการประเมินและปรับแต่งผลิตภัณฑ์ของตน Arcee SuperNova มีให้บริการบน AWS Marketplace เช่นกัน
การกล่าวอ้างประสิทธิภาพและเกณฑ์มาตรฐาน
Arcee อ้างว่า SuperNova ทำงานได้ดีในด้านต่างๆ โดยเฉพาะการให้เหตุผลทางคณิตศาสตร์ “อันนี้ทำได้ดีมากกับการวัดประสิทธิภาพทางคณิตศาสตร์” แอตกินส์ตั้งข้อสังเกต “อย่างไรก็ตาม บริษัทสนับสนุนให้มีการประเมินโดยบุคคลที่สามเพื่อตรวจสอบคำกล่าวอ้างของพวกเขา
"เราจะจัดเตรียม API ให้ผู้คนได้ใช้งาน หากมีบุคคลที่สามที่ต้องการเรียกใช้การวัดประสิทธิภาพที่เชื่อถือได้เพื่อประเมินตนเอง เราสามารถจัดเตรียมให้พวกเขาสามารถเข้าถึงน้ำหนักได้ เราต้องการมีความโปร่งใสอย่างสมบูรณ์ในแบบจำลองนี้" พูดว่า .
การเปิดกว้างต่อการประเมินโดยบุคคลที่สามเป็นเรื่องที่น่ายกย่อง เนื่องจากช่วยให้สามารถตรวจสอบข้อเรียกร้องของ Arcee ได้โดยอิสระ การได้เห็นว่า SuperNova ทำงานอย่างไรบนเกณฑ์มาตรฐานจะน่าสนใจอย่างยิ่ง เมื่อเปรียบเทียบกับโมเดลจากบริษัท AI ชั้นนำ เช่น OpenAI, Anthropic และอื่นๆ


ผลกระทบของกลยุทธ์ AI ระดับองค์กร
การเปิดตัว SuperNova เกิดขึ้นในช่วงเวลาที่บริษัทหลายแห่งกำลังประเมินกลยุทธ์ AI ของตนใหม่ แม้ว่าบริการ API บนคลาวด์จะครองพื้นที่นี้มาโดยตลอด แต่ก็มีความสนใจเพิ่มขึ้นในโมเดลที่ปรับใช้และปรับแต่งได้ ซึ่งให้การควบคุมและความยืดหยุ่นที่มากขึ้น
แนวทางของ SuperNova ช่วยแก้ปัญหาสำคัญหลายประการ:
ภาวะที่กลืนไม่เข้าคายไม่ออกของอธิปไตยของ AI
ในขณะที่องค์กรต่างๆ นำทางภูมิทัศน์ AI ที่พัฒนาอย่างรวดเร็ว การเปิดตัว SuperNova เผยให้เห็นความตึงเครียดที่เพิ่มขึ้นในอุตสาหกรรม: การแลกเปลี่ยนระหว่างความสะดวกสบายและพลังของบริการ AI บนคลาวด์ เทียบกับการควบคุมและการปรับแต่งที่ได้รับจากโมเดลที่ปรับใช้ได้ การแบ่งขั้วนี้นำเสนอสิ่งที่เราอาจเรียกว่า “ปัญหาอธิปไตยของ AI”
ในด้านหนึ่ง บริการ API บนคลาวด์ เช่น GPT-4 และ Claude นำเสนอประสิทธิภาพที่ล้ำสมัยและการอัปเดตอย่างต่อเนื่อง แต่ก็ต้องแลกมาด้วยปัญหาความเป็นส่วนตัวของข้อมูลและการปรับแต่งที่จำกัด ในทางกลับกัน โมเดลอย่าง SuperNova สัญญาว่าจะควบคุมและปรับแต่งได้เต็มรูปแบบ แต่ต้องใช้ความเชี่ยวชาญภายในองค์กรในการปรับใช้และบำรุงรักษา
แนวทางของ Arcee กับ SuperNova พยายามที่จะลดช่องว่างนี้ โดยนำเสนอโมเดลที่สามารถติดตั้งใช้งานในสถานที่ได้ ในขณะที่ยังคงมอบความสามารถที่ออกแบบมาเพื่อแข่งขันกับบริการบนคลาวด์ชั้นนำ วิธีการแบบผสมผสานนี้อาจน่าสนใจเป็นพิเศษสำหรับอุตสาหกรรมที่มีข้อกำหนดด้านกฎระเบียบที่เข้มงวดหรืออุตสาหกรรมที่ต้องจัดการข้อมูลที่ละเอียดอ่อนสูง
บล็อกอย่างเป็นทางการ: https://blog.arcee.ai/meet-arcee-supernova-our-flagship-70b-model-alternative-to-openai/
โดยรวมแล้ว SuperNova ของ Arcee AI ช่วยให้องค์กรต่างๆ มีวิธีใหม่ในการปรับใช้และปรับแต่ง AI โดยให้ข้อได้เปรียบที่สำคัญในด้านความเป็นส่วนตัวของข้อมูล ความเสถียรของโมเดล และความสามารถในการปรับแต่งได้ แม้ว่าจะต้องใช้การลงทุนด้านเทคนิคจำนวนหนึ่งสำหรับการปรับใช้และการบำรุงรักษา แต่ประโยชน์ระยะยาวและผลกระทบเชิงบวกต่อกลยุทธ์ AI ขององค์กรก็คุ้มค่าที่จะได้รับความสนใจ การเกิดขึ้นของ SuperNova ยังทำให้บริษัทต่างๆ มีทางเลือกใหม่ใน "ปัญหาอธิปไตยด้าน AI"