ต้องการเป็นทางเลือก OpenAI! SuperNova: โมเดลภาษาขนาดใหญ่ที่ปรับแต่งสำหรับองค์กรและปฏิบัติตามคำแนะนำ

ผู้เขียน：Eve Cole เวลาอัปเดต：2025-03-05 06:50:02

วันนี้ Arcee AI เปิดตัวโมเดลภาษาขนาดใหญ่พารามิเตอร์ 70,000 ล้านพารามิเตอร์ SuperNova ซึ่งเป็นโมเดล AI ที่สามารถนำไปใช้งานภายในองค์กร และได้รับการออกแบบมาเพื่อจัดการกับข้อกังวลขององค์กรเกี่ยวกับความเป็นส่วนตัวของข้อมูล ความเสถียรของโมเดล และการปรับแต่ง ต่างจากบริการที่ใช้ API เช่น OpenAI และ Anthropic ตรงที่ SuperNova ช่วยให้องค์กรต่างๆ ปรับใช้และปรับแต่งโมเดลบนโครงสร้างพื้นฐานของตนเองได้ด้วยการควบคุมที่สมบูรณ์ บรรณาธิการของ Downcodes จะให้คำอธิบายโดยละเอียดเกี่ยวกับนวัตกรรมทางเทคโนโลยีของ SuperNova วิธีการปรับใช้ ความสามารถในการปรับแต่ง และผลกระทบต่อกลยุทธ์ AI ขององค์กร

วันนี้ Arcee AI เปิดตัว SuperNova ซึ่งเป็นโมเดลภาษาขนาด 7 หมื่นล้านพารามิเตอร์ที่นำเสนอการใช้งานระดับองค์กร ความสามารถในการปฏิบัติตามคำสั่งขั้นสูง และตัวเลือกการปรับแต่งเต็มรูปแบบ โมเดลนี้ออกแบบมาเพื่อมอบทางเลือกที่มีประสิทธิภาพและราคาไม่แพงสำหรับปัญหาหลักด้วยบริการที่ใช้ API เช่น OpenAI และ Anthropic สำหรับความเป็นส่วนตัวของข้อมูลองค์กร ความเสถียรของโมเดล และการปรับแต่ง

ในพื้นที่ AI ที่ถูกครอบงำโดย Cloud API นั้น Arcee AI กำลังใช้แนวทางที่แตกต่างกับ SuperNova โมเดลภาษาขนาดใหญ่ (LLM) นี้สามารถติดตั้งและปรับแต่งภายในโครงสร้างพื้นฐานขององค์กรได้ SuperNova ซึ่งเปิดตัวในวันนี้ อิงตามสถาปัตยกรรม Llama-3.1-70B-Instruct ของ Meta และนำเสนอสิ่งที่ Arcee อ้างว่าเป็นความสามารถในการปฏิบัติตามคำสั่งที่เหนือกว่า และกระบวนการหลังการฝึกอบรมแบบใหม่ที่ปรับให้เข้ากับความต้องการทางธุรกิจเฉพาะ

นวัตกรรมทางเทคโนโลยี

การพัฒนา SuperNova เกี่ยวข้องกับแนวทางหลังการฝึกอบรมที่หลากหลาย

Lucas Atkins หัวหน้าวิศวกรของโครงการเปิดเผยความลับ: "เราฝึกโมเดลสามโมเดล โดยโมเดลหนึ่งกลั่นจากแก่นแท้ของ Llama405B โมเดลหนึ่งป้อนข้อมูลขนาดใหญ่ด้วยชุดข้อมูลที่สร้างโดย EvolKit ของเรา และอีกโมเดลหนึ่งมี DPO ระดับลึกในการแปลงคำสั่ง Llama3instruct ในที่สุด เราได้รวมมันเข้ากับเวทย์มนตร์ใหม่ที่ยังคงรักษาพลังวิเศษของแต่ละรุ่นไว้”

Arcee อ้างว่าสิ่งนี้มีส่วนทำให้ SuperNova มีความสามารถในการปฏิบัติตามคำสั่งของ SuperNova โดยเฉพาะอย่างยิ่งการกลั่นจากโมเดลพาราเมตริก 405B ซึ่งไม่เพียงแต่แสดงให้เห็นว่า SuperNova สามารถจับแก่นแท้ของโมเดลขนาดใหญ่ในขณะที่ยังคงใช้งานฮาร์ดแวร์เพียงเล็กน้อย

การใช้งานและการปรับแต่งระดับองค์กร

SuperNova ได้รับการออกแบบมาให้ปรับใช้ในสภาพแวดล้อมคลาวด์ขององค์กร และจะพร้อมใช้งานเป็นอันดับแรกบน AWS Marketplace Arcee กำลังดำเนินการเพื่อให้สามารถใช้งานได้บนตลาด Google และ Azure

Mark McQuade ผู้ร่วมก่อตั้ง Arcee AI เน้นย้ำถึงประโยชน์ของวิธีการปรับใช้นี้: "แบบจำลองนี้ถูกนำไปใช้งานใน AWS VPC ของคุณ แต่ยังรวมเว็บเซิร์ฟเวอร์ อินเทอร์เฟซการแชท และฐานข้อมูลเพื่อจัดเก็บประวัติการแชทของคุณอีกด้วย องค์กร ทุกคนสามารถโต้ตอบกับมันได้อย่างใกล้ชิด”

วิธีการปรับใช้นี้ช่วยแก้ปัญหาข้อกังวลขององค์กรเกี่ยวกับความเป็นส่วนตัวของข้อมูลและความเสถียรของโมเดล ต่างจากบริการที่ใช้ API ซึ่งอาจเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบ SuperNova ช่วยให้องค์กรควบคุมได้อย่างสมบูรณ์ McQuade ตั้งข้อสังเกตว่าสิ่งนี้สำคัญอย่างยิ่งเมื่อพิจารณาจากความวุ่นวายในอุตสาหกรรม AI เมื่อเร็ว ๆ นี้: "OpenAI เพิ่งทิ้ง 3.5...บริษัทจำนวนมากสร้างธุรกิจของตนโดยใช้ 3.5 API ดังนั้นเมื่อ API เปลี่ยนแปลง แอปพลิเคชันของคุณจะใช้งานไม่ได้ แต่ ใน "ในโลกของเรา ไม่มีอะไรเปลี่ยนแปลง เว้นแต่คุณต้องการให้มันเปลี่ยนแปลง เพราะมันเป็นโมเดลของคุณและวิธีการดำเนินการของคุณ"

การปรับแต่งและการปรับปรุงอย่างต่อเนื่อง

จุดขายประการหนึ่งของ SuperNova คือความสามารถในการปรับแต่งและฝึกอบรมใหม่ในสภาพแวดล้อมขององค์กร

Atkins อธิบายกระบวนการและคุณประโยชน์ของมัน: "เมื่อเวลาผ่านไป เราสามารถฝึกโมเดลใหม่ได้ทั้งหมดในสภาพแวดล้อมของคุณเองเพื่อให้ตรงกับความต้องการของคุณมากขึ้น ขณะที่เราบันทึกการสนทนาเหล่านี้ หากคุณต้องการให้โมเดลอิงตามการตั้งค่าเฉพาะของคุณในฐานะธุรกิจ ปรับปรุงให้ดีขึ้นโดยรวม และเรามีความสามารถในการทำเช่นนั้นได้โดยไม่ต้องมีข้อมูลออกจากระบบของคุณ”

ความสามารถนี้ช่วยให้ทีมเทคนิคสามารถปรับโมเดลให้เข้ากับความรู้เฉพาะโดเมนหรือข้อกำหนดเฉพาะของบริษัทได้ นี่เป็นข้อได้เปรียบที่เหนือกว่าบริการ API บนคลาวด์ซึ่งโดยทั่วไปจะไม่อนุญาตให้ปรับแต่งในระดับนี้

ส่วนประกอบโอเพ่นซอร์ส

แม้ว่าโมเดล 70B แบบเต็มจะไม่ใช่โอเพ่นซอร์ส แต่ Arcee กำลังปล่อยส่วนประกอบหลายอย่างสำหรับชุมชนนักพัฒนา:

API ฟรีสำหรับการทดสอบและประเมินผล: ช่วยให้นักพัฒนาสามารถทดลองใช้ SuperNova ได้โดยไม่ต้องดำเนินการปรับใช้เต็มรูปแบบ

SuperNova-Lite: เวอร์ชันโอเพ่นซอร์สของโมเดลที่มีพารามิเตอร์ 8B โมเดลขนาดเล็กนี้อาจมีประโยชน์สำหรับนักพัฒนาที่ทำงานในสภาพแวดล้อมที่จำกัดทรัพยากร หรือผู้ที่ต้องการทำความเข้าใจสถาปัตยกรรมก่อนที่จะปรับใช้โมเดลแบบเต็ม

EvolKit: ไปป์ไลน์การสร้างชุดข้อมูลสำหรับการสร้างคู่ QA ที่ซับซ้อน เครื่องมือนี้มีประโยชน์สำหรับองค์กรที่ต้องการสร้างข้อมูลการฝึกอบรมแบบกำหนดเองสำหรับกรณีการใช้งานเฉพาะของตน

ด้วยการใช้ส่วนประกอบเหล่านี้แบบโอเพ่นซอร์ส Arcee มีส่วนสนับสนุนชุมชน AI ในวงกว้าง ในขณะเดียวกันก็มอบเครื่องมือให้ผู้มีโอกาสเป็นลูกค้าในการประเมินและปรับแต่งผลิตภัณฑ์ของตน Arcee SuperNova มีให้บริการบน AWS Marketplace เช่นกัน

การกล่าวอ้างประสิทธิภาพและเกณฑ์มาตรฐาน

Arcee อ้างว่า SuperNova ทำงานได้ดีในด้านต่างๆ โดยเฉพาะการให้เหตุผลทางคณิตศาสตร์ “อันนี้ทำได้ดีมากกับการวัดประสิทธิภาพทางคณิตศาสตร์” แอตกินส์ตั้งข้อสังเกต “อย่างไรก็ตาม บริษัทสนับสนุนให้มีการประเมินโดยบุคคลที่สามเพื่อตรวจสอบคำกล่าวอ้างของพวกเขา

"เราจะจัดเตรียม API ให้ผู้คนได้ใช้งาน หากมีบุคคลที่สามที่ต้องการเรียกใช้การวัดประสิทธิภาพที่เชื่อถือได้เพื่อประเมินตนเอง เราสามารถจัดเตรียมให้พวกเขาสามารถเข้าถึงน้ำหนักได้ เราต้องการมีความโปร่งใสอย่างสมบูรณ์ในแบบจำลองนี้" พูดว่า .

การเปิดกว้างต่อการประเมินโดยบุคคลที่สามเป็นเรื่องที่น่ายกย่อง เนื่องจากช่วยให้สามารถตรวจสอบข้อเรียกร้องของ Arcee ได้โดยอิสระ การได้เห็นว่า SuperNova ทำงานอย่างไรบนเกณฑ์มาตรฐานจะน่าสนใจอย่างยิ่ง เมื่อเปรียบเทียบกับโมเดลจากบริษัท AI ชั้นนำ เช่น OpenAI, Anthropic และอื่นๆ

ผลกระทบของกลยุทธ์ AI ระดับองค์กร

การเปิดตัว SuperNova เกิดขึ้นในช่วงเวลาที่บริษัทหลายแห่งกำลังประเมินกลยุทธ์ AI ของตนใหม่ แม้ว่าบริการ API บนคลาวด์จะครองพื้นที่นี้มาโดยตลอด แต่ก็มีความสนใจเพิ่มขึ้นในโมเดลที่ปรับใช้และปรับแต่งได้ ซึ่งให้การควบคุมและความยืดหยุ่นที่มากขึ้น

แนวทางของ SuperNova ช่วยแก้ปัญหาสำคัญหลายประการ:

ความเป็นส่วนตัวของข้อมูล: ด้วยการปรับใช้ภายในโครงสร้างพื้นฐานของบริษัท SuperNova ช่วยให้มั่นใจได้ว่าข้อมูลที่ละเอียดอ่อนจะไม่ออกจากการควบคุมขององค์กร
ความเสถียรของโมเดล: ต่างจากบริการ API ที่อาจเปลี่ยนแปลงหรือเลิกใช้งานโดยไม่ต้องแจ้งให้ทราบ SuperNova มอบรากฐานที่มั่นคงซึ่งจะเปลี่ยนแปลงเมื่อองค์กรเลือกที่จะอัปเดตเท่านั้น
การปรับแต่ง: ความสามารถในการปรับแต่งและฝึกโมเดลใหม่เกี่ยวกับข้อมูลเฉพาะของบริษัท ช่วยให้สามารถปรับแต่งเชิงลึกซึ่งไม่สามารถทำได้ในบริการ API ส่วนใหญ่
การควบคุมต้นทุน: แม้ว่าการใช้งานครั้งแรกอาจต้องใช้ทรัพยากรจำนวนมาก แต่ต้นทุนระยะยาวในการใช้งาน SuperNova มีแนวโน้มที่จะน้อยกว่าต้นทุนการจ่ายสำหรับการเรียก API ในวงกว้าง
ความได้เปรียบทางการแข่งขัน: โมเดล AI ที่ปรับแต่งและปรับปรุงอย่างต่อเนื่องสามารถสร้างความได้เปรียบทางการแข่งขันที่สำคัญในอุตสาหกรรมที่ข้อมูลเชิงลึกที่ขับเคลื่อนด้วย AI มีความสำคัญ

ภาวะที่กลืนไม่เข้าคายไม่ออกของอธิปไตยของ AI

ในขณะที่องค์กรต่างๆ นำทางภูมิทัศน์ AI ที่พัฒนาอย่างรวดเร็ว การเปิดตัว SuperNova เผยให้เห็นความตึงเครียดที่เพิ่มขึ้นในอุตสาหกรรม: การแลกเปลี่ยนระหว่างความสะดวกสบายและพลังของบริการ AI บนคลาวด์ เทียบกับการควบคุมและการปรับแต่งที่ได้รับจากโมเดลที่ปรับใช้ได้ การแบ่งขั้วนี้นำเสนอสิ่งที่เราอาจเรียกว่า “ปัญหาอธิปไตยของ AI”

ในด้านหนึ่ง บริการ API บนคลาวด์ เช่น GPT-4 และ Claude นำเสนอประสิทธิภาพที่ล้ำสมัยและการอัปเดตอย่างต่อเนื่อง แต่ก็ต้องแลกมาด้วยปัญหาความเป็นส่วนตัวของข้อมูลและการปรับแต่งที่จำกัด ในทางกลับกัน โมเดลอย่าง SuperNova สัญญาว่าจะควบคุมและปรับแต่งได้เต็มรูปแบบ แต่ต้องใช้ความเชี่ยวชาญภายในองค์กรในการปรับใช้และบำรุงรักษา

แนวทางของ Arcee กับ SuperNova พยายามที่จะลดช่องว่างนี้ โดยนำเสนอโมเดลที่สามารถติดตั้งใช้งานในสถานที่ได้ ในขณะที่ยังคงมอบความสามารถที่ออกแบบมาเพื่อแข่งขันกับบริการบนคลาวด์ชั้นนำ วิธีการแบบผสมผสานนี้อาจน่าสนใจเป็นพิเศษสำหรับอุตสาหกรรมที่มีข้อกำหนดด้านกฎระเบียบที่เข้มงวดหรืออุตสาหกรรมที่ต้องจัดการข้อมูลที่ละเอียดอ่อนสูง

บล็อกอย่างเป็นทางการ: https://blog.arcee.ai/meet-arcee-supernova-our-flagship-70b-model-alternative-to-openai/

โดยรวมแล้ว SuperNova ของ Arcee AI ช่วยให้องค์กรต่างๆ มีวิธีใหม่ในการปรับใช้และปรับแต่ง AI โดยให้ข้อได้เปรียบที่สำคัญในด้านความเป็นส่วนตัวของข้อมูล ความเสถียรของโมเดล และความสามารถในการปรับแต่งได้ แม้ว่าจะต้องใช้การลงทุนด้านเทคนิคจำนวนหนึ่งสำหรับการปรับใช้และการบำรุงรักษา แต่ประโยชน์ระยะยาวและผลกระทบเชิงบวกต่อกลยุทธ์ AI ขององค์กรก็คุ้มค่าที่จะได้รับความสนใจ การเกิดขึ้นของ SuperNova ยังทำให้บริษัทต่างๆ มีทางเลือกใหม่ใน "ปัญหาอธิปไตยด้าน AI"