Arcee AI 今天發布了其700億參數大型語言模型SuperNova,這是一個可部署在企業內部的AI模型,旨在解決企業對資料隱私、模型穩定性和客製化的擔憂。有別於OpenAI和Anthropic等基於API的服務,SuperNova允許企業在自己的基礎架構上部署和自訂模型,擁有完全的控制權。 Downcodes小編將為您詳細解讀SuperNova的技術創新、部署方式、客製化能力以及對企業AI策略的影響。
Arcee AI 今天推出了SuperNova,這是一個為企業提供部署、具有先進指令遵循能力和完全自訂選項的700億參數語言模型。該模型旨在為企業資料隱私、模型穩定性和客製化方面提供強大、可擁有的替代方案,以應對基於API服務(如OpenAI 和Anthropic)的關鍵問題。

在由雲端API主導的AI領域中,Arcee AI 透過SuperNova 採取了不同的方法。這個大型語言模型(LLM)可以在企業自己的基礎架構內部署和自訂。 SuperNova 今天發布,基於Meta 的Llama-3.1-70B-Instruct 架構,並採用了Arcee 聲稱的優越的指令遵循能力和適應特定業務需求的新穎後訓練過程。
技術創新
SuperNova 的發展涉及多方面的後訓練方法
專案首席工程師Lucas Atkins 透露了秘籍:「我們訓練了三個模型,一個是從Llama405B 蒸餾的精華,一個是用我們的EvolKit 生成的數據集餵大的,還有一個是在Llama3instruct 上進行了深度DPO的改造。
Arcee 聲稱這造就了SuperNova 的指令遵循能力,特別是從405B 參數模型的蒸餾,這不僅顯示了SuperNova 在保持適中硬體部署的同時,還能捕捉到更大模型的精髓。
企業部署和客製化
SuperNova 旨在部署在企業自己的雲端環境中,首先在AWS Marketplace 上可用。 Arcee 也在努力使其在Google 和Azure 市場上可用。
Arcee AI 的共同創辦人Mark McQuade 強調了這種部署方式的好處:「模型部署在你的AWS VPC 中,但它也會啟動一個網頁伺服器、一個聊天介面和一個資料庫來儲存你的聊天歷史。組織中的每個人都可以和它親密互動。
這種部署方式,解決了企業對資料隱私和模型穩定性的擔憂。和那些可能會在不通知的情況下改變的基於API 的服務不同,SuperNova 給了企業完全的控制權。 McQuade 指出,鑑於AI 行業最近的動盪,這一點尤其重要:「OpenAI 剛剛拋棄了3.5…很多公司都圍繞著3.5的API 建立了業務。所以那個API 一變,你的應用程式就掛了。但在在我們的世界裡,除非你想變,否則什麼都不會變,因為這是你的模型,你的方式來運行它。
客製化和持續改進
SuperNova 的一大賣點是它能夠在企業環境中進行微調和重新訓練。
Atkins 解釋了這個過程及其好處:「隨著時間的推移,我們可以完全在你自己的環境下重新訓練模型,以更好地符合你的偏好。隨著我們保存這些聊天,如果你希望模型根據你作為企業的獨特偏好全面改進,我們有能力這樣做,而不必讓數據離開你的系統。
這種能力讓技術團隊能夠將模型適應特定領域的知識或公司特定的要求。這和那些通常不允許這種程度定制的基於雲端的API 服務相比,無疑是一個巨大的優勢。
開源元件
雖然完整的70B 模型不是開源的,但Arcee 正在為開發人員社群發布幾個元件:
免費API用於測試和評估: 這允許開發人員在不承諾全面部署的情況下嘗試SuperNova。
SuperNova-Lite: 一個8B 參數的開源版本模型。這個較小的模型對於在資源受限的環境中工作的開發者或那些在部署完整模型之前想要了解架構的開發者可能有用。
EvolKit: 他們的資料集產生管道,用於創建複雜的QA對。這個工具對於希望為其特定用例創建自訂訓練資料的組織來說可能很有價值。
透過開源這些組件,Arcee 為更廣泛的AI社群做出了貢獻,同時也為潛在客戶提供了評估和客製化其產品的工具。 Arcee SuperNova 也在AWS Marketplace 上可用。
性能聲明和基準測試
Arcee 聲稱SuperNova 在各個領域表現良好,特別是在數學推理方面。 “Atkins 指出:“這個在數學基準測試中非常出色。 」然而,公司鼓勵第三方評估以驗證他們的聲明。
「我們將提供一個API 供人們使用。如果有第三方想要運行可信任的基準測試來自己評估,我們可以安排提供給他們存取權重的權限。我們希望對這個模型有完全的透明度。」 Atkins 說。
這種對第三方評估的開放性值得稱讚,因為它允許獨立驗證Arcee 的聲明。看到SuperNova 在標準基準測試中的表現與OpenAI、Anthropic 等領先AI 公司模型相比將特別有趣。


企業AI策略的影響
SuperNova 的發布正值許多企業正在重新評估其AI 策略之際。雖然基於雲端的API 服務一直主導著這個領域,但對可部署、可自訂的模型的興趣日益增長,這些模型提供了更多的控制和靈活性。
SuperNova 的方法解決了幾個關鍵問題:
人工智慧主權困境
隨著企業在快速發展的AI 領域中導航,SuperNova 的發布揭示了行業中日益增長的緊張關係:雲端基礎AI 服務的便利性和能力與可部署模型提供的控制和客製化之間的權衡。這種二分法提出了我們可能稱之為「人工智慧主權困境」。
一方面,像GPT-4和Claude 這樣的基於雲端的API 服務提供了最先進的效能和持續更新,但代價是資料隱私問題和有限的客製化。另一方面,像SuperNova 這樣的模型承諾完全控制和定制,但需要在內部專業知識來部署和維護。
Arcee 透過SuperNova 採取的方法試圖彌合這一差距,提供了一個可以在本地部署的模型,同時仍提供旨在與領先的基於雲端的服務相媲美的能力。這種混合方法可能特別吸引那些有嚴格監管要求的行業或那些處理高度敏感資料的行業。
官方部落格:https://blog.arcee.ai/meet-arcee-supernova-our-flagship-70b-model-alternative-to-openai/
總而言之,Arcee AI 的SuperNova 為企業提供了一種新的AI 部署和自訂方式,在資料隱私、模型穩定性和可自訂性方面提供了顯著優勢。 雖然需要一定的技術投入進行部署和維護,但其長期收益和對企業AI 策略的正面影響值得關注。 SuperNova 的出現,也為企業在「AI 主權困境」中提供了新的選擇。