Arcee AI は本日、700 億パラメータの大規模言語モデル SuperNova をリリースしました。これは企業内に展開できる AI モデルで、データ プライバシー、モデルの安定性、カスタマイズに関する企業の懸念に対処するように設計されています。 OpenAI や Anthropic などの API ベースのサービスとは異なり、SuperNova を使用すると、企業は完全に制御しながらモデルを独自のインフラストラクチャに展開およびカスタマイズできます。 Downcodes の編集者が、SuperNova の技術革新、導入方法、カスタマイズ機能、企業の AI 戦略への影響について詳しく説明します。
Arcee AI は本日、エンタープライズ展開、高度なコマンド追従機能、完全なカスタマイズ オプションを提供する 700 億パラメータの言語モデルである SuperNova を発表しました。このモデルは、企業データのプライバシー、モデルの安定性、カスタマイズのための OpenAI や Anthropic などの API ベースのサービスに関する主要な問題に対する強力かつ手頃な代替手段を提供するように設計されています。

クラウド API が主流の AI 空間において、Arcee AI は SuperNova によって異なるアプローチを採用しています。この大規模言語モデル (LLM) は、企業独自のインフラストラクチャ内に導入およびカスタマイズできます。本日リリースされた SuperNova は、Meta の Llama-3.1-70B-Instruct アーキテクチャに基づいており、Arcee が主張する優れた命令追従機能と、特定のビジネス ニーズに適応する新しいトレーニング後のプロセスを特徴としています。
技術革新
SuperNova の開発には、トレーニング後の多面的なアプローチが含まれます
このプロジェクトの主任エンジニアであるルーカス・アトキンス氏は、その秘密を次のように明らかにしました。「私たちは 3 つのモデルをトレーニングしました。1 つは Llama405B のエッセンスから抽出したもの、1 つは EvolKit によって生成されたデータセットを大量に供給したもの、もう 1 つは Llama3instruct 変換の深い DPO を使用したものです。 、各モデルのスーパーパワーを保持した新しい魔法とそれらを組み合わせました。」
Arcee 氏は、これが SuperNova のコマンド追従機能、特に 405B パラメトリック モデルからの抽出に貢献していると主張しています。これは、SuperNova が適度なハードウェア展開を維持しながら、より大きなモデルの本質を捉えることができることを示しているだけではありません。
エンタープライズでの展開とカスタマイズ
SuperNova は企業独自のクラウド環境にデプロイされるように設計されており、まず AWS Marketplace で入手可能になります。 Arcee は、Google および Azure マーケットプレイスでも利用できるようにすることにも取り組んでいます。
Arcee AI の共同創設者である Mark McQuade 氏は、このデプロイメント アプローチの利点を次のように強調しています。「モデルは AWS VPC にデプロイされますが、Web サーバー、チャット インターフェイス、チャット履歴を保存するデータベースも起動します。組織 誰もが親密に組織と対話できます。」
この展開方法は、データ プライバシーとモデルの安定性に関する企業の懸念を解決します。予告なく変更される可能性がある API ベースのサービスとは異なり、SuperNova は企業に完全な制御を提供します。最近の AI 業界の混乱を考えると、これは特に重要であると McQuade 氏は述べました。「OpenAI は 3.5 を放棄したばかりです...多くの企業が 3.5 API を中心にビジネスを構築しました。そのため、API が変更されると、アプリケーションは壊れてしまいます。しかし、 「私たちの世界では、あなたが変えたいと思わない限り、何も変わりません。なぜなら、それはあなたのモデルであり、あなたのやり方だからです。」
カスタマイズと継続的な改善
SuperNova のセールス ポイントの 1 つは、エンタープライズ環境で微調整および再トレーニングできる機能です。
アトキンス氏はプロセスとその利点について次のように説明します。「時間が経つにつれて、お客様の環境でモデルを完全に再トレーニングして、お客様の好みにさらに適合させることができます。これらのチャットを保存するときに、ビジネスとしてのお客様独自の好みに基づいてモデルを作成したい場合は、全体的に改善されており、データをシステムから流出させることなくそれを実現する能力があります。」
この機能により、技術チームはモデルをドメイン固有の知識や企業固有の要件に適応させることができます。これは、通常このレベルのカスタマイズができないクラウドベースの API サービスに比べて、大きな利点です。
オープンソースコンポーネント
完全な 70B モデルはオープンソースではありませんが、Arcee は開発者コミュニティ向けにいくつかのコンポーネントをリリースしています。
テストと評価用の無料 API: これにより、開発者は完全な展開をコミットせずに SuperNova を試すことができます。
SuperNova-Lite: 8B パラメーターを備えたモデルのオープン ソース バージョン。この小規模なモデルは、リソースに制約のある環境で作業する開発者や、完全なモデルをデプロイする前にアーキテクチャを理解したいと考えている開発者にとって役立つ可能性があります。
EvolKit: 複雑な QA ペアを作成するためのデータセット生成パイプライン。このツールは、特定のユースケースに合わせてカスタム トレーニング データを作成しようとしている組織にとって価値があります。
Arcee は、これらのコンポーネントをオープンソース化することで、より広範な AI コミュニティに貢献すると同時に、潜在的な顧客に製品を評価およびカスタマイズするためのツールを提供します。 Arcee SuperNova は AWS Marketplace でも入手できます。
パフォーマンスの主張とベンチマーク
Arcee 氏は、SuperNova はさまざまな分野、特に数学的推論で優れたパフォーマンスを発揮すると主張しています。 「これは数学ベンチマークで非常に優れています」とアトキンス氏は述べました。 「しかし、同社はその主張を検証するために第三者による評価を奨励しています。
「私たちは人々が使用できる API を提供します。信頼できるベンチマークを実行して自身を評価したいと考えているサードパーティがいる場合は、その重みへのアクセスを提供するように手配できます。アトキンスはこのモデルに対して完全な透明性を確保したいと考えています。」言った 。
第三者評価に対するこのオープンさは、Arcee の主張を独立して検証できるため、賞賛に値します。 OpenAI、Anthropic などの大手 AI 企業のモデルと比較して、SuperNova が標準ベンチマークでどのようにパフォーマンスを発揮するかを見るのは特に興味深いでしょう。


エンタープライズ AI 戦略の影響
SuperNova のリリースは、多くの企業が AI 戦略を再評価している時期に行われます。クラウドベースの API サービスが常にこの分野を支配していますが、より多くの制御と柔軟性を提供する、展開可能でカスタマイズ可能なモデルへの関心が高まっています。
SuperNova のアプローチは、いくつかの重要な問題を解決します。
AI主権のジレンマ
企業が急速に進化する AI 環境に対応する中、SuperNova のリリースは業界で高まる緊張、つまりクラウドベースの AI サービスの利便性と能力と、展開可能なモデルによって提供される制御とカスタマイズとの間のトレードオフに光を当てています。この二分法は、「AI 主権のジレンマ」と呼ぶべきものをもたらします。
一方で、GPT-4 や Claude などのクラウドベースの API サービスは、最先端のパフォーマンスと継続的な更新を提供しますが、データ プライバシーの問題やカスタマイズの制限という犠牲を伴います。一方、SuperNova のようなモデルは完全な制御とカスタマイズを約束しますが、導入と保守には社内の専門知識が必要です。
SuperNova を使用した Arcee のアプローチは、このギャップを埋めることを目指しており、主要なクラウドベースのサービスと競合するように設計された機能を提供しながら、オンプレミスで展開できるモデルを提供します。このハイブリッド アプローチは、厳しい規制要件がある業界や機密性の高いデータを扱う業界にとって、特に魅力的である可能性があります。
公式ブログ:https://blog.arcee.ai/meet-arcee-supernova-our-flagship-70b-model-alternative-to-openai/
全体として、Arcee AI の SuperNova は、AI を展開およびカスタマイズする新しい方法を企業に提供し、データ プライバシー、モデルの安定性、カスタマイズ性において大きな利点をもたらします。 導入とメンテナンスにはある程度の技術投資が必要ですが、その長期的なメリットと企業の AI 戦略へのプラスの影響は注目に値します。 SuperNova の出現は、企業に「AI 主権のジレンマ」における新たな選択肢も提供します。