AI21 が、256K のコンテキスト長をサポートする世界初の Mamba の実稼働レベルモデル Jamba をリリース

著者：Eve Cole 更新時間：2025-02-20 12:00:03

最近、いくつかの大手人工知能企業が大規模言語モデルの分野で大きな進歩を遂げ、モデルのパフォーマンスとユーザーエクスペリエンスの向上を目的とした新しいモデルと機能を発表しました。これらのアップデートには、コンテキストの長さの改善、モデルアーキテクチャの改善、エンタープライズレベルのアプリケーションのサポートが含まれており、AI テクノロジーの継続的な進化と成熟を示しています。この記事では、AI21 Labs、Mistral AI、Cohere が最近発表した最新の結果に焦点を当てます。

AI21 は、SSM-Transformer アーキテクチャを採用し、52B のパラメータを持ち、256K のコンテキスト長をサポートする世界初の Mamba 製品レベルモデル Jamba をリリースしました。 Jamba モデルは、SSM テクノロジーと Transformer アーキテクチャを組み合わせており、長いテキストタスクの処理に優れたパフォーマンスを発揮します。 MistralAI は、Mistral7Bv0.2BaseModel を開始し、コンテキストを 32K に増やし、より優れた AI ソリューションを提供するよう努めています。 Cohere は、実稼働規模の人工知能を実装し、企業にスケーラブルな生成モデルを提供することに焦点を当てた Command-R をリリースしました。

これらの新しいモデルのリリースは、人工知能の分野における継続的なイノベーションの活力を示しており、また、大規模な言語モデルが将来的により効率的かつ強力な方向に発展することを示しています。より長いコンテキストウィンドウとより強力なモデルアーキテクチャにより、ユーザーはより豊かなアプリケーションエクスペリエンスを実現し、エンタープライズレベルの AI アプリケーションのためのより強固な基盤を提供します。将来的にはさらなるイノベーションが起こることを楽しみにしています。

AI21 が、256K のコンテキスト長をサポートする世界初の Mamba の実稼働レベル モデル Jamba をリリース

AI21 が、256K のコンテキスト長をサポートする世界初の Mamba の実稼働レベルモデル Jamba をリリース