Kunlun Wanwei はシンガポールの南洋理工大学と協力し、既存の大規模モデルの推論能力を大幅に向上できる Q* と呼ばれるアルゴリズムの開発に成功しました。この画期的な開発により、コンピューティング リソースの需要を大幅に削減しながら、小規模なモデルが数十倍、さらには数百倍のパラメータを持つモデルの推論能力に達するか、さらにはそれを超えることが可能になります。 Q* アルゴリズムの出現は、人工知能の広範な応用に新たな章を開き、効率的な知能の新時代の到来を告げています。この研究結果は論文「Q*: Improving Multi-step Reasoning for LLMs with Deliberative Planning」として公開されており、詳細な技術的説明が提供されています。

研究者らは、大規模な言語モデルの推論軌跡をいくつかの状態に分解し、A* 検索アルゴリズムを使用して全体的な計画を達成することで、推論タスクにおけるオープンソース モデルのパフォーマンスを巧みに向上させました。パスコスト関数と累積報酬関数を定義することにより、過去の状態の収益と将来の期待収益を包括的に考慮することができ、実験ではいくつかの有名なモデルを超える大幅な精度の向上が達成されました。現在、Q* の研究はまだ初期段階にありますが、将来的には国内のオープンソース モデルの推論能力をさらに向上させ、人工知能技術の発展にさらに貢献することが期待されています。
具体的には、Q* は、過去の状態の収益と将来の期待収益を包括的に考慮して推論プロセスを最適化します。実験結果は、Q* が複数のデータセットで大幅なパフォーマンス向上を達成したことを示しており、これは人工知能技術の進歩に新たな方向性をもたらします。
現在、Q* に関する研究はまだ初期段階にあり、改善の余地がまだあります。今後も、崑崙万偉は国内のオープンソースモデルの推論能力を向上させ、人工知能技術の開発にさらなる可能性をもたらすために徹底的な研究を続けていきます。
論文リンク:
https://arxiv.org/abs/2406.14283
Q* アルゴリズムの開発の成功は、人工知能の分野における重要な進歩を示しており、人工知能技術の将来の発展の方向性を示しており、より多くの分野での応用と画期的な進歩に期待する価値があります。