月の暗い側の研究者である洪水Sungは、最近10,000語の長い記事を公開しました。これは、K1.5モデルの研究開発のアイデアを初めて明らかにし、OpenaiのO1によってもたらされる技術的意味を深く反映しています。モデル。この開示は、人工知能の分野における月の暗黒面の最新の進歩を明らかにするだけでなく、業界に貴重な技術的リファレンスを提供します。
Flood Sungは、記事で、ロングコット(ロングチェーン思考)の重要性は、1年以上前にThe Dark Side of the Moonの共同設立者であるTim Zhou Xinyuによって実際に検証されたと述べました。小さなモデルを使用してマルチ桁の操作をトレーニングし、細粒のコンピューティングプロセスをSFTの長鎖思考データ(監視施設微調整)に変換することにより、チームは重要な結果を達成しました。この発見は、その後のモデルの最適化の重要な理論的根拠を提供します。

ただし、コストの制限により、月の暗い側は以前に長いコンテキストの最適化に焦点を当ててきました(長いテキスト入力)。 Flood Sungは、長いコンテキストが主に入力を処理し、Prefill Prefilling and Mooncakeテクノロジーを通じて、チームはコストと速度をより適切に制御できると説明しました。対照的に、ロングコットは出力により重点を置いており、重要ですが、より高いコストとより長い処理時間が必要であり、適用がある程度制限されます。
ただし、OpenAI O1モデルのリリースにより、Dark Sideチームは技術的方向性の優先順位を再考しました。 Flood Sungは、「パフォーマンスは最も重要なものであり、コストと速度は技術の進歩で継続的に最適化されます。この理解に基づいて、鍵は月の暗い側面を包括的に促進し始めました。 - コット研究。この戦略的調整は、人工知能の分野のチームにとってさらにブレークスルーを示しています。
この技術的な復号化の記事のリリースは、月の暗い側がOpenaiのO1モデルを体系的にベンチマークし始めただけでなく、関連分野でかなりの研究を行っていることを示しています。 Flood Sungの長い記事は、業界に詳細な技術的洞察を提供し、将来の研究の方向性に関する新しいアイデアを提供します。
O1モデルの亀裂プロセスを詳細に理解したい読者の場合、Flood Sungの10,000ワードの長い記事には、次のリンクからアクセスできます。O1クラッキングプロセスの10,000ワードの長い記事を復号化します。