月之暗面Kimi智能助手發布了新一代數學推理模型k0-math,並在多個數學基準測試中取得了優異成績,超越了OpenAI o1系列的部分模型。 k0-math在中考、高考、考研以及MATH測試中表現突出,尤其在MATH測試中得分高達93.8,僅次於o1完全版的94.8分。該模型採用全新的強化學習和思維鏈推理技術,模擬人腦的思考過程,提升了其解決數學難題的能力。雖然在競賽級別的測試中還有提升空間,但k0-math展現了巨大的潛力。

特別是在MATH測試中,k0-math模型得分93.8,僅次於o1完全版的94.8分。儘管在競賽級別的OMNI-MATH和AIME基準測試中,k0-math初代模型的表現分別達到了o1-mini最高成績的90%和83%,但公司計劃持續迭代,以提升更難題目的解題能力。
k0-math模型採用了全新的強化學習和思維鏈推理技術,通過模擬人腦的思考和反思過程,大幅提升了解決數學難題的能力。
該模型在解題過程中會花費更多時間進行推理,包括思考和規劃思路,並在必要時自行反思改進解題思路,以提升答題成功率。
儘管k0-math模型在解答大部分有難度的數學題方面表現出色,但當前版本還無法解答LaTeX格式難以描述的幾何圖形類問題,且對於過於簡單的數學問題可能會過度思考,對高考難題和IMO題目也有一定概率做錯。
k0-math的推出標誌著月之暗面Kimi在AI數學推理領域取得了重要進展,未來將持續改進,力求在更高級別的數學挑戰中取得突破。 其獨特的思維鏈推理技術也為人工智能發展提供了新的思路。