Kimi推出數學推理模型k0-math：數學能力對標OpenAI o1系列- AI文章

作者：Eve Cole 更新時間：2025-02-12 05:32:02

月之暗面Kimi智能助手發布了新一代數學推理模型k0-math，並在多個數學基準測試中取得了優異成績，超越了OpenAI o1系列的部分模型。 k0-math在中考、高考、考研以及MATH測試中表現突出，尤其在MATH測試中得分高達93.8，僅次於o1完全版的94.8分。該模型採用全新的強化學習和思維鏈推理技術，模擬人腦的思考過程，提升了其解決數學難題的能力。雖然在競賽級別的測試中還有提升空間，但k0-math展現了巨大的潛力。

微信截图_20241118075443.png

特別是在MATH測試中，k0-math模型得分93.8，僅次於o1完全版的94.8分。儘管在競賽級別的OMNI-MATH和AIME基準測試中，k0-math初代模型的表現分別達到了o1-mini最高成績的90%和83%，但公司計劃持續迭代，以提升更難題目的解題能力。

k0-math模型採用了全新的強化學習和思維鏈推理技術，通過模擬人腦的思考和反思過程，大幅提升了解決數學難題的能力。

該模型在解題過程中會花費更多時間進行推理，包括思考和規劃思路，並在必要時自行反思改進解題思路，以提升答題成功率。

儘管k0-math模型在解答大部分有難度的數學題方面表現出色，但當前版本還無法解答LaTeX格式難以描述的幾何圖形類問題，且對於過於簡單的數學問題可能會過度思考，對高考難題和IMO題目也有一定概率做錯。

k0-math的推出標誌著月之暗面Kimi在AI數學推理領域取得了重要進展，未來將持續改進，力求在更高級別的數學挑戰中取得突破。其獨特的思維鏈推理技術也為人工智能發展提供了新的思路。