月之暗面Kimi智慧助理重磅發表新一代數學推理模型k0-math!該模型在多項數學基準測試中表現優異,超越了OpenAI o1系列模型,尤其在MATH測驗中得分高達93.8,展現了其強大的數學推理能力。 Downcodes小編帶你深入了解k0-math模型的各項效能及未來發展計畫。
月之暗面Kimi智慧助理宣布推出新一代數學推理模型k0-math。 k0-math模型在多項數學基準能力測驗中表現突出,其成績在中考、高考、考研以及包含入門競賽題的MATH等4個數學基準測試中超過了OpenAI o1系列的o1-mini和o1-preview模型。

特別是在MATH測驗中,k0-math模型得分93.8,僅次於o1完全版的94.8分。儘管在競賽級別的OMNI-MATH和AIME基準測試中,k0-math初代模型的表現分別達到了o1-mini最高成績的90%和83%,但公司計劃持續迭代,以提升更難題目的解題能力。
k0-math模型採用了全新的強化學習和思考鏈推理技術,透過模擬人腦的思考和反思過程,大幅提升了解決數學難題的能力。
此模型在解題過程中會花費更多時間進行推理,包括思考和規劃思路,並在必要時自行反思改進解題思路,以提升答題成功率。
儘管k0-math模型在解答大部分有難度的數學題方面表現出色,但當前版本還無法解答LaTeX格式難以描述的幾何圖形類問題,且對於過於簡單的數學問題可能會過度思考,對高考難題和IMO題目也有一定機率做錯。
k0-math模型的推出標誌著月之暗面Kimi智慧助理在人工智慧領域取得了新的突破,未來,該模型將持續迭代升級,以期在更廣泛的領域發揮作用,為用戶提供更強大的數學輔助工具。期待k0-math模型未來在解決更複雜數學問題上的表現!