國產開源大模型DeepSeek R1 發布，性能超越o1模型、成本降90% - AI文章

作者：Eve Cole 更新時間：2025-01-28 13:00:02

中國DeepSeek團隊開源的大模型R1，在效能和成本方面都展現出令人矚目的優勢，引發全球科技界的廣泛關注。其在多項權威測驗中超越了OpenAI的o1模型，尤其在數學和程式設計領域表現突出，並以極低的成本優勢脫穎而出，成為開源大模型領域的一匹黑馬。 R1的開源，不僅彰顯了中國在大模型技術領域的突破，也為全球AI發展注入了新的活力。

正文:近期，中國的DeepSeek 團隊重磅推出了其最新開源大模型R1，受到了廣泛關注。 R1模型的表現表現極為出色，在多項測驗中均超越了OpenAI 的o1模型，尤其是在數學和程式設計方面的評估中表現優異。

在最新的美國AIME2024測試中，R1以79.8分的成績超越o1的79.2分。在MATH-500測試中，R1獲得了97.3分，同樣領先o1的96.4分。此外，在SWE-bench Verified 測試中，R1得分為49.2，也超過了o1的48.9分。雖然在程式測試Codeforces 中，R1僅比o1低0.3分，但整體效能與o1模型相當。

除了性能，R1的成本優勢更為引人注目。 OpenAI 的o1模型每100萬tokens 的輸入費用高達15美元，而R1的費用僅為0.14美元，成本降低了90%。在產出方面，o1的費用為60美元每100萬tokens，而R1僅需2.19美元，降低幅度達27倍。這一巨大的成本差異，讓R1在開源大模型領域中脫穎而出。

在DeepSeek 團隊宣布R1開源後，許多國外網友紛紛表達了對此模型的讚嘆，認為R1在性價比和效能方面都超越了Meta、Mistral 等老牌開源平台。許多人表示，R1模型的高效推理能力使其在程式碼編寫和數學解釋等方面表現優異，甚至有用戶稱其為「最像人類內心獨白的模型」。同時，蘋果公司的機器學習研究員Awni Hannun 也對R1進行了測試，發現其在蘋果M2Ultra 上運作迅速且推理效率高。

R1模型的開發經歷了多個階段的訓練流程，包括冷啟動資料和多階段訓練，以提高其推理能力和可讀性。這些技術改進確保了R1模型在各種任務中的卓越表現。

隨著R1的發布，中國的開源大模型在國際市場上再次引起了極大的關注與討論，許多技術愛好者對此模型的潛力表示期待。 R1的發布標誌著中國在大模型技術領域的進一步突破，推動了開源技術的發展。

開源位址:https://huggingface.co/deepseek-ai/R1

API:https://api-docs.deepseek.com/guides/reasoning_model

劃重點:

R1模型在多項測試中超越OpenAI 的o1，顯示出卓越的性能表現。

R1的輸入和輸出成本分別低至0.14美元和2.19美元，成本降低幅度達90%。

R1開源後受到廣泛關注，許多國外專家對其性能表示讚賞，認為其性價比超高。

R1的出現，不僅為開發者提供了一個高性能、低成本的強大工具，也預示著中國在人工智慧領域持續創新和競爭力的提升。期待R1在未來能為更多領域帶來突破性進展。