中國DeepSeek團隊開源的大模型R1,在效能和成本方面都展現出令人矚目的優勢,引發全球科技界的廣泛關注。其在多項權威測驗中超越了OpenAI的o1模型,尤其在數學和程式設計領域表現突出,並以極低的成本優勢脫穎而出,成為開源大模型領域的一匹黑馬。 R1的開源,不僅彰顯了中國在大模型技術領域的突破,也為全球AI發展注入了新的活力。
正文:近期,中國的DeepSeek 團隊重磅推出了其最新開源大模型R1,受到了廣泛關注。 R1模型的表現表現極為出色,在多項測驗中均超越了OpenAI 的o1模型,尤其是在數學和程式設計方面的評估中表現優異。

在最新的美國AIME2024測試中,R1以79.8分的成績超越o1的79.2分。在MATH-500測試中,R1獲得了97.3分,同樣領先o1的96.4分。此外,在SWE-bench Verified 測試中,R1得分為49.2,也超過了o1的48.9分。雖然在程式測試Codeforces 中,R1僅比o1低0.3分,但整體效能與o1模型相當。
除了性能,R1的成本優勢更為引人注目。 OpenAI 的o1模型每100萬tokens 的輸入費用高達15美元,而R1的費用僅為0.14美元,成本降低了90%。在產出方面,o1的費用為60美元每100萬tokens,而R1僅需2.19美元,降低幅度達27倍。這一巨大的成本差異,讓R1在開源大模型領域中脫穎而出。
在DeepSeek 團隊宣布R1開源後,許多國外網友紛紛表達了對此模型的讚嘆,認為R1在性價比和效能方面都超越了Meta、Mistral 等老牌開源平台。許多人表示,R1模型的高效推理能力使其在程式碼編寫和數學解釋等方面表現優異,甚至有用戶稱其為「最像人類內心獨白的模型」。同時,蘋果公司的機器學習研究員Awni Hannun 也對R1進行了測試,發現其在蘋果M2Ultra 上運作迅速且推理效率高。
R1模型的開發經歷了多個階段的訓練流程,包括冷啟動資料和多階段訓練,以提高其推理能力和可讀性。這些技術改進確保了R1模型在各種任務中的卓越表現。
隨著R1的發布,中國的開源大模型在國際市場上再次引起了極大的關注與討論,許多技術愛好者對此模型的潛力表示期待。 R1的發布標誌著中國在大模型技術領域的進一步突破,推動了開源技術的發展。
開源位址:https://huggingface.co/deepseek-ai/R1
API:https://api-docs.deepseek.com/guides/reasoning_model
劃重點:
R1模型在多項測試中超越OpenAI 的o1,顯示出卓越的性能表現。
R1的輸入和輸出成本分別低至0.14美元和2.19美元,成本降低幅度達90%。
R1開源後受到廣泛關注,許多國外專家對其性能表示讚賞,認為其性價比超高。
R1的出現,不僅為開發者提供了一個高性能、低成本的強大工具,也預示著中國在人工智慧領域持續創新和競爭力的提升。期待R1在未來能為更多領域帶來突破性進展。