DeepSeek在知乎平台上正式开设了官方账号,并发布了《DeepSeek-V3/R1推理系统概览》技术文章。这篇文章首次详细披露了其模型推理系统的优化细节和成本利润率信息,标志着备受关注的"DeepSeek开源周"圆满结束。这一举措不仅展示了DeepSeek在技术领域的深厚积累,也为行业提供了宝贵的参考。

文章深入介绍了DeepSeek-V3/R1推理系统的两大核心优化目标:"更大的吞吐,更低的延迟"。为了实现这些目标,DeepSeek采用了大规模跨节点专家并行(EP)技术,尽管这一技术增加了系统的复杂性。文章重点阐述了如何利用EP技术来增加批量大小、隐藏传输耗时以及实现负载均衡,从而显著提升系统的整体性能。
特别值得注意的是,DeepSeek罕见地公开了其成本和利润率数据。文章披露:"假定GPU租赁成本为2美金/小时,总成本为$87,072/天。如果所有tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入为$562,027,成本利润率545%。"这一数据的公开不仅展示了DeepSeek在成本控制方面的卓越能力,也为行业提供了宝贵的参考和借鉴。