DeepseekはZhihuプラットフォームで公式アカウントを公式に開設し、技術的な記事「Deepseek-V3/R1 Inference Systemの概要」をリリースしました。この記事では、モデル推論システムの最適化の詳細とコスト営利マージン情報を初めて開示し、高度に見られた「Deepseekオープンソースウィーク」の成功した終わりをマークします。この動きは、テクノロジー分野へのDeepseekの深い蓄積を示しているだけでなく、業界にとって貴重な参照を提供します。

この記事では、DeepSeek-V3/R1推論システムの詳細な2つのコア最適化目標「より大きなスループットと低レイテンシ」を紹介します。これらの目標を達成するために、DeepSeekは大規模なクロスノードエキスパート並列性(EP)テクノロジーを採用していますが、このテクノロジーはシステムの複雑さを高めています。この記事では、EPテクノロジーを使用してバッチサイズを増やし、送信時間を隠し、負荷分散を達成する方法に焦点を当て、それによりシステムの全体的なパフォーマンスを大幅に改善します。
特に注目すべきことに、Deepseekはコストと利益率のデータを開示することはめったにありません。記事には、「GPUレンタルコストが1時間あたり2米ドルであると仮定すると、総費用は1日あたり87,072ドルです。すべてのトークンがDeepSeek R1の価格に従って計算される場合、理論的な総収益は562,027ドルであり、費用利益は545%だけではなく、費用がかかります。業界への参照。