افتتح Deepseek رسميًا حسابًا رسميًا على منصة Zhihu وأصدر مقالًا تقنيًا "نظرة عامة على نظام الاستدلال Deepseek-V3/R1". تكشف هذه المقالة عن تفاصيل التحسين ومعلومات الهامش الربحي من حيث التكلفة لنظام الاستدلال النموذجية لأول مرة ، مما يمثل النهاية الناجحة لأسبوع Deepseek Open Source Week ". هذه الخطوة لا توضح فقط التراكم العميق لـ Deepseek في مجال التكنولوجيا ، ولكنه يوفر أيضًا مرجعًا قيمة لهذه الصناعة.

تقدم المقالة هدفين متعمقين لتحسين الأساسيين لنظام الاستدلال Deepseek-V3/R1: "إنتاجية أكبر وانخفاض الكمون". لتحقيق هذه الأهداف ، تتبنى Deepseek تقنية التوازي الخبراء على نطاق واسع (EP) ، على الرغم من أن هذه التكنولوجيا تزيد من تعقيد النظام. تركز المقالة على كيفية استخدام تقنية EP لزيادة حجم الدُفعة ، وإخفاء وقت الإرسال ، وتحقيق موازنة التحميل ، وبالتالي تحسين الأداء الكلي للنظام.
وتجدر الإشارة بشكل خاص ، نادراً ما تكشف Deepseek عن بيانات هامش التكلفة والربح. تم الكشف عن المقال: "بافتراض أن تكلفة تأجير GPU هي 2 دولار أمريكي في الساعة ، فإن التكلفة الإجمالية هي 87،072 دولارًا في اليوم. إذا تم حساب جميع الرموز المميزة وفقًا لتسعير DeepSeek R1 ، فإن إجمالي الإيرادات النظرية في اليوم هو 562،027 دولارًا ، وتكاليف التكلفة هي" التكلفة المرجعية أيضًا ". والمرجع للصناعة.