Deepseek เปิดบัญชีอย่างเป็นทางการบนแพลตฟอร์ม Zhihu และเผยแพร่บทความทางเทคนิค "ภาพรวมของระบบการอนุมาน Deepseek-V3/R1" บทความนี้เปิดเผยรายละเอียดการเพิ่มประสิทธิภาพและข้อมูลมาร์จิ้นผลกำไรของระบบการอนุมานแบบจำลองเป็นครั้งแรกซึ่งเป็นจุดสิ้นสุดที่ประสบความสำเร็จของ "Deepseek Open Source Week" การเคลื่อนไหวนี้ไม่เพียงแสดงให้เห็นถึงการสะสมลึกของ Deepseek ในสาขาเทคโนโลยี แต่ยังให้การอ้างอิงที่มีค่าสำหรับอุตสาหกรรม

บทความแนะนำเป้าหมายการเพิ่มประสิทธิภาพหลักสองเชิงลึกของระบบการอนุมาน DeepSeek-V3/R1: "ปริมาณงานที่ใหญ่กว่าและเวลาแฝงที่ต่ำกว่า" เพื่อให้บรรลุเป้าหมายเหล่านี้ Deepseek ได้ใช้เทคโนโลยีข้ามความเชี่ยวชาญข้ามโหนดขนาดใหญ่ (EP) เทคโนโลยีแม้ว่าเทคโนโลยีนี้จะเพิ่มความซับซ้อนของระบบ บทความมุ่งเน้นไปที่วิธีการใช้เทคโนโลยี EP เพื่อเพิ่มขนาดแบทช์ซ่อนเวลาการส่งและบรรลุการปรับสมดุลโหลดซึ่งจะช่วยปรับปรุงประสิทธิภาพโดยรวมของระบบอย่างมีนัยสำคัญ
โดยเฉพาะอย่างยิ่งหมายเหตุ Deepseek ไม่ค่อยเปิดเผยข้อมูลต้นทุนและกำไรกำไร บทความที่เปิดเผย: "สมมติว่าค่าเช่า GPU อยู่ที่ 2 ดอลลาร์สหรัฐต่อชั่วโมงค่าใช้จ่ายทั้งหมดคือ $ 87,072 ต่อวันหากโทเค็นทั้งหมดคำนวณตามราคา R1 ที่ลึกลงไปในราคาที่ลดลงเพียง $ 562,027 และการอ้างอิงสำหรับอุตสาหกรรม