Deepseek abrió oficialmente una cuenta oficial en la plataforma Zhihu y publicó un artículo técnico "Descripción general del sistema de inferencia Deepseek-V3/R1". Este artículo revela los detalles de optimización y la información de margen de beneficio de costo de su sistema de inferencia de modelos por primera vez, marcando el final exitoso de la muy observada "Semana de código abierto". Este movimiento no solo demuestra la acumulación profunda de Deepseek en el campo de la tecnología, sino que también proporciona una referencia valiosa para la industria.

El artículo presenta dos objetivos de optimización de dos núcleos del sistema de inferencia Deepseek-V3/R1: "Mayor rendimiento y menor latencia". Para lograr estos objetivos, Deepseek adopta la tecnología de paralelismo de expertos en nodos cruzados (EP) a gran escala, aunque esta tecnología aumenta la complejidad del sistema. El artículo se centra en cómo usar la tecnología EP para aumentar el tamaño de lotes, ocultar el tiempo de transmisión y lograr el equilibrio de carga, mejorando significativamente el rendimiento general del sistema.
De particular, Deepseek rara vez revela sus datos de costo y margen de beneficio. El artículo revelado: "Suponiendo que el costo de alquiler de GPU es de US $ 2 por hora, el costo total es de $ 87,072 por día. Si todos los tokens se calculan de acuerdo con el precio de Deepseek R1, el ingreso total teórico por día es de $ 562,027 y el margen de ganancias de costo es 545%". y referencia para la industria.