A Deepseek abriu oficialmente uma conta oficial na plataforma Zhihu e lançou um artigo técnico "Visão geral do sistema de inferência Deepseek-V3/R1". Este artigo divulga os detalhes da otimização e as informações de margem de lucro de custo de seu sistema de inferência de modelo pela primeira vez, marcando o final bem-sucedido da altamente assistida "Deepseek Open Source Week". Esse movimento não apenas demonstra o profundo acúmulo de Deepseek no campo da tecnologia, mas também fornece uma referência valiosa para o setor.

O artigo apresenta duas metas de otimização central detalhadas do sistema de inferência Deepseek-V3/R1: "Taxa de transferência maior e menor latência". Para atingir esses objetivos, a DeepSeek adota a tecnologia de paralelismo especialista em larga escala (EP), embora essa tecnologia aumente a complexidade do sistema. O artigo concentra -se em como usar a tecnologia de EP para aumentar o tamanho do lote, ocultar o tempo de transmissão e obter o balanceamento de carga, melhorando significativamente o desempenho geral do sistema.
De maneira particular, a DeepSeek raramente divulga seus dados de margem de custo e lucro. O artigo divulgado: "Supondo que o custo de aluguel da GPU seja de US $ 2 por hora, o custo total é de US $ 87.072 por dia. Se todos os tokens forem calculados de acordo com o preço de R1 de profundidade, a receita total teórica é que a receita total é de US $ 562.027 e a margem de lucro de custo é apenas 545%", o Disclosure é de US $ 562,027, e a margem de lucro é 545%", o Disclosure é de US $ 562,027, e a margem de lucro é de 545%", o Disclosure é de US $ 562,027 e a margem de lucro é 545%", o Disclosure é de US $ 562.027, e a margem de lucro é 545%. referência para a indústria.