Deepseek a officiellement ouvert un compte officiel sur la plate-forme Zhihu et a publié un article technique "Aperçu du système d'inférence Deepseek-V3 / R1". Cet article révèle les détails d'optimisation et les informations sur la marge à but lucratif de son système d'inférence du modèle pour la première fois, marquant la fin de la fin de la "semaine open source Deepseek". Cette décision démontre non seulement l'accumulation profonde de Deepseek dans le domaine de la technologie, mais fournit également une référence précieuse pour l'industrie.

L'article introduit deux objectifs d'optimisation de base en profondeur du système d'inférence Deepseek-V3 / R1: "Support plus grand et latence inférieure". Pour atteindre ces objectifs, Deepseek adopte la technologie de parallélisme expert à grande échelle (EP), bien que cette technologie augmente la complexité du système. L'article se concentre sur la façon d'utiliser la technologie EP pour augmenter la taille des lots, masquer le temps de transmission et atteindre l'équilibrage de la charge, améliorant ainsi considérablement les performances globales du système.
Il convient de noter en particulier révèle rarement ses données de coût et de marge bénéficiaire. L'article a révélé: "En supposant que le coût de location du GPU est de 2 $ US de l'heure, le coût total est de 87 072 $ par jour. Si tous les jetons sont calculés en fonction de la tarification de Deepseek R1, le chiffre d'affaires total théorique est de 562,027 $, et la marge de bénéfice des coûts est de 545%, mais la référence de la divulgation de ces données démontre non seulement la capacité exceptionnelle de DeepSeEk, mais aussi la référence de cette référence de cette référence, mais la maîtrise de la référence de ces données démontrent non seulement la capacité exceptionnelle de Deepsek. et référence pour l'industrie.