Deepseek eröffnete offiziell ein offizielles Konto auf der Zhihu-Plattform und veröffentlichte einen technischen Artikel "Überblick über das Inferenzsystem für Deepseek-V3/R1". In diesem Artikel werden die Optimierungsdetails und die Gewinnrandinformationen seines Modellinferenzsystems zum ersten Mal offengelegt und das erfolgreiche Ende der hoch angezeigten "Deepseek Open Source Week" markiert. Dieser Schritt zeigt nicht nur die tiefe Akkumulation von Deepseek im technologischen Bereich, sondern liefert auch eine wertvolle Referenz für die Branche.

Der Artikel führt ausführliche zwei Kernoptimierungsziele des Deepseek-V3/R1-Inferenzsystems ein: "größerer Durchsatz und niedrigere Latenz". Um diese Ziele zu erreichen, nimmt Deepseek eine groß angelegte Cross-Node-Experten-Parallelismus (EP) -Technologie (EP) ein, obwohl diese Technologie die Komplexität des Systems erhöht. Der Artikel konzentriert sich darauf, wie die EP -Technologie verwendet wird, um die Chargengröße zu erhöhen, die Übertragungszeit auszublenden und einen Lastausgleich zu erreichen, wodurch die Gesamtleistung des Systems erheblich verbessert wird.
Besonders hervorzuheben ist, dass Deepseek seine Kosten- und Gewinnmargendaten selten offenlegt. Der Artikel enthüllte: "Unter der Annahme, dass die GPU -Mietkosten 2 USD pro Stunde betragen, betragen die Gesamtkosten 87.072 USD pro Tag. Wenn alle Token gemäß den Preisgestaltung von Deepseek R1 berechnet werden, beträgt der theoretische Gesamtumsatz pro Tag 562.027 US -Dollar. Referenz und Referenz für die Branche.