Der auf Siliziumbasis basierende Flow kündigt Deepseek-R1 & V3 API an

Autor：Eve Cole Aktualisierungszeit：2025-05-23 20:50:02

Die Siliconcloud-Plattform hat kürzlich den Start der Batch-Inferenzfunktion von Deepseek-R1 & V3API angekündigt und den Benutzern effizientere Lösungen für die Datenverarbeitung mit großräumigen Daten zur Verfügung gestellt. Durch diese Funktion können Benutzer Stapelanforderungen an die Plattform senden, die Einschränkungen der Echtzeit-Inferenzrate und die Erfüllung von Datenverarbeitungsaufgaben innerhalb von 24 Stunden beseitigen. Die Einführung dieser Funktion markiert weitere Innovationen von Siliconcloud im Bereich der künstlichen Intelligenzdienste.

Dieses Update führte nicht nur zu funktionalen Verbesserungen, sondern auch mit einer erheblichen Preissenkung. Der Preis für Deepseek-V3-Stapel-Inferenz wird im Vergleich zu Echtzeit-Inferenz um 50% gesenkt und den Benutzern viele Kosten einsparen. Darüber hinaus startete Deepseek-R1-Batch-Argumentation vom 11. bis 18. März einen begrenzten Rabatt, wobei der Eingangspreis nur 1 Yuan/Millionen-Token und der Ausgangspreis 4 Yuan/Millionen-Token beträgt, ein Rückgang von 75%. Diese bevorzugte Richtlinie bietet Benutzern zweifellos eine kostengünstigere Wahl.

Der Start der Batch-Argumentationsfunktion ist so konzipiert, dass sie die Bedürfnisse der Benutzer bei der Behandlung von Aufgaben wie groß angelegten Berichten und Datenreinigung erfüllen. Im Vergleich zu Echtzeit-Inferenz eignet sich die Batch-Inferenz besser für Szenarien, die keine sofortige Reaktion erfordern, z. B. Datenanalyse, Modellleistung für die Modellleistung usw. Durch diese Funktion können Benutzer komplexe Datenverarbeitungsaufgaben in kürzerer Zeit erledigen und gleichzeitig niedrigere Kosten genießen.

Es ist erwähnenswert, dass Deepseek-R1 & V3API zuvor eine Reihe von Funktionen unterstützt hat, einschließlich Funktionsaufruf, JSON-Modus, Präfix und FIM. Darüber hinaus wurde die TPM (Token pro Minute verarbeitet) der Pro-Version von Deepseek-R1 & V3API von 10.000 auf 1 Million erhöht, was seine Verarbeitungsleistung weiter verbessert. Diese Updates machen die Siliconcloud -Plattform im Bereich der künstlichen Intelligenzdienste wettbewerbsfähiger und bieten den Benutzern eine stärkere technische Unterstützung.