矽基流動SiliconCloud 平台近日宣布推出DeepSeek-R1& V3API 的批量推理(Batch Inference)功能,為用戶提供更高效的大規模數據處理解決方案。通過這一功能,用戶可以向平台發送批量請求,擺脫實時推理速率的限制,並在24小時內完成數據處理任務。這一功能的推出,標誌著SiliconCloud 在人工智能服務領域的進一步創新。
此次更新不僅帶來了功能上的提升,還伴隨著價格的大幅下調。 DeepSeek-V3批量推理的價格相比實時推理降低了50%,為用戶節省了大量成本。此外,在3月11日至3月18日期間,DeepSeek-R1批量推理更是推出了限時優惠,輸入價格僅為1元/百萬Tokens,輸出價格為4元/百萬Tokens,降幅高達75%。這一優惠政策無疑為用戶提供了更具性價比的選擇。

批量推理功能的推出,旨在滿足用戶在處理生成報告、數據清洗等大批量任務時的需求。與實時推理相比,批量推理更適合無需即時響應的場景,如數據分析、模型性能評估等。通過這一功能,用戶可以在更短的時間內完成複雜的數據處理任務,同時享受更低的成本。
值得一提的是,DeepSeek-R1& V3API 此前已經支持了多項功能,包括Function Calling、JSON Mode、Prefix 和FIM 等。此外,Pro 版DeepSeek-R1& V3API 的TPM(每分鐘處理的Token)上限已從1萬提升至100萬,進一步增強了其處理能力。這些更新使得SiliconCloud 平台在人工智能服務領域更具競爭力,為用戶提供了更強大的技術支持。