矽基流動官方微博近日發布了一項重要公告,宣布其SiliconCloud平台的DeepSeek-R1和V3API現已支持批量推理(Batch Inference)功能。這一新功能的推出,標誌著矽基流動在人工智能服務領域的又一次重大突破。
通過批量API,用戶可以向SiliconCloud平台發送大量數據處理請求,而無需擔心實時推理速率限制的問題。根據官方介紹,批量推理任務預計可在24小時內完成,極大地提高了數據處理的效率。更令人振奮的是,DeepSeek-V3批量推理的價格相比實時推理直接降低了50%。此外,在3月11日至3月18日期間,DeepSeek-R1批量推理更是推出了75%的優惠活動,輸入價格僅為1元/百萬Tokens,輸出價格也降至4元/百萬Tokens。
批量推理功能的推出,為用戶處理大批量數據任務提供了更高效的解決方案。無論是生成報告、數據清洗,還是進行數據分析、模型性能評估等場景,這項新功能都能發揮重要作用。特別適用於那些不需要實時響應的數據處理任務,讓用戶能夠以更低的成本享受DeepSeek-R1和V3API的優質服務。
