硅基流动 SiliconCloud 平台近日宣布推出 DeepSeek-R1& V3API 的批量推理(Batch Inference)功能,为用户提供更高效的大规模数据处理解决方案。通过这一功能,用户可以向平台发送批量请求,摆脱实时推理速率的限制,并在24小时内完成数据处理任务。这一功能的推出,标志着 SiliconCloud 在人工智能服务领域的进一步创新。
此次更新不仅带来了功能上的提升,还伴随着价格的大幅下调。DeepSeek-V3批量推理的价格相比实时推理降低了50%,为用户节省了大量成本。此外,在3月11日至3月18日期间,DeepSeek-R1批量推理更是推出了限时优惠,输入价格仅为1元/百万 Tokens,输出价格为4元/百万 Tokens,降幅高达75%。这一优惠政策无疑为用户提供了更具性价比的选择。

批量推理功能的推出,旨在满足用户在处理生成报告、数据清洗等大批量任务时的需求。与实时推理相比,批量推理更适合无需即时响应的场景,如数据分析、模型性能评估等。通过这一功能,用户可以在更短的时间内完成复杂的数据处理任务,同时享受更低的成本。
值得一提的是,DeepSeek-R1& V3API 此前已经支持了多项功能,包括 Function Calling、JSON Mode、Prefix 和 FIM 等。此外,Pro 版 DeepSeek-R1& V3API 的 TPM(每分钟处理的 Token)上限已从1万提升至100万,进一步增强了其处理能力。这些更新使得 SiliconCloud 平台在人工智能服务领域更具竞争力,为用户提供了更强大的技术支持。