공식 실리콘 기반 유동성 Weibo는 최근 실리콘 클라우드 플랫폼의 DeepSeek-R1 및 V3 API가 배치 추론을 지원한다는 중요한 발표를 발표했습니다. 이 새로운 기능의 출시는 인공 지능 서비스 분야에서 실리콘 기반 흐름의 또 다른 주요 획기적인 획기적인 획기적인 것입니다.
배치 API를 통해 사용자는 실시간 추론 속도 제한에 대해 걱정하지 않고 실리콘 클라우드 플랫폼에 다량의 데이터 처리 요청을 보낼 수 있습니다. 공식 소개에 따르면, 배치 추론 작업은 24 시간 이내에 완료 될 것으로 예상되며, 데이터 처리 효율이 크게 향상됩니다. 더 흥미로운 것은 DeepSeek-V3 배치 추론의 가격이 실시간 추론에 비해 직접 50% 감소한다는 것입니다. 또한 3 월 11 일부터 3 월 18 일까지 DeepSeek-R1 배치 추론은 75% 할인 활동을 시작했으며 입력 가격은 1 위안/백만 토큰에 불과했으며 출력 가격은 4 위안/백만 토큰으로 떨어졌습니다.
배치 추론 기능의 도입은 사용자에게 대규모 데이터 작업을 처리하기위한보다 효율적인 솔루션을 제공합니다. 보고서 생성, 데이터 청소 또는 데이터 분석 수행, 모델 성능 평가 및 기타 시나리오를 수행하든이 새로운 기능은 중요한 역할을 할 수 있습니다. 특히 실시간 응답이 필요하지 않은 데이터 처리 작업에 적합하므로 사용자는 더 적은 비용으로 DeepSeek-R1 및 V3 API의 고품질 서비스를 즐길 수 있습니다.
