SiliconCloud 플랫폼은 최근 DeepSeek-R1 & V3API의 배치 추론 기능의 출시를 발표하여 사용자에게보다 효율적인 대규모 데이터 처리 솔루션을 제공합니다. 이 기능을 통해 사용자는 배치 요청을 플랫폼으로 보내고 실시간 추론 속도의 한계를 제거하고 24 시간 이내에 데이터 처리 작업을 완료 할 수 있습니다. 이 기능의 출시는 인공 지능 서비스 분야에서 SiliconCloud의 추가 혁신을 나타냅니다.
이 업데이트는 기능적 개선을 가져 왔을뿐만 아니라 상당한 가격 인하를 수반했습니다. DeepSeek-V3 배치 추론의 가격은 실시간 추론에 비해 50% 감소하여 사용자에게 많은 비용을 절약 할 수 있습니다. 또한 3 월 11 일부터 3 월 18 일까지 DeepSeek-R1 배치 추론은 제한된 시간 할인을 시작했으며 입력 가격은 1 위안/백만 토큰에 불과하며 출력 가격은 4 위안/백만 토큰으로 75%감소했습니다. 이 우선 정책은 의심 할 여지없이 사용자에게보다 비용 효율적인 선택을 제공합니다.

배치 추론 기능의 출시는 보고서 생성 및 데이터 청소와 같은 대규모 작업을 처리 할 때 사용자의 요구를 충족하도록 설계되었습니다. 실시간 추론과 비교할 때 배치 추론은 데이터 분석, 모델 성능 평가 등과 같이 즉각적인 응답이 필요하지 않은 시나리오에 더 적합합니다.이 기능을 통해 사용자는 더 짧은 시간 내에 복잡한 데이터 처리 작업을 완료하면서 비용이 적게 듭니다.
DeepSeek-R1 & V3api는 이전에 기능 호출, JSON 모드, 접두사 및 FIM을 포함한 여러 기능을 지원했음을 언급 할 가치가 있습니다. 또한, DeepSeek-R1 & V3API의 Pro 버전의 TPM (분당 처리 된 토큰) 캡은 10,000에서 1 백만으로 증가하여 처리 전력을 더욱 향상 시켰습니다. 이러한 업데이트는 인공 지능 서비스 분야에서 SiliconCloud 플랫폼을 경쟁력있게 만들고 사용자에게 더 강력한 기술 지원을 제공합니다.