La liquidez oficial de Liquidity Weibo lanzó recientemente un anuncio importante que anunció que las API Deepseek-R1 y V3 de su plataforma SilicOncloud ahora admiten inferencia por lotes. El lanzamiento de esta nueva característica marca otro gran avance en el flujo basado en silicio en el campo de los servicios de inteligencia artificial.
A través de la API por lotes, los usuarios pueden enviar grandes cantidades de solicitudes de procesamiento de datos a la plataforma SilicOncloud sin preocuparse por la limitación de la tasa de inferencia en tiempo real. Según la introducción oficial, se espera que las tareas de inferencia por lotes se completen dentro de las 24 horas, mejorando enormemente la eficiencia del procesamiento de datos. Lo que es aún más emocionante es que el precio de la inferencia de lotes Deepseek-V3 se reduce directamente en un 50% en comparación con la inferencia en tiempo real. Además, del 11 de marzo al 18 de marzo, el razonamiento de lotes Deepseek-R1 Deepseek-R1 lanzó una actividad de descuento del 75%, con el precio de entrada solo 1 yuania/millones de tokens, y el precio de salida también cayó a 4 yuanes/millones de tokens.
La introducción de la función de inferencia por lotes proporciona a los usuarios soluciones más eficientes para manejar tareas de datos a gran escala. Ya sea que genere informes, limpiando datos o realización de análisis de datos, evaluación del rendimiento del modelo y otros escenarios, esta nueva función puede desempeñar un papel importante. Especialmente adecuado para tareas de procesamiento de datos que no requieren respuesta en tiempo real, lo que permite a los usuarios disfrutar de los servicios de alta calidad de la API DeepSeek-R1 y V3 a un costo menor.
