La plataforma SilicOncloud anunció recientemente el lanzamiento de la función de inferencia por lotes de Deepseek-R1 y V3API, proporcionando a los usuarios soluciones de procesamiento de datos a gran escala más eficientes. A través de esta función, los usuarios pueden enviar solicitudes por lotes a la plataforma, deshacerse de las limitaciones de la tasa de inferencia en tiempo real y completar las tareas de procesamiento de datos dentro de las 24 horas. El lanzamiento de esta característica marca una mayor innovación de Siliconcloud en el campo de los servicios de inteligencia artificial.
Esta actualización no solo provocó mejoras funcionales, sino que también se acompaña de una reducción significativa de precios. El precio de la inferencia de lotes Deepseek-V3 se reduce en un 50% en comparación con la inferencia en tiempo real, lo que ahorra a los usuarios muchos costos. Además, del 11 de marzo al 18 de marzo, el razonamiento por lotes Deepseek-R1 DeepSeek-R1 lanzó un descuento por tiempo limitado, con el precio de entrada solo 1 yuania/millones de tokens y el precio de salida es de 4 yuanes/millones de tokens, una disminución del 75%. Esta política preferencial indudablemente proporciona a los usuarios una opción más rentable.

El lanzamiento de la función de razonamiento por lotes está diseñado para satisfacer las necesidades de los usuarios al manejar tareas a gran escala, como generar informes y limpieza de datos. En comparación con la inferencia en tiempo real, la inferencia por lotes es más adecuada para escenarios que no requieren una respuesta inmediata, como análisis de datos, evaluación del rendimiento del modelo, etc., a través de esta característica, los usuarios pueden completar tareas complejas de procesamiento de datos en un tiempo más corto mientras disfrutan de costos más bajos.
Vale la pena mencionar que Deepseek-R1 y V3API ha admitido previamente una serie de funciones, incluidas las llamadas de funciones, el modo JSON, el prefijo y el FIM. Además, el límite TPM (token procesado por minuto) de la versión Pro de Deepseek-R1 y V3API ha aumentado de 10,000 a 1 millón, mejorando aún más su potencia de procesamiento. Estas actualizaciones hacen que la plataforma SilicOncloud sea más competitiva en el campo de los servicios de inteligencia artificial y brinda a los usuarios un soporte técnico más fuerte.