En la Conferencia GTC el 18 de marzo, el CEO de NVIDIA, Jensen Huang, anunció un plan emocionante para aumentar la velocidad de procesamiento de inteligencia artificial de Deepseek en 30 veces con el software Dynamo recientemente lanzado. La medida es la respuesta de Nvidia a la agitación del mercado causada por el programa de inteligencia artificial R1 de Deepseek. La tecnología de Deepseek puede reducir significativamente la cantidad de cálculo requerida para cada consulta, lo que lleva a los inversores a expresar preocupaciones sobre las perspectivas futuras de Nvidia.

El software Dynamo de NVIDIA puede asignar tareas de inferencia AI a hasta 1,000 GPU en procesamiento paralelo, mejorando en gran medida el rendimiento de la consulta. Huang Renxun dijo que utilizando el nuevo chip Blackwell, Dynamo puede proporcionar 30 veces la potencia de procesamiento bajo la misma arquitectura. Esta mejora de la capacidad permite que los centros de datos de IA procesen más tokens por segundo, aumentando así los ingresos generales.
Específicamente, el software Dynamo puede aumentar el procesamiento por segundo a un precio de $ 1 por millón de tokens. Esto significa que los proveedores de servicios pueden optar por procesar las consultas de más clientes al mismo tiempo, o proporcionar servicios más fuertes a un solo usuario, cobrando así tarifas más altas. NVIDIA llama a este servicio de IA de alto rendimiento la "fábrica de IA".
Para mejorar aún más el rendimiento de Deepseek, Nvidia también ha lanzado la versión Tweaked Deepseek R1 en Huggingface. Esta versión utiliza menos recuentos de bits calculados, a saber, "FP4", lo que mejora en gran medida el rendimiento sin reducir significativamente la precisión del modelo.
Además de Dynamo, NVIDIA también ha lanzado la última versión del chip Blackwell "Ultra", que mejora la capacidad de memoria y el rendimiento general. Además, NVIDIA ha lanzado oficialmente el DGX Spark, una pequeña computadora personal para desarrolladores de IA, y ha actualizado la configuración de la computadora de escritorio de la estación DGX.
En esta conferencia, NVIDIA también presentó varios otros productos nuevos y proyectos de colaboración, incluidos los interruptores de red mejorados y los modelos de software para robots médicos, que demuestran las continuas capacidades de innovación de NVIDIA en los campos de IA e informática.
Puntos clave:
Nvidia lanza el software Dynamo, que aumenta la velocidad de procesamiento de Deepseek AI en 30 veces.
A través de Dynamo, los proveedores de servicios pueden manejar las consultas de los clientes de manera más eficiente y aumentar los ingresos.
La nueva versión de Blackwell Chip "Ultra" y DGX Spark Computers también se lanzaron oficialmente en la conferencia.