Lors de la conférence du GTC, le 18 mars, le PDG de Nvidia, Jensen Huang, a annoncé un plan passionnant pour augmenter la vitesse de traitement de l'intelligence artificielle de Deepseek à 30 fois avec le nouveau logiciel Dynamo. Cette décision est la réponse de Nvidia aux troubles du marché causés par le programme d'intelligence artificielle R1 de Deepseek. La technologie de Deepseek est en mesure de réduire considérablement la quantité de calcul requise pour chaque requête, ce qui a conduit les investisseurs à exprimer ses préoccupations concernant les perspectives futures de Nvidia.

Le logiciel Dynamo de NVIDIA peut allouer des tâches d'inférence AI à jusqu'à 1 000 GPU dans le traitement parallèle, améliorant considérablement le débit de requête. Huang Renxun a déclaré qu'à l'aide de la nouvelle puce Blackwell, Dynamo est en mesure de fournir 30 fois la puissance de traitement sous la même architecture. Cette amélioration des capacités permet aux centres de données d'IA de traiter plus de jetons par seconde, augmentant ainsi les revenus globaux.
Plus précisément, le logiciel Dynamo peut augmenter le traitement par seconde à un prix de 1 $ par million de jetons. Cela signifie que les fournisseurs de services peuvent choisir de traiter les requêtes de plus de clients en même temps, ou fournir des services plus forts à un seul utilisateur, facturant ainsi des frais plus élevés. Nvidia appelle ce service AI haute performance «l'usine AI».
Pour améliorer davantage les performances de Deepseek, Nvidia a également publié la version Deepseek R1 modifiée sur HuggingFace. Cette version utilise moins de dénombrements de bits calculés, à savoir "FP4", ce qui améliore considérablement les performances sans réduire considérablement la précision du modèle.
En plus de Dynamo, Nvidia a également lancé la dernière version de la puce Blackwell "Ultra", qui améliore la capacité de la mémoire et les performances globales. De plus, NVIDIA a officiellement publié le DGX Spark, un petit ordinateur personnel pour les développeurs AI et mis à jour la configuration de l'ordinateur de bureau DGX Station.
Lors de cette conférence, NVIDIA a également présenté plusieurs autres nouveaux produits et projets de collaboration, notamment des commutateurs réseau et des modèles de logiciels améliorés pour les robots médicaux, démontrant les capacités continues de l'innovation de NVIDIA dans les domaines de l'IA et de l'informatique.
Points clés:
NVIDIA lance Dynamo Software, qui augmente la vitesse de traitement de Deepseek AI de 30 fois.
Grâce à Dynamo, les prestataires de services peuvent gérer plus efficacement les requêtes des clients et augmenter les revenus.
La nouvelle version de Blackwell Chip "Ultra" et DGX Spark ordinateurs a également été officiellement publiée lors de la conférence.