Na Conferência do GTC em 18 de março, o CEO da NVIDIA, Jensen Huang, anunciou um plano emocionante para aumentar a velocidade de processamento de inteligência artificial da Deepseek em 30 vezes com o recém -lançado dínamo de software. A medida é a resposta da Nvidia à turbulência do mercado causada pelo programa de inteligência artificial R1 da Deepseek. A tecnologia da Deepseek é capaz de reduzir significativamente a quantidade de computação necessária para cada consulta, levando os investidores a expressar preocupações sobre as perspectivas futuras da Nvidia.

O software dínamo da NVIDIA pode alocar tarefas de inferência de IA para até 1.000 GPUs no processamento paralelo, melhorando bastante a taxa de transferência de consulta. Huang Renxun disse que, usando o novo Chip Blackwell, o Dynamo é capaz de fornecer 30 vezes o poder de processamento sob a mesma arquitetura. Essa melhoria de capacidade permite que os data centers de IA processem mais tokens por segundo, aumentando assim a receita geral.
Especificamente, o software Dynamo pode aumentar o processamento por segundo a um preço de US $ 1 por milhão de tokens. Isso significa que os provedores de serviços podem optar por processar mais consultas dos clientes ao mesmo tempo ou fornecer serviços mais fortes a um único usuário, cobrando taxas mais altas. A Nvidia chama esse serviço de IA de alto desempenho de "fábrica de IA".
Para melhorar ainda mais o desempenho da Deepseek, a Nvidia também lançou a versão do Deepseek R1 ajustada no HuggingFace. Esta versão usa menos contagens de bits computadas, a saber "FP4", o que melhora bastante o desempenho sem reduzir significativamente a precisão do modelo.
Além do Dynamo, a Nvidia também lançou a versão mais recente do Blackwell Chip "Ultra", que melhora a capacidade de memória e o desempenho geral. Além disso, a NVIDIA lançou oficialmente o DGX Spark, um pequeno computador pessoal para desenvolvedores de IA, e atualizou a configuração do computador desktop da estação DGX.
Nesta conferência, a NVIDIA também apresentou vários outros novos produtos e projetos de colaboração, incluindo comutadores de rede e modelos de software aprimorados para robôs médicos, demonstrando os recursos contínuos de inovação da Nvidia nos campos de IA e computação.
Pontos -chave:
A NVIDIA lança o software Dynamo, que aumenta a velocidade de processamento da AI Deepseek em 30 vezes.
Através do Dynamo, os provedores de serviços podem lidar com consultas do cliente com mais eficiência e aumentar a receita.
A nova versão dos computadores Blackwell Chip "Ultra" e DGX Spark também foi lançada oficialmente na conferência.