Na Conferência do GTC2025, a Nvidia anunciou oficialmente sua próxima geração de plataforma de chip de inteligência artificial (AI) e o nomeou "Vera Rubin", prestando homenagem ao famoso astrônomo americano Vera Rubin, continuando a tradição da Nvidia de nomear a arquitetura depois dos cientistas. O primeiro produto da série, Vera Rubin NVL144, deve ser lançado na segunda metade de 2026.
O CEO da NVIDIA, Jensen Huang, disse que o desempenho de Rubin atingirá 900 vezes o da arquitetura atual da tremonha. Em comparação, a mais recente arquitetura de Blackwell alcançou uma melhoria de desempenho de 68 vezes na tremonha, indicando que Rubin trará outro grande salto no poder da computação.

De acordo com as informações oficiais, o Vera Rubin NVL144 possui um poder de computação de inferência de até 3.6exaflops sob precisão do FP4, e seu desempenho de treinamento sob precisão do FP8 é de 1.2exaflops. Comparado com o GB300NVL72, o desempenho é 3,3 vezes maior. Rubin estará equipado com a mais recente memória de vídeo HBM4, com uma incrível largura de banda de 13 TB/se 75TB de memória rápida, 1,6 vezes a geração anterior. Em termos de interconexão, o Rubin suporta NVLink6 e CX9, com larguras de banda atingindo 260TB/se 28,8 TB/s, respectivamente, ambas são duas vezes a geração anterior.
A versão padrão do chip Rubin será equipada com a memória de vídeo HBM4, e seu desempenho geral excederá em muito o atual chip H100 H100.
Vale ressaltar que a plataforma Rubin também apresentará uma nova CPU chamada Veru como sucessor da Grace CPU. O Veru contém 88 núcleos de braço personalizados, cada um com suporte a 176 threads e permite conexões de alta largura de banda de até 1,8tb/s via NVLink-C2C. A NVIDIA diz que a CPU personalizada Vera dobrará a velocidade da CPU usada no Grace Blackwell Chip no ano passado.

Quando usado com a CPU de Vera, o poder de computação de Rubin em tarefas de inferência pode atingir 50PETAFLOPS, mais do que o dobro do Blackwell20POPLOPS. Além disso, o Rubin suportará até 288 GB de memória HBM4, o que é crucial para os desenvolvedores que precisam lidar com grandes modelos de IA.
Semelhante a Blackwell, Rubin realmente consiste em duas GPUs, que são integradas a uma operação geral através da tecnologia avançada de embalagens, melhorando ainda mais a eficiência e o desempenho gerais da computação. O lançamento de Rubin, sem dúvida, mais uma vez demonstra os fortes recursos de inovação da Nvidia no campo dos chips de IA e sua profunda visão sobre as futuras necessidades de poder de computação.