O editor de Downcodes levará você para aprender sobre o Colossus, o cluster de treinamento de IA mais poderoso do mundo! NVIDIA e xAI uniram forças para criar um cluster de supercomputadores composto por 100.000 GPUs NVIDIA Hopper. Seu poderoso poder de computação será usado para treinar a série Grok de grandes modelos de linguagem da xAI e fornecer serviços de chatbot para usuários X Premium. Esta cooperação marca um novo patamar de desenvolvimento tecnológico no domínio da IA e também anuncia possibilidades ilimitadas para futuras aplicações de IA. O lançamento do Colossus promoverá, sem dúvida, um progresso revolucionário na tecnologia de IA em vários campos, pelo qual vale a pena esperar.
Hoje, a NVIDIA anunciou que o cluster de supercomputadores Colossus construído em cooperação com xAI está oficialmente online. Este é o cluster de treinamento de IA mais poderoso do mundo, Colossus, composto por 100.000 GPUs NVIDIA Hopper.

Este gigante é capaz de atingir tal escala graças ao suporte da plataforma de rede Ethernet NVIDIA Spectrum-X. Esta plataforma foi projetada especificamente para fábricas de IA de grande escala e multilocatários, permitindo acesso remoto direto à memória por Ethernet padrão para oferecer desempenho superior.
Colossus é usado principalmente para treinar a série Grok de modelos de linguagem em grande escala da xAI e também fornece serviços de chatbot para usuários X Premium. Ainda mais emocionante é que a xAI está planejando dobrar o tamanho do Colossus, que atingirá 200.000 GPUs NVIDIA Hopper.
Gilad Shainer, vice-presidente sênior da NVIDIA, disse que a IA se tornou uma necessidade fundamental em vários setores, portanto, os requisitos de desempenho, segurança, escalabilidade e eficiência de custos também aumentam constantemente. O surgimento da plataforma Spectrum-X fornece a inovadores como xAI recursos mais rápidos de processamento, análise e execução de dados, acelerando assim o desenvolvimento, a implantação e o tempo de colocação no mercado de soluções de IA.
Elon Musk também expressou seu agradecimento. Ele chamou o Colossus de o sistema de treinamento mais poderoso do mundo e elogiou os esforços da equipe xAI, da NVIDIA e de seus muitos parceiros. Vale ressaltar que o processo de construção do Colossus foi bastante eficiente e levou apenas 122 dias para ser concluído. Em circunstâncias normais, um sistema de escala semelhante pode levar meses ou até anos para ser concluído. Desde a entrada do primeiro rack até o início do treinamento, todo o processo durou apenas 19 dias.
Alimentada por este supercomputador, a plataforma Spectrum-X pode fornecer largura de banda de até 400 Gbps, aumentando significativamente as taxas de transferência de dados e reduzindo a latência. Esse recurso é fundamental para empresas que exigem processamento rápido de dados e análise em tempo real. Além disso, o Spectrum-X é otimizado para oferecer suporte específico a aplicações de IA, tornando o roteamento e o gerenciamento de dados mais inteligentes, melhorando assim o desempenho geral do sistema.
A arquitetura Colossus foi projetada para ser dimensionada com eficiência para lidar com as enormes quantidades de dados geradas por aplicativos modernos. Ao mesmo tempo, o Spectrum-X também se concentra no desenvolvimento sustentável, esforçando-se para reduzir o consumo de energia do data center, mantendo ao mesmo tempo o alto desempenho, ajudando as organizações a reduzir a sua pegada de carbono.
O lançamento bem-sucedido do Colossus demonstra o investimento contínuo e as capacidades de inovação dos gigantes da tecnologia no campo da IA, e também fornece uma nova referência para a direção futura do desenvolvimento da tecnologia de IA. Acredito que num futuro próximo veremos mais aplicações inovadoras baseadas no Colossus, promovendo a tecnologia de IA para melhor servir a sociedade humana. Ansioso por mais surpresas de xAI e NVIDIA!