A empresa de inteligência artificial de Elon Musk, Xai, lançou seu mais recente modelo de idioma Grok3 nesta segunda -feira, um lançamento marcando um progresso significativo que a empresa fez no campo da inteligência artificial. Musk revelou na conferência de imprensa que o novo modelo tem dez vezes o poder de computação de seu antecessor, graças ao data center baseado em Memphis, equipado com cerca de 200.000 GPUs, fornecendo um forte suporte ao poder de computação para o modelo.
Os modelos da série Grok3 lançaram uma variedade de variantes, incluindo uma versão simplificada que sacrifica parte da precisão e aumenta a velocidade. Além disso, o modelo "Inferência" recém -lançado foi projetado especificamente para resolver problemas matemáticos e científicos, e os usuários podem ajustar esses recursos através das configurações "Think" e "Brain" na interface GROK. Xai disse que esta versão ainda não foi finalizada, o modelo ainda está sendo treinado continuamente e a equipe planeja fazer melhorias e otimizações nas próximas semanas.
De acordo com a plataforma de benchmarking da AI Lmarena.ai, o GROK3 marcou mais de 1.400 no campo do chatbot, tornando -se um líder no campo. Ele se destaca em todas as categorias, como programação, superando os modelos OpenAI, Antrópicos e Google. No entanto, o desempenho real pode diferir dos resultados de referência. Por exemplo, embora o Claude3.5SONNET escores inferiores a alguns modelos em benchmarks de codificação, muitos usuários ainda consideram uma escolha melhor para tarefas de programação.
O fundador do OpenAI, Andrej Karpathy, recebeu acesso antecipado ao GROK3 e elogiou a capacidade de raciocínio lógico do modelo. Karpasi disse que o recurso "Think" pode lidar com sucesso a tarefas complexas, como o cálculo dos fracassos de treinamento do GPT-2 ou a criação de malha hexagonal para jogos de tabuleiro, que anteriormente eram limitados ao modelo de ponta do OpenAI. Além disso, esse recurso melhora a precisão das operações matemáticas básicas, como contagem de cartas e comparação de decimais.
Em termos de novos recursos de pesquisa, Karpasi observou que a qualidade da DeepSearch é comparável às ferramentas de pesquisa da Perplexity, fornecendo respostas relevantes para tópicos como os próximos produtos da Apple e a Dinâmica de ações da Palantir. No entanto, ele também encontrou alguns problemas óbvios: o modelo às vezes gera URLs falsos, faz declarações não suportadas e cita apenas as postagens de X em avisos específicos.
Além disso, o GROK3 também parece ter falta de consciência de sua existência, perdendo a localização do XAI nos principais laboratórios da IA. Essas limitações deixaram o DeepSearch ainda não no nível de qualidade da “pesquisa profunda” do OpenAI e teve um desempenho inferior ao humor e questões éticas. No entanto, o lançamento do GROK3 ainda demonstra as fortes capacidades de força e inovação de Xai no campo da inteligência artificial.