No terceiro dia de sua "semana de código aberto", a empresa de inteligência artificial chinesa Deepseek anunciou uma biblioteca de código aberto chamado DeepGemm, que suporta multiplicação de matriz universal do FP8 (GEMM). Projetado para operações de matriz de especialista intensivo e híbrido (MOE), essa ferramenta foi projetada para fornecer forte suporte ao treinamento e inferência para os modelos Deepseek V3 e R1. Depois que as notícias oficiais foram divulgadas através da plataforma X, ela rapidamente despertou atenção generalizada e acalorou discussões da comunidade de tecnologia.

De acordo com um post publicado pela conta oficial da Deepseek, o DeepGemm pode atingir o desempenho da computação FP8 até 1350 mais tflops na GPU da NVIDIA Hopper. Embora sua lógica principal contenha apenas cerca de 300 linhas de código, a biblioteca tem um desempenho ainda além dos kernels ajustados, na maioria dos tamanhos da matriz, mostrando eficiência e simplicidade extremamente alta. DeepGemm não requer dependências complexas e adota tecnologia just-in-time, suporta layout intensivo e dois layouts de MOE. Ele foi projetado para ser "limpo como um tutorial" e é fácil para os desenvolvedores aprenderem e usarem.
X O usuário @TechBitDaily comentou: "O lançamento do DeepGemm é um destaque da semana de código aberto da Deepseek, com impressionante desempenho do FP8 e design de simplicidade". Outro usuário @aiobservercn apontou que a biblioteca tem vantagens significativas no suporte ao treinamento eficiente dos modelos MOE e pode promover uma inovação adicional na comunidade de IA na arquitetura de Hopper.
Como parte da semana de código aberto, o lançamento do DeepGemm continua o compromisso da Deepseek de promover a transparência na tecnologia da IA e na colaboração da comunidade. Anteriormente, a empresa havia lançado as ferramentas FlashMla e DeepEp dois dias antes da semana de código aberto, concentrando -se na arquitetura de modelos de linguagem rápida e em comunicações paralelas especializadas, respectivamente. A estréia de Deepgemm demonstra ainda a força técnica da Deepseek na construção de infraestrutura de IA. Os especialistas do setor acreditam que essa biblioteca não apenas melhorará o desempenho do próprio modelo da Deepseek, mas também fornecerá aos desenvolvedores globais uma ferramenta de computação de matriz eficiente e fácil de usar, com amplas perspectivas de aplicativos futuros. Agora, os usuários podem obter DeepGemm através do GitHub para explorar seu potencial no treinamento e raciocínio da IA.
Endereço do projeto: https://github.com/deepseek-ai/deepgemm