На третий день своей «Недели с открытым исходным кодом» китайская компания по искусственному интеллекту Deedseek объявила библиотеку с открытым исходным кодом под названием DeepGemm, которая поддерживает Universal Matrix Matrix FP8 (GEMM). Этот инструмент, разработанный для интенсивных и гибридных экспертов (MOE), предназначен для обеспечения сильной поддержки для обучения и вывода для моделей DeepSeek V3 и R1. После того, как официальные новости были опубликованы через платформу X, она быстро вызвала широкое внимание и нагревало дискуссии от технологического сообщества.

Согласно сообщению, опубликованному официальной учетной записью Deepseek, DeepGemm может достичь вычислительной производительности FP8 до 1350+ TFLOPS на графическом процессоре NVIDIA Hopper. Хотя его основная логика содержит только около 300 строк кода, библиотека работает даже за пределы опытных ядер на большинстве размеров матрицы, показывая чрезвычайно высокую эффективность и простоту. DeepGemm не требует сложных зависимостей и принимает технологии справедливой, поддерживает интенсивную планировку и два макета MOE. Он предназначен для того, чтобы быть «чистым, как учебник», и разработчикам легко учиться и использовать.
X Пользователь @TechBitDaily прокомментировал: «Запуск DeepGemm - это основной момент недели открытого исходного кода DeepSeek с впечатляющей производительности FP8 и дизайном простоты». Другой пользователь @aiobservercn отметил, что библиотека имеет значительные преимущества в поддержке эффективной подготовки моделей MOE и может способствовать дальнейшим инновациям в сообществе ИИ в архитектуре Хоппера.
В рамках недели с открытым исходным кодом, запуск DeepGemm продолжает приверженность Deepseek по способству прозрачности в технологиях ИИ и сотрудничестве в сообществе. Ранее компания выпустила инструменты FlashMLA и Deepep за два дня до недели с открытым исходным кодом, сосредоточившись на архитектуре быстрого языка и экспертной параллельной коммуникации соответственно. Дебют DeepGemm также демонстрирует техническую силу DeepSeek в строительстве инфраструктуры искусственного интеллекта. Инсайдеры отрасли считают, что эта библиотека не только улучшит производительность собственной модели Deepseek, но и предоставит глобальным разработчикам эффективный и простой в использовании матричный инструмент вычислений с широкими перспективами приложений. Теперь пользователи могут получить DeepGemm через GitHub, чтобы изучить его потенциал в обучении и рассуждениях искусственного интеллекта.
Адрес проекта: https://github.com/deepseek-ai/deepgemm