Am dritten Tag der "Open Source Week" kündigte das chinesische Unternehmen für künstliche Intelligenz Deepseek eine Open -Source -Bibliothek namens DeepGemm an, die die FP8 Universal Matrix -Multiplikation (GEMM) unterstützt. Dieses Tool wurde für intensive und hybride Experten (MOE) -Matrixoperationen entwickelt und bietet eine starke Unterstützung für Schulungen und Schlussfolgerungen für Deepseek V3- und R1 -Modelle. Nachdem die offiziellen Nachrichten über die X -Plattform veröffentlicht worden waren, machte sie schnell weit verbreitete Aufmerksamkeit und hitzige Diskussionen der Technologiegemeinschaft.

Laut einem von Deepseeks offiziellen Account veröffentlichten Beitrag kann DeepGemm die FP8 -Computerleistung bis zu 1350+ TFLOPS bei NVIDIA Hopper GPU erzielen. Obwohl seine Kernlogik nur etwa 300 Codezeilen enthält, führt die Bibliothek in den meisten Matrixgrößen auch über fachmännisch abgestimmte Kerne durch und zeigt extrem hohe Effizienz und Einfachheit. DeepGemm erfordert keine komplexen Abhängigkeiten und nimmt Just-in-Time-Technologie an, unterstützt intensives Layout und zwei MOE-Layouts. Es ist so konzipiert, dass es "sauber wie ein Tutorial" ist und für Entwickler leicht zu lernen und zu verwenden ist.
X user @Techbitdaily kommentierte: "Der Start von DeepGemm ist ein Highlight der Open -Source -Woche von Deepseek mit beeindruckender FP8 -Leistung und Simpleity -Design." Ein anderer Benutzer @Aiobservercn wies darauf hin, dass die Bibliothek erhebliche Vorteile zur Unterstützung des effizienten Trainings von MOE -Modellen hat und möglicherweise weitere Innovationen in der KI -Community in der Hopper -Architektur fördern kann.
Im Rahmen der Open -Source -Woche setzt der Start von DeepGemm das Engagement von Deepseek fort, Transparenz in der KI -Technologie und der Zusammenarbeit der Gemeinschaft zu fördern. Zuvor hatte das Unternehmen zwei Tage vor der Open -Source -Woche FlashMLA- und Deepep -Tools veröffentlicht, wobei sich die Architektur für schnelle Sprachmodelle bzw. die kompetente parallele Kommunikation konzentrierte. Das Debüt von Deepgemm zeigt die technische Stärke von Deepseek in der KI -Infrastrukturkonstruktion weiter. Branchenkenner sind der Ansicht, dass diese Bibliothek nicht nur die Leistung von Deepseeks eigenem Modell verbessern wird, sondern auch globalen Entwicklern ein effizientes und benutzerfreundliches Matrix-Computing-Tool mit breiten zukünftigen Anwendungsaussichten bietet. Benutzer können nun Deepgemm über GitHub erhalten, um ihr Potenzial für KI -Training und -Angründung zu untersuchen.
Projektadresse: https://github.com/deepseek-ai/deepgemm