mmengine Download - mmengine Source Code Download

mmengine

Anderer Quellcode

v0.10.5

Herunterladen

OpenMMLAB -Website ^Hot OpenMMLAB -Plattform ^{probieren Sie es aus}

Einführung | Installation | Fangen Sie an | Dokumentation | Meldungsprobleme

Englisch | 简体中文

Was ist neu

V0.10.5 wurde am 2024-9-11 veröffentlicht.

Highlights:

Unterstützen Sie benutzerdefinierte artifact_location in mlflowvisbackend #1505
Aktivieren Sie exclude_frozen_parameters für DeepSpeedEngine._zero3_consolidated_16bit_state_dict #1517

Lesen Sie ChangeLog für weitere Details.

Einführung

Mmengine ist eine grundlegende Bibliothek für das Training von Deep -Learning -Modellen, die auf Pytorch basieren. Es dient als Trainingsmotor aller OpenMMLab -Codebasen, die Hunderte von Algorithmen in verschiedenen Forschungsbereichen unterstützen. Darüber hinaus ist Mmengine auch generisch, um auf Nicht-OpenMMMLab-Projekte angewendet zu werden. Die Höhepunkte sind wie folgt:

Integrieren

Kolossalai
Deepspeed
FSDP

Unterstützt eine Vielzahl von Schulungsstrategien

Gemischtes Präzisionstraining
Gradientenakkumulation
Gradientenprüfung

Bietet ein benutzerfreundliches Konfigurationssystem

Reine Konfigurationsdateien im Python-Stil, einfach zu navigieren
Konfigurationsdateien im Klartextstil, die JSON und YAML unterstützen

Deckt die Mainstream -Trainingsüberwachungsplattformen ab

Tensorboard | Wandb | Mlflow
Clearml | Neptun | Dvclive | Ziel

Installation

Unterstützte Pytorch -Versionen

Mmengine	Pytorch	Python
hauptsächlich	> = 1,6 <= 2,1	> = 3,8, <= 3,11
> = 0.9.0, <= 0,10,4	> = 1,6 <= 2,1	> = 3,8, <= 3,11

Stellen Sie vor dem Installieren von Mmengine bitte sicher, dass Pytorch nach dem offiziellen Leitfaden erfolgreich installiert wurde.

Mmengine installieren

pip install -U openmim
mim install mmengine

Überprüfen Sie die Installation

python -c ' from mmengine.utils.dl_utils import collect_env;print(collect_env()) '

Fangen an

Wenn wir das Training eines Resnet-50-Modells auf dem CIFAR-10-Datensatz als Beispiel nutzen, werden wir mit MMengine einen vollständigen, konfigurierbaren Schulungs- und Validierungsprozess in weniger als 80 Codezeilen erstellen.

Modelle erstellen

Zunächst müssen wir ein Modell definieren, das 1) von BaseModel erbt und 2) zusätzlich zu den Argumenten im Zusammenhang mit dem Datensatz einen zusätzlichen mode in der forward akzeptiert.

Während des Trainings ist der Wert des mode "Verlust", und die forward sollte ein dict zurückgeben, das den Schlüssel "Verlust" enthält.
Während der Validierung ist der Wert des mode "vorherzusagen", und die Vorwärtsmethode sollte die Ergebnisse zurückgeben, die sowohl Vorhersagen als auch Etiketten enthalten.

 import torch . nn . functional as F
import torchvision
from mmengine . model import BaseModel

class MMResNet50 ( BaseModel ):
    def __init__ ( self ):
        super (). __init__ ()
        self . resnet = torchvision . models . resnet50 ()

    def forward ( self , imgs , labels , mode ):
        x = self . resnet ( imgs )
        if mode == 'loss' :
            return { 'loss' : F . cross_entropy ( x , labels )}
        elif mode == 'predict' :
            return x , labels

Datensätze erstellen

Als nächstes müssen wir Datensatz und Dataloader für Schulungen und Validierung erstellen. In diesem Fall verwenden wir einfach integrierte Datensätze, die in Torchvision unterstützt werden.

 import torchvision . transforms as transforms
from torch . utils . data import DataLoader

norm_cfg = dict ( mean = [ 0.491 , 0.482 , 0.447 ], std = [ 0.202 , 0.199 , 0.201 ])
train_dataloader = DataLoader ( batch_size = 32 ,
                              shuffle = True ,
                              dataset = torchvision . datasets . CIFAR10 (
                                  'data/cifar10' ,
                                  train = True ,
                                  download = True ,
                                  transform = transforms . Compose ([
                                      transforms . RandomCrop ( 32 , padding = 4 ),
                                      transforms . RandomHorizontalFlip (),
                                      transforms . ToTensor (),
                                      transforms . Normalize ( ** norm_cfg )
                                  ])))
val_dataloader = DataLoader ( batch_size = 32 ,
                            shuffle = False ,
                            dataset = torchvision . datasets . CIFAR10 (
                                'data/cifar10' ,
                                train = False ,
                                download = True ,
                                transform = transforms . Compose ([
                                    transforms . ToTensor (),
                                    transforms . Normalize ( ** norm_cfg )
                                ])))

Metriken bauen

Um das Modell zu validieren und zu testen, müssen wir eine Metrik definieren, die als Genauigkeit bezeichnet wird, um das Modell zu bewerten. Diese Metrik muss von BaseMetric Erben erben und implementiert die process und die Methoden compute_metrics .

 from mmengine . evaluator import BaseMetric

class Accuracy ( BaseMetric ):
    def process ( self , data_batch , data_samples ):
        score , gt = data_samples
        # Save the results of a batch to `self.results`
        self . results . append ({
            'batch_size' : len ( gt ),
            'correct' : ( score . argmax ( dim = 1 ) == gt ). sum (). cpu (),
        })
    def compute_metrics ( self , results ):
        total_correct = sum ( item [ 'correct' ] for item in results )
        total_size = sum ( item [ 'batch_size' ] for item in results )
        # Returns a dictionary with the results of the evaluated metrics,
        # where the key is the name of the metric
        return dict ( accuracy = 100 * total_correct / total_size )

Bauen Sie einen Läufer

Schließlich können wir einen Läufer mit zuvor definiertem Model , DataLoader und Metrics mit einigen anderen Konfigurationen erstellen, wie unten gezeigt.

 from torch . optim import SGD
from mmengine . runner import Runner

runner = Runner (
    model = MMResNet50 (),
    work_dir = './work_dir' ,
    train_dataloader = train_dataloader ,
    # a wrapper to execute back propagation and gradient update, etc.
    optim_wrapper = dict ( optimizer = dict ( type = SGD , lr = 0.001 , momentum = 0.9 )),
    # set some training configs like epochs
    train_cfg = dict ( by_epoch = True , max_epochs = 5 , val_interval = 1 ),
    val_dataloader = val_dataloader ,
    val_cfg = dict (),
    val_evaluator = dict ( type = Accuracy ),
)

Starttraining

 runner . train ()

Erfahren Sie mehr

Tutorials

Läufer
Datensatz und Dataloader
Modell
Auswertung
Optimwrapper
Parameter Scheduler
Haken

Fortgeschrittene Tutorials

Registrierung
Konfiguration
Basisataset
Datenumwandlung
Gewichtsinitialisierung
Visualisierung
Abstraktes Datenelement
Verteilungskommunikation
Protokollierung
Datei io
Global Manager (Managerermixin)
Verwenden Sie Module aus anderen Bibliotheken
Testzeit Agumentation

Beispiele

Trainiere einen gan

Gemeinsame Verwendung

Wiederaufnahme des Trainings
Beschleunigen Sie das Training
Speichern Sie den Speicher bei GPU

Design

Haken
Läufer
Auswertung
Visualisierung
Protokollierung
Schließen

Migrationsleitfaden

Migrieren Sie den Läufer von MMCV nach Mmengine
Migrieren Sie Haken von MMCV nach Mmengine
Migrieren Sie das Modell von MMCV nach Mmengine
Migrieren Sie den Parameterplaner von MMCV nach Mmengine
Migrieren Sie die Datenumwandlung in OpenMMLAB 2.0

Beitragen

Wir schätzen alle Beiträge zur Verbesserung von Mmengine. Weitere Informationen finden Sie in der beitragenden Richtlinie.

Zitat

Wenn Sie dieses Projekt in Ihrer Forschung nützlich finden, sollten Sie zitieren:

 @article{mmengine2022,
  title   = {{MMEngine}: OpenMMLab Foundational Library for Training Deep Learning Models},
  author  = {MMEngine Contributors},
  howpublished = {url{https://github.com/open-mmlab/mmengine}},
  year={2022}
}

Lizenz

Dieses Projekt wird unter der Apache 2.0 -Lizenz veröffentlicht.

Ökosystem

Affen: Aufmerksamkeitsbasierte Punktwolkenkantenabtastung
Diffengine: Diffusorers Training Toolbox mit Mmengine

Projekte in OpenMmlab

MIM: MIM installiert OpenMMLab -Pakete.
MMCV: OpenMMLAB Fundamentalbibliothek für Computer Vision.
MMEVAL: Eine einheitliche Evaluierungsbibliothek für mehrere Bibliotheken mehrerer maschineller Lernen.
MMPRETRAIN: OpenMMLAB Pre-Training Toolbox und Benchmark.
MMAGIC: Öffnen Sie MM Lab A DVANFE, GEERATIVE UND INTELLIGENT C ARETION TOOLBOX.
Mmdetion: OpenMmlab -Erkennungs -Toolbox und Benchmark.
MMYOLO: OpenMMMLAB YOLO -Serie Toolbox und Benchmark.
MMDETECTICE3D: OpenMMLAB-Plattform der nächsten Generation für die allgemeine 3D-Objekterkennung.
MMROTATE: OpenMMMLAB -Toolbox und Benchmark gedrehte Objekterkennung.
MMTRACKING: OpenMMLAB -Videowahrnehmungs -Toolbox und Benchmark.
MMIltier: OpenMMMLAB -Pose -Schätzung Toolbox und Benchmark.
MMSegmentierung: OpenMMMLAB Semantic Segmentation Toolbox und Benchmark.
MMOCR: OpenMMLAB -Texterkennung, Erkennung und Verständnis der Toolbox.
MMHUMAN3D: OpenMMLAB 3D Human Parametric Model Toolbox und Benchmark.
MMMELSUP: OpenMMMLAB Self-überprüfte Lern-Toolbox und Benchmark.
MMFewShot: OpenMmlab FewShot Learning Toolbox und Benchmark.
MMACTION2: OpenMMMLAB-Aktion der nächsten Generation, das Toolbox und Benchmark zu verstehen.
MMflow: OpenMMMLAB Optical Flow Toolbox und Benchmark.
MMDeploy: OpenMMLAB -Modellbereitstellungsframework.
MMrazor: OpenMMMLAB -Modellkomprimierungs -Toolbox und Benchmark.
Spielplatz: Ein zentraler Hub zum Sammeln und Präsentieren von erstaunlichen Projekten, die auf OpenMMLAB aufgebaut sind.