
Ziel dieses Bildungsrepositorys ist es, eine in sich geschlossene, minimalistische Implementierung von Diffusionsmodellen mithilfe von Pytorch bereitzustellen.
Viele Implementierungen von Diffusionsmodellen können etwas überwältigend sein. Hier superminddpm : Unter 200 Codezeilen, vollständig selbst integrierte Implementierung von DDPM mit Pytorch ist ein guter Ausgangspunkt für alle, die mit der Denoisierung von Diffusionsmodellen beginnen möchten, ohne Zeit mit den Details verbringen zu müssen.
Einfach:
$ python superminddpm.py
Das obige Skript ist in sich geschlossen. (Natürlich müssen Sie Pytorch und Torchvision installieren lassen. Die neueste Version sollte ausreichen. Wir verwenden keine modernsten Funktionen.)
Wenn Sie den bit mehr refaktorierten Code verwenden möchten, wird CIFAR10 -Datensatz ausgeführt:
$ python train_cifar10.py

Das obige Ergebnis dauerte ungefähr 2 Stunden Training bei einer einzelnen 3090 GPU. Top 8 Bilder werden erzeugt, unten 8 sind Grundwahrheit.
Hier ist ein weiteres Beispiel, das auf 100 Epochen trainiert wurde (ca. 1,5 Stunden)

Derzeit hat:
Todos