Download variational autoencoder - variational autoencoder Quellcode herunterladen

variational autoencoder

Python

Canonical release

Herunterladen

Variationsautocoder in Tensorflow und Pytorch

Referenzimplementierung für einen Variationsautoencoder in Tensorflow und Pytorch.

Ich empfehle die Pytorch -Version. Es enthält ein Beispiel für eine ausdruckswertere Variationsfamilie, den inversen autoregressiven Fluss.

Variationsinferenz wird verwendet, um das Modell in binärisierte mnist handgeschriebene Digits -Bilder anzupassen. Ein Inferenznetzwerk (Encoder) wird verwendet, um die Inferenz- und Freigabeparameter über DataPoints zu treiben. Die Wahrscheinlichkeit wird durch ein generatives Netzwerk (Decoder) parametrisiert.

Blogbeitrag: https://jaan.io/what-is-variational-autoencoder-vae-tutorial/

Pytorch -Implementierung

(Anaconda-Umgebung befindet sich in environment-jax.yml )

Wichtige Probenahme werden verwendet, um die Grenzwahrscheinlichkeit auf Hugo Larochelles binärem MNIST -Datensatz abzuschätzen. Die endgültige marginale Wahrscheinlichkeit im Testsatz betrug -97.10 NATs ist vergleichbar mit veröffentlichten Zahlen.

 $ python train_variational_autoencoder_pytorch.py --variational mean-field --use_gpu --data_dir $DAT --max_iterations 30000 --log_interval 10000
Step 0          Train ELBO estimate: -558.027   Validation ELBO estimate: -384.432      Validation log p(x) estimate: -355.430  Speed: 2.72e+06 examples/s
Step 10000      Train ELBO estimate: -111.323   Validation ELBO estimate: -109.048      Validation log p(x) estimate: -103.746  Speed: 2.64e+04 examples/s
Step 20000      Train ELBO estimate: -103.013   Validation ELBO estimate: -107.655      Validation log p(x) estimate: -101.275  Speed: 2.63e+04 examples/s
Step 29999      Test ELBO estimate: -106.642    Test log p(x) estimate: -100.309
Total time: 2.49 minutes

Unter Verwendung eines nicht-gemischten Feldes, expressionstiver Variationsposterior-Approximation (inverse autoregressive Fluss, https://arxiv.org/abs/1606.04934), verbessert sich der Test marginal log-liKelihood auf -95.33 Nats:

 $ python train_variational_autoencoder_pytorch.py --variational flow
step:   0       train elbo: -578.35
step:   0               valid elbo: -407.06     valid log p(x): -367.88
step:   10000   train elbo: -106.63
step:   10000           valid elbo: -110.12     valid log p(x): -104.00
step:   20000   train elbo: -101.51
step:   20000           valid elbo: -105.02     valid log p(x): -99.11
step:   30000   train elbo: -98.70
step:   30000           valid elbo: -103.76     valid log p(x): -97.71

JAX -Implementierung

Verwenden von JAX (Anaconda-Umgebung befindet sich in environment-jax.yml ), um eine 3-fache Beschleunigung über Pytorch zu erhalten:

 $ python train_variational_autoencoder_jax.py --variational mean-field 
Step 0          Train ELBO estimate: -566.059   Validation ELBO estimate: -565.755      Validation log p(x) estimate: -557.914  Speed: 2.56e+11 examples/s
Step 10000      Train ELBO estimate: -98.560    Validation ELBO estimate: -105.725      Validation log p(x) estimate: -98.973   Speed: 7.03e+04 examples/s
Step 20000      Train ELBO estimate: -109.794   Validation ELBO estimate: -105.756      Validation log p(x) estimate: -97.914   Speed: 4.26e+04 examples/s
Step 29999      Test ELBO estimate: -104.867    Test log p(x) estimate: -96.716
Total time: 0.810 minutes

Inverse autoregressive Fluss in JAX:

 $ python train_variational_autoencoder_jax.py --variational flow 
Step 0          Train ELBO estimate: -727.404   Validation ELBO estimate: -726.977      Validation log p(x) estimate: -713.389  Speed: 2.56e+11 examples/s
Step 10000      Train ELBO estimate: -100.093   Validation ELBO estimate: -106.985      Validation log p(x) estimate: -99.565   Speed: 2.57e+04 examples/s
Step 20000      Train ELBO estimate: -113.073   Validation ELBO estimate: -108.057      Validation log p(x) estimate: -98.841   Speed: 3.37e+04 examples/s
Step 29999      Test ELBO estimate: -106.803    Test log p(x) estimate: -97.620
Total time: 2.350 minutes

(Der Unterschied zwischen einem mittleren Feld und einem inversen autoregressiven Fluss kann auf mehrere Faktoren zurückzuführen sein, wobei der Chef der Mangel an Konvolutionen in der Implementierung ist. Restblöcke werden in https://arxiv.org/pdf/1606.04934.pdf verwendet, um den Elbo näher zu -80 Nats zu bringen.)

Erzeugen der GIFs

Führen Sie python train_variational_autoencoder_tensorflow.py aus
Installieren Sie Imagemagick (Homebrew für Mac: https://formulae.brew.sh/formula/imagemagick oder schokolady in Windows: https://community.chocolatey.org/packages/imagemagick.app)
Gehen Sie in das Verzeichnis, in dem die JPG -Dateien gespeichert werden, und führen Sie den Befehl ImageMagick aus, um das .gif zu generieren: convert -delay 20 -loop 0 *.jpg latent-space.gif

TODO (HILFE NOTWORT - Senden Sie gerne eine PR!)

Fügen Sie mehrere GPU / TPU -Option hinzu
Fügen Sie Jaxyping -Unterstützung für Pytorch- und JAX -Implementierungen hinzu :) Für die statische Überprüfung des Laufzeit (mit @Beartype Decorators)

Expandieren

Zusätzliche Informationen