تنزيل variational autoencoder - تنزيل رمز المصدر variational autoencoder

variational autoencoder

بايثون

Canonical release

تنزيل

أدوات تلقائية مختلفة في Tensorflow و Pytorch

التنفيذ المرجعي للتشفير التلقائي المتغير في TensorFlow و Pytorch.

أوصي إصدار Pytorch. ويتضمن مثالا على عائلة تباين أكثر تعبيرا ، تدفق الانحدار التلقائي العكسي.

يتم استخدام الاستدلال المتغير لتناسب النموذج مع صور MNIST المكتوبة بخط اليد. يتم استخدام شبكة الاستدلال (التشفير) لإطفاء الاستدلال ومشاركة المعلمات عبر نقاط البيانات. يتم تحديد الاحتمالية بواسطة شبكة توليدية (وحدة فك ترميز).

منشور المدونة: https://jaan.io/what-is-variational-autoencoder-vae-tutorial/

تنفيذ Pytorch

(بيئة أناكوندا في environment-jax.yml )

يتم استخدام أخذ عينات الأهمية لتقدير الاحتمالية الهامشية على مجموعة بيانات Hugo Larochelle الثنائية. كان الاحتمال الهامشي النهائي على مجموعة الاختبار -97.10 NATS مماثلة للأرقام المنشورة.

 $ python train_variational_autoencoder_pytorch.py --variational mean-field --use_gpu --data_dir $DAT --max_iterations 30000 --log_interval 10000
Step 0          Train ELBO estimate: -558.027   Validation ELBO estimate: -384.432      Validation log p(x) estimate: -355.430  Speed: 2.72e+06 examples/s
Step 10000      Train ELBO estimate: -111.323   Validation ELBO estimate: -109.048      Validation log p(x) estimate: -103.746  Speed: 2.64e+04 examples/s
Step 20000      Train ELBO estimate: -103.013   Validation ELBO estimate: -107.655      Validation log p(x) estimate: -101.275  Speed: 2.63e+04 examples/s
Step 29999      Test ELBO estimate: -106.642    Test log p(x) estimate: -100.309
Total time: 2.49 minutes

باستخدام الحقل غير المتوسط ، التقريب الخلفي التباين الأكثر تعبيرا (تدفق الانحدار الذاتي العكسي ، https://arxiv.org/abs/1606.04934) ، يتحسن الاختبار الهامشي log-likelihood إلى -95.33 nats:

 $ python train_variational_autoencoder_pytorch.py --variational flow
step:   0       train elbo: -578.35
step:   0               valid elbo: -407.06     valid log p(x): -367.88
step:   10000   train elbo: -106.63
step:   10000           valid elbo: -110.12     valid log p(x): -104.00
step:   20000   train elbo: -101.51
step:   20000           valid elbo: -105.02     valid log p(x): -99.11
step:   30000   train elbo: -98.70
step:   30000           valid elbo: -103.76     valid log p(x): -97.71

تنفيذ جاكس

باستخدام jax (بيئة Anaconda في environment-jax.yml ) ، للحصول على تسريع 3x على pytorch:

 $ python train_variational_autoencoder_jax.py --variational mean-field 
Step 0          Train ELBO estimate: -566.059   Validation ELBO estimate: -565.755      Validation log p(x) estimate: -557.914  Speed: 2.56e+11 examples/s
Step 10000      Train ELBO estimate: -98.560    Validation ELBO estimate: -105.725      Validation log p(x) estimate: -98.973   Speed: 7.03e+04 examples/s
Step 20000      Train ELBO estimate: -109.794   Validation ELBO estimate: -105.756      Validation log p(x) estimate: -97.914   Speed: 4.26e+04 examples/s
Step 29999      Test ELBO estimate: -104.867    Test log p(x) estimate: -96.716
Total time: 0.810 minutes

تدفق الانحدار التلقائي العكسي في جاكس:

 $ python train_variational_autoencoder_jax.py --variational flow 
Step 0          Train ELBO estimate: -727.404   Validation ELBO estimate: -726.977      Validation log p(x) estimate: -713.389  Speed: 2.56e+11 examples/s
Step 10000      Train ELBO estimate: -100.093   Validation ELBO estimate: -106.985      Validation log p(x) estimate: -99.565   Speed: 2.57e+04 examples/s
Step 20000      Train ELBO estimate: -113.073   Validation ELBO estimate: -108.057      Validation log p(x) estimate: -98.841   Speed: 3.37e+04 examples/s
Step 29999      Test ELBO estimate: -106.803    Test log p(x) estimate: -97.620
Total time: 2.350 minutes

(قد يكون الفرق بين متوسط الحقل وتدفق الانحدار التلقائي العكسي بسبب عدة عوامل ، هو عدم وجود تلوينات في التنفيذ. وتستخدم الكتل المتبقية في https://arxiv.org/pdf/1606.04934.pdf اقتراب Elbo من -80 nats.)

توليد صور GIF

تشغيل python train_variational_autoencoder_tensorflow.py
تثبيت ImageMagick (homebrew لنظام التشغيل Mac: https://formulae.brew.sh/formula/imagemagick أو الشوكولاتة في Windows: https://community.chocolatey.org/packages/imagemagick.app)
انتقل إلى الدليل حيث يتم حفظ ملفات JPG convert -delay 20 -loop 0 *.jpg latent-space.gif وقم بتشغيل الأمر