تنزيل ganspace - تنزيل رمز المصدر ganspace

ganspace

بايثون

1.0.0

تنزيل

Ganspace: اكتشاف ضوابط GAN القابلة للتفسير

دعابة

الشكل 1: تسلسل تعديل الصور الذي يتم تنفيذه باستخدام عنصر تحكم تم اكتشافه بطريقتنا ، المطبقة على ثلاثة غانس مختلفة. تحدد الإقرارات البيضاء التعديلات الخاصة باستخدام التدوين الموضحة في القسم 3.4 ("تعديلات طبقة").

Ganspace: اكتشاف ضوابط GAN القابلة للتفسير
Erik Härkönen ^1،2 ، Aaron Hertzmann ² ، Jaakko Lehtinen ^1،3 ، Sylvain Paris ²
¹ جامعة Aalto ، ² Adobe Research ، ³ Nvidia
https://arxiv.org/abs/2004.02546
الخلاصة: تصف هذه الورقة تقنية بسيطة لتحليل الشبكات العدائية (GANS) وإنشاء عناصر تحكم قابلة للتفسير لتوليف الصور ، مثل تغيير وجهة النظر والشيخوخة والإضاءة ووقت اليوم. نحدد الاتجاهات الكامنة المهمة بناءً على تحليل المكونات الرئيسية (PCA) المطبقة في مساحة التنشيط. بعد ذلك ، نظهر أنه يمكن تعريف التعديلات القابلة للتفسير بناءً على تطبيق طبقة من هذه الاتجاهات. علاوة على ذلك ، نظهر أنه يمكن التحكم في Biggan مع مدخلات حكيمة طبقة بطريقة تشبه الأناقة. قد يحدد المستخدم عددًا كبيرًا من عناصر التحكم القابلة للتفسير مع هذه الآليات. نظهر نتائج على Gans من مجموعات البيانات المختلفة.
الفيديو: https://youtu.be/jdticda_eai

يثبت

انظر تعليمات الإعداد.

الاستخدام

يشتمل هذا المستودع على إصدارات من Biggan و Stylegan و Stylegan2 المعدلة لدعم المتجهات الكامنة لكل طبقة.

استكشاف النموذج التفاعلي

 # Explore BigGAN-deep husky
python interactive.py --model=BigGAN-512 --class=husky --layer=generator.gen_z -n=1_000_000

# Explore StyleGAN2 ffhq in W space
python interactive.py --model=StyleGAN2 --class=ffhq --layer=style --use_w -n=1_000_000 -b=10_000

# Explore StyleGAN2 cars in Z space
python interactive.py --model=StyleGAN2 --class=car --layer=style -n=1_000_000 -b=10_000

 # Apply previously saved edits interactively
python interactive.py --model=StyleGAN2 --class=ffhq --layer=style --use_w --inputs=out/directions

تصور المكونات الرئيسية

 # Visualize StyleGAN2 ffhq W principal components
python visualize.py --model=StyleGAN2 --class=ffhq --use_w --layer=style -b=10_000

# Create videos of StyleGAN wikiart components (saved to ./out)
python visualize.py --model=StyleGAN --class=wikiart --use_w --layer=g_mapping -b=10_000 --batch --video

خيارات

 Command line paramaters:
  --model      one of [ProGAN, BigGAN-512, BigGAN-256, BigGAN-128, StyleGAN, StyleGAN2]
  --class      class name; leave empty to list options
  --layer      layer at which to perform PCA; leave empty to list options
  --use_w      treat W as the main latent space (StyleGAN / StyleGAN2)
  --inputs     load previously exported edits from directory
  --sigma      number of stdevs to use in visualize.py
  -n           number of PCA samples
  -b           override automatic minibatch size detection
  -c           number of components to keep

استنساخ

يمكن إعادة إنشاء جميع الأرقام المعروضة في الورقة الرئيسية باستخدام دفاتر الملاحظات Jupyter:

الشكل 1: figure_teaser.ipynb
الشكل 2: figure_pca_illustration.ipynb
الشكل 3: figure_pca_cleanup.ipynb
الشكل 4: figure_style_content_sep.ipynb
الشكل 5: figure_supervised_comp.ipynb
الشكل 6: figure_biggan_style_resampling.ipynb
الشكل 7: figure_edit_zoo.ipynb

القضايا المعروفة

يتجمد المشاهد التفاعلي أحيانًا عند بدء التشغيل على Ubuntu 18.04. يتم حل التجميد من خلال النقر على نافذة الطرفية والضغط على مفتاح التحكم. أي نظرة ثاقبة لهذه القضية سيكون موضع تقدير كبير!

دمج نموذج جديد

قم بإنشاء غلاف للنموذج في models/wrappers.py باستخدام واجهة BaseModel .
أضف النموذج إلى get_model() في models/wrappers.py .

استيراد نقاط تفتيش Stylegan من TensorFlow

من الممكن استيراد أوزان Stylegan و Stylegan2 من TensorFlow إلى Ganspace.

Stylegan

تثبيت TensorFlow: conda install tensorflow-gpu=1.* .
تعديل الأساليب __init__() ، load_model() في models/wrappers.py .

Stylegan2

اتبع الإرشادات في النماذج/stylegan2/stylegan2-pytorch/readMe.md. تأكد من استخدام الشوكة في هذا المجلد المحدد عند تحويل الأوزان لأسباب توافق.
احفظ نقطة التفتيش التي تم تحويلها على أنها checkpoints/stylegan2/<dataset>_<resolution>.pt .
تعديل الأساليب __init__() ، download_checkpoint() في models/wrappers.py .

شكر وتقدير

نود أن نشكر:

مؤلفو تطبيقات Pytorch في Biggan و Stylegan و Stylegan2:
توماس وولف ، بيوتر بياليكي ، توماس فيهمان ، وكيم سونغيون.
جويل سيمون من Artbreeder لتزويدنا بنموذج المناظر الطبيعية لـ Stylegan.
(للأسف لا يمكننا توزيع هذا النموذج)
ديفيد باو وزملاؤه لمشروع تشريح GAN الممتاز.
جاستن بينكني لمجموعة stylegan الرائعة.
Tuomas Kynkäänniemi لمنحنا يد العون مع التجارب.
مشروع Aalto Science-IT لتوفير الموارد الحسابية لهذا المشروع.

اقتباس

 @inproceedings{härkönen2020ganspace,
  title     = {GANSpace: Discovering Interpretable GAN Controls},
  author    = {Erik Härkönen and Aaron Hertzmann and Jaakko Lehtinen and Sylvain Paris},
  booktitle = {Proc. NeurIPS},
  year      = {2020}
}

رخصة

يتم إصدار رمز هذا المستودع بموجب ترخيص Apache 2.0.
الدليل netdissect هو مشتق من مشروع تشريح GAN ، ويتم توفيره بموجب ترخيص معهد ماساتشوستس للتكنولوجيا.
يتم توفير models/biggan و models/stylegan2 ضمن ترخيص معهد ماساتشوستس للتكنولوجيا.

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع بايثون
وقت التحديث 2025-07-12
الحجم 46.41MB
من Github

تطبيقات ذات صلة

ToDo Co

2025-03-22
Python Portfolio

2024-11-10
Redash أداة مخطط البيانات مفتوحة المصدر v24.10.0

2024-11-27
datamule python

2024-11-08
منصة تصور البيانات SmartChart v6.9

2024-11-27
أداة اختبار حمل الجراد v2.32.0

2024-11-27

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ToDo Co

بايثون

1.0.0
Python Portfolio

بايثون
Redash أداة مخطط البيانات مفتوحة المصدر v24.10.0

بايثون

24.10.0
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل