تنزيل PyTorch StudioGAN - PyTorch StudioGAN Source Code Download

Studiogan هي مكتبة Pytorch التي توفر تطبيقات شبكات الخصومة التمثيلية (GANS) لتوليد الصور المشروط/غير المشروط. يهدف Studiogan إلى تقديم ملعب متطابق لـ GANS الحديثة حتى يتمكن باحثو التعلم الآليون بسهولة ومقارنة فكرة جديدة.

علاوة على ذلك ، يوفر Studiogan معيارًا غير مسبوق للنماذج التوليدية. يتضمن المؤشر نتائج من Gans (Biggan-Deep ، Stylegan-XL) ، نماذج الانحدار التلقائي (Maskgit ، RQ-Transformer) ، ونماذج الانتشار (LSGM ++ ، CLD-SGM ، ADM-GU).

أخبار

يتم قبول ورقة Studiogan في معاملات IEEE على تحليل الأنماط وذكاء الآلة (TPAMI) ، 2023.
نحن نقدم جميع نقاط التفتيش التي استخدمناها: يرجى زيارة Hugging Face Hub.
إن ورقةنا الجديدة "Studiogan: تصنيف ومعيار لـ Gans for Image Synthesis" يتم نشره على Arxiv.
يوفر Studiogan تطبيقات من 7 من أبناء GAN ، 9 طرق تكييف ، 4 خسائر عدوانية ، 13 وحدة تنظيم ، 3 زيادة قابلة للتفاضلة ، 8 مقاييس التقييم ، و 5 العمود الفقري للتقييم.
يدعم Studiogan كل من المقاييس النظيفة والصديقة للهندسة المعمارية (IS ، FID ، PRDC ، IFID) مع معيار شامل.
يوفر Studiogan سجلات WANDB والنماذج المدربة مسبقًا (ستكون جاهزة قريبًا).

ملاحظات الإصدار (v.0.4.0)

فحصنا استنساخ Gans المنفذة.
نحن نقدم مجموعات بيانات ImageNet للأطفال ، Papa ، و Grandpa حيث تتم معالجة الصور باستخدام Resizer المضادة للمكافحة والمقاد للجودة.
يوفر Studiogan معيارًا مخصصًا على مجموعات البيانات القياسية (CIFAR10 و ImageNet و AFHQV2 و FFHQ).
يدعم Studiogan Inceptionv3 و Resnet50 و Swav و Dino و Swin Transformer لتقييم GAN.

سمات

التغطية: Studiogan هي مكتبة قائمة بذاتها توفر 7 بنيات GAN ، 9 طرق تكييف ، 4 خسائر عدوانية ، 13 وحدة تنظيم ، 6 وحدات زيادة ، 8 مقاييس تقييم ، و 5 العمود الفقري للتقييم. من بين هذه التكوينات ، نقوم بصياغة 30 Gans كممثلين.
المرونة: تتم إدارة كل خيار معياري من خلال نظام تكوين يعمل من خلال ملف YAML ، بحيث يمكن للمستخدمين تدريب مجموعة كبيرة من Gans عن طريق خيارات متميزة مطابقة.
استنساخ: مع Studiogan ، يمكن للمستخدمين مقارنة وتصحيح مختلف Gans مع بيئة الحوسبة الموحدة دون أن تتعلق بالتفاصيل والحيل الخفية.
وفيرة: يوفر Studiogan مجموعة كبيرة من نماذج GAN المدربة مسبقًا ، وسجلات التدريب ، ونتائج التقييم.
التنوع: يدعم Studiogan 5 أنواع من طرق التسارع مع تطبيع الدُفعات المتزامنة للتدريب: تدريب واحد على وحدة معالجة الرسومات ، والتدريب المتوازي للبيانات (DP) ، والتدريب الموازي الموزع للبيانات (DDP) ، والتدريب المتعدد العقدة الموزعة على البيانات (MDDP) ، والتدريب المختلط.

تنفذ gans

طريقة	مكان	بنيان	GC	العاصمة	خسارة	ema
DCGAN	arxiv'15	DCGAN/RESNETGAN ¹	ن/أ	ن/أ	الفانيليا	خطأ شنيع
إنفوجان	Nips'16	DCGAN/RESNETGAN ¹	ن/أ	ن/أ	الفانيليا	خطأ شنيع
Lsgan	ICCV'17	DCGAN/RESNETGAN ¹	ن/أ	ن/أ	أقل sqaure	خطأ شنيع
Ggan	arxiv'17	DCGAN/RESNETGAN ¹	ن/أ	ن/أ	مفصل	خطأ شنيع
Wgan-WC	ICLR'17	Resnetgan	ن/أ	ن/أ	Wasserstein	خطأ شنيع
Wgan-GP	Nips'17	Resnetgan	ن/أ	ن/أ	Wasserstein	خطأ شنيع
wgan-dra	arxiv'17	Resnetgan	ن/أ	ن/أ	Wasserstein	خطأ شنيع
Acgan-Mod ²	-	Resnetgan	CBN	AC	مفصل	خطأ شنيع
PDGAN	ICLR'18	Resnetgan	CBN	PD	مفصل	خطأ شنيع
سنجان	ICLR'18	Resnetgan	CBN	PD	مفصل	خطأ شنيع
ساجان	ICML'19	Resnetgan	CBN	PD	مفصل	خطأ شنيع
تاكجان	Neupips'19	بيغان	CBN	تاك	مفصل	حقيقي
لان	ICML'19	Resnetgan	ن/أ	ن/أ	الفانيليا	خطأ شنيع
بيغان غير المشروط	ICLR'19	بيغان	ن/أ	ن/أ	مفصل	حقيقي
بيغان	ICLR'19	بيغان	CBN	PD	مفصل	حقيقي
Biggan-Deparegan	ICLR'19	Biggan-Deep Comparegan	CBN	PD	مفصل	حقيقي
Biggan-Deep-Studiogan	-	Biggan-Deep Studiogan	CBN	PD	مفصل	حقيقي
Stylegan2	CVPR '20	Stylegan2	كاديان	SPD	اللوجستية	حقيقي
كرغان	ICLR'20	بيغان	CBN	PD	مفصل	حقيقي
Icrgan	aaai'21	بيغان	CBN	PD	مفصل	حقيقي
لوجان	arxiv'19	Resnetgan	CBN	PD	مفصل	حقيقي
كونتاجان	Neupips'20	بيغان	CBN	2C	مفصل	حقيقي
MHGAN	WACV'21	بيغان	CBN	MH	MH	حقيقي
Biggan + Diffaugment	Neupips'20	بيغان	CBN	PD	مفصل	حقيقي
Stylegan2 + ADA	Neupips'20	Stylegan2	كاديان	SPD	اللوجستية	حقيقي
Biggan + Lecam	CVPR'2021	بيغان	CBN	PD	مفصل	حقيقي
Reacgan	Neupips'21	بيغان	CBN	D2D-CE	مفصل	حقيقي
Stylegan2 + APA	Neupips'21	Stylegan2	كاديان	SPD	اللوجستية	حقيقي
stylegan3-t	Neupips'21	Stylegan3	كاين	SPD	اللوجستية	حقيقي
Stylegan3-R	Neupips'21	Stylegan3	كاين	SPD	اللوجستية	حقيقي
adcgan	ICML'22	بيغان	CBN	ADC	مفصل	حقيقي

يشير GC/DC إلى الطريقة التي حققنا بها معلومات التسمية على المولد أو التمييز.

EMA: التحديث المتوسط المتحرك الأسي إلى المولد. CBN: تطبيع الدُفعات الشرطية. كادان: نسخة مشروطة من تطبيع المثيل التكيفي. AC: المصنف المساعد. PD: تمييز الإسقاط. TAC: المصنف المساعد التوأم. SPD: PD المعدلة لـ Stylegan. 2C: فقدان التباين الشرطي. MH: خسارة متعددة المفصلات. ADC: المصنف التمييزي المساعدة. D2D-CE: البيانات المتقاطعة بيانات إلى بيانات.

مقاييس التقييم

طريقة	مكان	بنيان
درجة البدء (IS)	Neupips'16	InceptionV3
مسافة تأسيس فريشيت (FID)	Neupips'17	InceptionV3
تحسين الدقة والاستدعاء	Neupips'19	InceptionV3
درجة دقة المصنف (CAS)	Neupips'19	InceptionV3
الكثافة والتغطية	ICML'20	InceptionV3
intra فئة FID	-	InceptionV3
Slav Fid	ICLR'21	سرب
مقاييس نظيفة (IS ، FID ، PRDC)	CVPR'22	InceptionV3
مقاييس الصديقة للهندسة المعمارية (IS ، FID ، PRDC)	arxiv'22	لا تقتصر على inceptionv3

تقنيات التدريب والاستدلال

طريقة	مكان	الهندسة المعمارية المستهدفة
تجميد	CVPRW'20	باستثناء Stylegan2
التدريب العلوي K.	Neupips'2020	-
DDLs	Neupips'2020	-
سيفا	CVPR'2021	بيغان

استنساخ

نحن نتحقق من استنساخ Gans المنفذ في Studiogan من خلال المقارنة IS و FID مع الأوراق الأصلية. نحدد منصتنا ناجحة في إعادة إنتاج معظم Gans التمثيلية باستثناء PD-GAN و ACGAN و LOGAN و SAGAN و BIGGAN-DEP. FQ تعني مجموعة بيانات Flickr-Faces-HQ (FFHQ). قرارات ImageNet و AFHQV2 و FQ هي 128 و 512 و 1024 على التوالي.

متطلبات

أولاً ، قم بتثبيت Pytorch تلبية بيئتك (على الأقل 1.7):

pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu116

ثم ، استخدم الأمر التالي لتثبيت بقية المكتبات:

pip install tqdm ninja h5py kornia matplotlib pandas sklearn scipy seaborn wandb PyYaml click requests pyspng imageio-ffmpeg timm

مع Docker ، يمكنك استخدام (تم تحديث 14/ديسمبر/2022):

docker pull alex4727/experiment:pytorch113_cuda116

هذا هو أمرنا لصنع حاوية تسمى "Studiogan".

docker run -it --gpus all --shm-size 128g --name StudioGAN -v /path_to_your_folders:/root/code --workdir /root/code alex4727/experiment:pytorch113_cuda116 /bin/zsh

إذا لم يكن إصدار برنامج تشغيل NVIDIA الخاص بك لا يفي بالمتطلبات ، فيمكنك محاولة الإضافة أدناه إلى الأمر أعلاه.

--env NVIDIA_DISABLE_REQUIRE=true

مجموعة البيانات

CIFAR10/CIFAR100: ستقوم Studiogan بتنزيل مجموعة البيانات تلقائيًا بمجرد تنفيذ main.py
Tiny ImageNet ، ImageNet ، أو مجموعة بيانات مخصصة:
1. قم بتنزيل Tiny ImageNet ، Baby ImageNet ، Papa ImageNet ، Grandpa ImageNet ، ImageNet. قم بإعداد مجموعة البيانات الخاصة بك.
2. اجعل بنية المجلد لمجموعة البيانات على النحو التالي:

 data
└── ImageNet, Tiny_ImageNet, Baby ImageNet, Papa ImageNet, or Grandpa ImageNet
    ├── train
    │   ├── cls0
    │   │   ├── train0.png
    │   │   ├── train1.png
    │   │   └── ...
    │   ├── cls1
    │   └── ...
    └── valid
        ├── cls0
        │   ├── valid0.png
        │   ├── valid1.png
        │   └── ...
        ├── cls1
        └── ...

بداية سريعة

قبل البدء ، يجب على المستخدمين تسجيل الدخول إلى WANDB باستخدام مفتاح API الشخصي الخاص بهم.

wandb login PERSONAL_API_KEY

من الإصدار 0.3.0 ، يمكنك الآن تحديد مقاييس التقييم التي يجب استخدامها من خلال خيار -metrics . عدم تحديد الإعدادات الافتراضية للخيار لحساب FID فقط. IE -metrics is fid يحسب فقط هو و -Fid و -metrics none Skips تقييم.

Train ( -t ) and Evaluate IS ، FID ، PRC ، REC ، DNS ، CVG ( -metrics is fid prdc ) من النموذج المحدد في CONFIG_PATH باستخدام GPU 0 .

CUDA_VISIBLE_DEVICES=0 python3 src/main.py -t -metrics is fid prdc -cfg CONFIG_PATH -data DATA_PATH -save SAVE_PATH

الصور المسبقة للتدريب والتقييم باستخدام مرشح pil.lanczos ( --pre_resizer lanczos ). بعد ذلك ، قم بتدريب ( -t ) وتقييم الودية ، ودية ، ودية ، ودية ، ودية ، ودية ، ودية ، ودية ، ودية ، ودية ( -metrics is fid prdc --post_resizer clean ) للنموذج المحدد في CONFIG_PATH باستخدام GPU 0 .

CUDA_VISIBLE_DEVICES=0 python3 src/main.py -t -metrics is fid prdc --pre_resizer lanczos --post_resizer clean -cfg CONFIG_PATH -data DATA_PATH -save SAVE_PATH

Train ( -t ) وتقييم FID للنموذج المحدد في CONFIG_PATH من خلال DataParallel باستخدام وحدات معالجة الرسومات (0, 1, 2, 3) . لا يتطلب تقييم FID حجة ( -metrics )!

CUDA_VISIBLE_DEVICES=0,1,2,3 python3 src/main.py -t -cfg CONFIG_PATH -data DATA_PATH -save SAVE_PATH

القطار ( -t ) وتقييم التقييم ( -metrics none ) للنموذج المحدد في CONFIG_PATH من خلال DistributedDataParallel باستخدام GPUs (0, 1, 2, 3) ، Synchronized batch norm ، Mixed precision .

 export MASTER_ADDR= " localhost "
export MASTER_PORT=2222
CUDA_VISIBLE_DEVICES=0,1,2,3 python3 src/main.py -t -metrics none -cfg CONFIG_PATH -data DATA_PATH -save SAVE_PATH -DDP -sync_bn -mpc

جرب python3 src/main.py لمعرفة الخيارات المتاحة.

تقنيات التدريب/الاختبار المدعومة

تحميل جميع البيانات في الذاكرة الرئيسية ( -hdf5 -l )

CUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -t -hdf5 -l -cfg CONFIG_PATH -data DATA_PATH -save SAVE_PATH

distributedDataparallay (يرجى الرجوع إلى هنا) ( -DDP )

 # ## NODE_0, 4_GPUs, All ports are open to NODE_1
~ /code>>> export MASTER_ADDR=PUBLIC_IP_OF_NODE_0
~ /code>>> export MASTER_PORT=AVAILABLE_PORT_OF_NODE_0
~ /code/PyTorch-StudioGAN>>> CUDA_VISIBLE_DEVICES=0,1,2,3 python3 src/main.py -t -DDP -tn 2 -cn 0 -cfg CONFIG_PATH -data DATA_PATH -save SAVE_PATH

 # ## NODE_1, 4_GPUs, All ports are open to NODE_0
~ /code>>> export MASTER_ADDR=PUBLIC_IP_OF_NODE_0
~ /code>>> export MASTER_PORT=AVAILABLE_PORT_OF_NODE_0
~ /code/PyTorch-StudioGAN>>> CUDA_VISIBLE_DEVICES=0,1,2,3 python3 src/main.py -t -DDP -tn 2 -cn 1 -cfg CONFIG_PATH -data DATA_PATH -save SAVE_PATH

التدريب الدقيق المختلط ( -mpc )

CUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -t -mpc -cfg CONFIG_PATH -data DATA_PATH -save SAVE_PATH

تغيير إحصائيات تطبيع الدُفعات

 # Synchronized batchNorm (-sync_bn)
CUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -t -sync_bn -cfg CONFIG_PATH -data DATA_PATH -save SAVE_PATH

# Standing statistics (-std_stat, -std_max, -std_step)
CUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -std_stat -std_max STD_MAX -std_step STD_STEP -cfg CONFIG_PATH -ckpt CKPT -data DATA_PATH -save SAVE_PATH

# Batch statistics (-batch_stat)
CUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -batch_stat -cfg CONFIG_PATH -ckpt CKPT -data DATA_PATH -save SAVE_PATH

خدعة الاقتطاع

CUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py --truncation_factor TRUNCATION_FACTOR -cfg CONFIG_PATH -ckpt CKPT -data DATA_PATH -save SAVE_PATH

ddls ( -lgv -lgv_rate -lgv_std -lgv_decay -lgv_decay_steps -lgv_steps )

CUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -lgv -lgv_rate LGV_RATE -lgv_std LGV_STD -lgv_decay LGV_DECAY -lgv_decay_steps LGV_DECAY_STEPS -lgv_steps LGV_STEPS -cfg CONFIG_PATH -ckpt CKPT -data DATA_PATH -save SAVE_PATH

تجميد التمييز ( -freezeD )

CUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -t --freezeD FREEZED -ckpt SOURCE_CKPT -cfg TARGET_CONFIG_PATH -data DATA_PATH -save SAVE_PATH

تحليل الصور المولدة

يدعم Studiogan Image visualization, K-nearest neighbor analysis, Linear interpolation, Frequency analysis, TSNE analysis, and Semantic factorization . سيتم حفظ جميع النتائج في SAVE_DIR/figures/RUN_NAME/*.png .

تصور الصورة

CUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -v -cfg CONFIG_PATH -ckpt CKPT -save SAVE_DIR

تحليل الجوار K-nearest (لقد تم إصلاح K = 7 ، الصور في العمود الأول تم إنشاؤها.)

CUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -knn -cfg CONFIG_PATH -ckpt CKPT -data DATA_PATH -save SAVE_PATH

الاستيفاء الخطي (ينطبق فقط على نماذج RESNET الكبيرة الشرطية)

CUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -itp -cfg CONFIG_PATH -ckpt CKPT -save SAVE_DIR

تحليل التردد

CUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -fa -cfg CONFIG_PATH -ckpt CKPT -data DATA_PATH -save SAVE_PATH

تحليل tsne

CUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -tsne -cfg CONFIG_PATH -ckpt CKPT -data DATA_PATH -save SAVE_PATH

العوامل الدلالية لبيجان

CUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -sefa -sefa_axis SEFA_AXIS -sefa_max SEFA_MAX -cfg CONFIG_PATH -ckpt CKPT -save SAVE_PATH

تدريب الجانس

يدعم Studiogan تدريب 30 ممثل من DCGAN إلى Stylegan3-R.

استخدمنا البرامج النصية المختلفة اعتمادًا على مجموعة البيانات والنموذج ، وهي كما يلي:

CIFAR10

CUDA_VISIBLE_DEVICES=0 python3 src/main.py -t -hdf5 -l -std_stat -std_max STD_MAX -std_step STD_STEP -metrics is fid prdc -ref " train " -cfg CONFIG_PATH -data DATA_PATH -save SAVE_PATH -mpc --post_resizer " friendly " --eval_backbone " InceptionV3_tf "

CIFAR10 باستخدام stylegan2/3

CUDA_VISIBLE_DEVICES=0 python3 src/main.py -t -hdf5 -l -metrics is fid prdc -ref " train " -cfg CONFIG_PATH -data DATA_PATH -save SAVE_PATH -mpc --post_resizer " friendly " --eval_backbone " InceptionV3_tf "

طفل/بابا/جد ImageNet و ImageNet

CUDA_VISIBLE_DEVICES=0,1,2,3 python3 src/main.py -t -hdf5 -l -sync_bn -std_stat -std_max STD_MAX -std_step STD_STEP -metrics is fid prdc -ref " train " -cfg CONFIG_PATH -data DATA_PATH -save SAVE_PATH -mpc --pre_resizer " lanczos " --post_resizer " friendly " --eval_backbone " InceptionV3_tf "

AFHQV2

 export MASTER_ADDR= " localhost "
export MASTER_PORT=8888
CUDA_VISIBLE_DEVICES=0,1,2,3 python3 src/main.py -t -metrics is fid prdc -ref " train " -cfg CONFIG_PATH -data DATA_PATH -save SAVE_PATH -mpc --pre_resizer " lanczos " --post_resizer " friendly " --eval_backbone " InceptionV3_tf "

FFHQ

 export MASTER_ADDR= " localhost "
export MASTER_PORT=8888
CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 python3 src/main.py -t -metrics is fid prdc -ref " train " -cfg CONFIG_PATH -data DATA_PATH -save SAVE_PATH -mpc --pre_resizer " lanczos " --post_resizer " friendly " --eval_backbone " InceptionV3_tf "

المقاييس

يدعم Studiogan درجة البداية ، ومسافة تأسيس Frechet ، وتحسين الدقة والاستدعاء ، والكثافة والتغطية ، ودرجات الدقة داخل الفئة ، ودرج دقة المصنف. يمكن للمستخدمين الحصول على درجات Intra-Class FID, Classifier Accuracy Score وخيارات -iFID, -GAN_train, and -GAN_test ، على التوالي.

يمكن للمستخدمين تغيير العمود الفقري للتقييم من InceptionV3 إلى Resnet50 أو Swav أو Dino أو Swin باستخدام- --eval_backbone ResNet50_torch, SwAV_torch, DINO_torch, or Swin-T_torch .

بالإضافة إلى ذلك ، يمكن للمستخدمين حساب المقاييس باستخدام خيار --post_resizer clean or friendly .

1. درجة البداية (IS)

درجة البداية (IS) هي مقياس لقياس مقدار ما يولد GAN عالي الدقة والمواد المتنوعة. يتطلب الحساب شبكة Incepted-V3 التي تم تدريبها مسبقًا. لاحظ أننا لا نقسم مجموعة بيانات إلى عشرة أضعاف لحسابها هي عشر مرات.

2.

FID هو مقياس مستخدم على نطاق واسع لتقييم أداء نموذج GAN. يتطلب حساب FID شبكة Incepted-V3 التي تم تدريبها مسبقًا ، وتستخدم الأساليب الحديثة FID المستندة إلى TensorFlow. يستخدم Studiogan FID المستند إلى Pytorch لاختبار نماذج GAN في نفس بيئة Pytorch. نوضح أن تطبيق FID المستند إلى Pytorch يوفر نفس النتائج تقريبًا مع تنفيذ TensorFlow (انظر الملحق F من ورقة Cortragan).

3. تحسين الدقة والاستدعاء (PRC ، REC)

تم تطوير الدقة المحسنة والاستدعاء لتعويض أوجه القصور في الدقة والاستدعاء. مثل ، FID ، يتطلب حساب الدقة المحسّنة والاستدعاء نموذج التأسيس-V3 الذي تم تدريبه مسبقًا. يستخدم Studiogan تطبيق Pytorch الذي يوفره مطورو الكثافة والتغطية.

4. الكثافة والتغطية (DNS ، CVG)

يمكن لمقاييس الكثافة والتغطية تقدير إخلاص وتنوع الصور التي تم إنشاؤها باستخدام نموذج Inception-V3 الذي تم تدريبه مسبقًا. من المعروف أن المقاييس قوية في القيم المتطرفة ، ويمكنها اكتشاف توزيعات حقيقية ومزيفة متطابقة. يستخدم Studiogan تطبيق Pytorch الرسمي للمؤلفين ، ويتبع Studiogan اقتراح المؤلف للاختيار المفرط.

معيار

※ نرحب دائمًا مساهمتك إذا وجدت أي تنفيذ خاطئ ، وخلل ، وسجلات خاطئة.

أبلغنا عن أن الأفضل هو ، FID ، الدقة المحسّنة والاستدعاء ، والكثافة وتغطية Gans.

لتنزيل جميع نقاط التفتيش المبلغ عنها في Studiogan ، يرجى النقر هنا (Hugging Face Hub).

يمكنك تقييم نقطة التفتيش عن طريق إضافة خيار -ckpt CKPT_PATH مع مسار التكوين المقابل -cfg CORRESPONDING_CONFIG_PATH

1. جانس من Studiogan

تعد قرارات CIFAR10 و Baby ImageNet و Papa ImageNet و Grandpa ImageNet و ImageNet و AFHQV2 و FQ هي 32 و 64 و 64 و 64 و 128 و 512 و 1024 على التوالي.

نستخدم نفس العدد من الصور التي تم إنشاؤها مثل صور التدريب لمسافة تأسيس Frechet (FID) ، والدقة ، والاستدعاء ، والكثافة ، وحساب التغطية. بالنسبة للتجارب التي تستخدم Baby/Papa/Grandpa ImageNet و ImageNet ، فإننا نستخدم بشكل استثنائي صورًا مزيفة 50K مقابل مجموعة تدريب كاملة كصور حقيقية.

يمكن تنزيل جميع الميزات ولحظات مجموعات البيانات المرجعية عبر الميزات واللحظات .

2. نماذج توليدية أخرى

قرارات ImageNet-128 و ImageNet 256 هي 128 و 256 ، على التوالي.

يمكن تنزيل جميع الصور المستخدمة في Benchmark عبر محرك أقراص واحد (سيتم تحميله قريبًا).

تقييم مجلدات الصور مسبقًا

التقييم IS ، FID ، PRC ، REC ، DNS ، CVG ( -metrics is fid prdc ) من مجلدات الصور (المعالجة بالفعل) المحفوظة في DSET1 و DSET2 باستخدام وحدات معالجة الرسومات (0,...,N) .

CUDA_VISIBLE_DEVICES=0,...,N python3 src/evaluate.py -metrics is fid prdc --dset1 DSET1 --dset2 DSET2

التقييم IS ، FID ، PRC ، REC ، DNS ، CVG ( -metrics is fid prdc ) من مجلد الصورة المحفوظة في DSET2 باستخدام ميزات مسبقة الحساب ( --dset1_feats DSET1_FEATS ) ، لحظات DSET1 ( --dset1_moments DSET1_MOMENTS ) ، و GPUS (0,...,N) .

CUDA_VISIBLE_DEVICES=0,...,N python3 src/evaluate.py -metrics is fid prdc --dset1_feats DSET1_FEATS --dset1_moments DSET1_MOMENTS --dset2 DSET2

تقييم الودودة ، ودية FID ، ودية-PRC ، ودية الودية ، ودية الودية ، والـ CVG الودية ( -metrics is fid prdc --post_resizer friendly ) لمجلدات الصور المحفوظة في DSET1 و DSET2 من خلال DistributedDataParallel باستخدام وحدات معالجة الرسومات (0,...,N) .

 export MASTER_ADDR= " localhost "
export MASTER_PORT=2222
CUDA_VISIBLE_DEVICES=0,...,N python3 src/evaluate.py -metrics is fid prdc --post_resizer friendly --dset1 DSET1 --dset2 DSET2 -DDP

studiogan تشكر repos التالية لمشاركة الكود

[ترخيص معهد ماساتشوستس للتكنولوجيا] مزامنة الدفع: https://github.com/vacancy/synchronized-batchnorm-pytorch

[ترخيص معهد ماساتشوستس للتكنولوجيا] وحدة الاهتمام الذاتي: https://github.com/voletiv/self-attention-gan-pytorch

[ترخيص معهد ماساتشوستس للتكنولوجيا] diffaugment: https://github.com/mit-han-lab/data-

[mit_license] Pytorch تحسين الدقة واستدعاء: https://github.com/clovaai/generative-valuation-prdc

[MIT_LICENSE] كثافة وتغطية Pytorch: https://github.com/clovaai/generative-evaluation-prdc

[ترخيص MIT] Pytorch Clean-FID: https://github.com/gaparmar/clean-fid

[NVIDIA Source Code License] Stylegan2: https://github.com/nvlabs/stylegan2

[ترخيص رمز المصدر NVIDIA] تعزيز التمييز التكيفي: https://github.com/nvlabs/stylegan2

[ترخيص Apache] Pytorch Fid: https://github.com/mseitzer/pytorch-fid

رخصة

Pytorch-Studiogan هي مكتبة مفتوحة المصدر تحت رخصة معهد ماساتشوستس للتكنولوجيا (MIT). ومع ذلك ، يتم ترخيص أجزاء من المكتبة بموجب شروط ترخيص مميزة: تم ترخيص Stylegan2 و Stylegan2 -ADA و Stylegan3 بموجب ترخيص رمز مصدر NVIDIA ، ويتم ترخيص Pytorch-FID بموجب ترخيص Apache.

اقتباس

تم إنشاء Studiogan لمشاريع البحث التالية. يرجى الاستشهاد بعملنا إذا كنت تستخدم Studiogan.

 @article { kang2023StudioGANpami ,
  title   = { {StudioGAN: A Taxonomy and Benchmark of GANs for Image Synthesis} } ,
  author  = { MinGuk Kang and Joonghyuk Shin and Jaesik Park } ,
  journal = { IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI) } ,
  year    = { 2023 }
}

 @inproceedings { kang2021ReACGAN ,
  title   = { {Rebooting ACGAN: Auxiliary Classifier GANs with Stable Training} } ,
  author  = { Minguk Kang, Woohyeon Shim, Minsu Cho, and Jaesik Park } ,
  journal = { Conference on Neural Information Processing Systems (NeurIPS) } ,
  year    = { 2021 }
}

 @inproceedings { kang2020ContraGAN ,
  title   = { {ContraGAN: Contrastive Learning for Conditional Image Generation} } ,
  author  = { Minguk Kang and Jaesik Park } ,
  journal = { Conference on Neural Information Processing Systems (NeurIPS) } ,
  year    = { 2020 }
}

[1] تجري التجارب على ImageNet Tiny باستخدام بنية RESNET بدلاً من CNN.

[2] إعادة تنفيذ ACGAN (ICML'17) مع تعديلات طفيفة ، والتي تجلب تعزيزًا قويًا للأداء للتجربة باستخدام CIFAR10.

يوسع