Studiogan هي مكتبة Pytorch التي توفر تطبيقات شبكات الخصومة التمثيلية (GANS) لتوليد الصور المشروط/غير المشروط. يهدف Studiogan إلى تقديم ملعب متطابق لـ GANS الحديثة حتى يتمكن باحثو التعلم الآليون بسهولة ومقارنة فكرة جديدة.
علاوة على ذلك ، يوفر Studiogan معيارًا غير مسبوق للنماذج التوليدية. يتضمن المؤشر نتائج من Gans (Biggan-Deep ، Stylegan-XL) ، نماذج الانحدار التلقائي (Maskgit ، RQ-Transformer) ، ونماذج الانتشار (LSGM ++ ، CLD-SGM ، ADM-GU).
| طريقة | مكان | بنيان | GC | العاصمة | خسارة | ema |
|---|---|---|---|---|---|---|
| DCGAN | arxiv'15 | DCGAN/RESNETGAN 1 | ن/أ | ن/أ | الفانيليا | خطأ شنيع |
| إنفوجان | Nips'16 | DCGAN/RESNETGAN 1 | ن/أ | ن/أ | الفانيليا | خطأ شنيع |
| Lsgan | ICCV'17 | DCGAN/RESNETGAN 1 | ن/أ | ن/أ | أقل sqaure | خطأ شنيع |
| Ggan | arxiv'17 | DCGAN/RESNETGAN 1 | ن/أ | ن/أ | مفصل | خطأ شنيع |
| Wgan-WC | ICLR'17 | Resnetgan | ن/أ | ن/أ | Wasserstein | خطأ شنيع |
| Wgan-GP | Nips'17 | Resnetgan | ن/أ | ن/أ | Wasserstein | خطأ شنيع |
| wgan-dra | arxiv'17 | Resnetgan | ن/أ | ن/أ | Wasserstein | خطأ شنيع |
| Acgan-Mod 2 | - | Resnetgan | CBN | AC | مفصل | خطأ شنيع |
| PDGAN | ICLR'18 | Resnetgan | CBN | PD | مفصل | خطأ شنيع |
| سنجان | ICLR'18 | Resnetgan | CBN | PD | مفصل | خطأ شنيع |
| ساجان | ICML'19 | Resnetgan | CBN | PD | مفصل | خطأ شنيع |
| تاكجان | Neupips'19 | بيغان | CBN | تاك | مفصل | حقيقي |
| لان | ICML'19 | Resnetgan | ن/أ | ن/أ | الفانيليا | خطأ شنيع |
| بيغان غير المشروط | ICLR'19 | بيغان | ن/أ | ن/أ | مفصل | حقيقي |
| بيغان | ICLR'19 | بيغان | CBN | PD | مفصل | حقيقي |
| Biggan-Deparegan | ICLR'19 | Biggan-Deep Comparegan | CBN | PD | مفصل | حقيقي |
| Biggan-Deep-Studiogan | - | Biggan-Deep Studiogan | CBN | PD | مفصل | حقيقي |
| Stylegan2 | CVPR '20 | Stylegan2 | كاديان | SPD | اللوجستية | حقيقي |
| كرغان | ICLR'20 | بيغان | CBN | PD | مفصل | حقيقي |
| Icrgan | aaai'21 | بيغان | CBN | PD | مفصل | حقيقي |
| لوجان | arxiv'19 | Resnetgan | CBN | PD | مفصل | حقيقي |
| كونتاجان | Neupips'20 | بيغان | CBN | 2C | مفصل | حقيقي |
| MHGAN | WACV'21 | بيغان | CBN | MH | MH | حقيقي |
| Biggan + Diffaugment | Neupips'20 | بيغان | CBN | PD | مفصل | حقيقي |
| Stylegan2 + ADA | Neupips'20 | Stylegan2 | كاديان | SPD | اللوجستية | حقيقي |
| Biggan + Lecam | CVPR'2021 | بيغان | CBN | PD | مفصل | حقيقي |
| Reacgan | Neupips'21 | بيغان | CBN | D2D-CE | مفصل | حقيقي |
| Stylegan2 + APA | Neupips'21 | Stylegan2 | كاديان | SPD | اللوجستية | حقيقي |
| stylegan3-t | Neupips'21 | Stylegan3 | كاين | SPD | اللوجستية | حقيقي |
| Stylegan3-R | Neupips'21 | Stylegan3 | كاين | SPD | اللوجستية | حقيقي |
| adcgan | ICML'22 | بيغان | CBN | ADC | مفصل | حقيقي |
يشير GC/DC إلى الطريقة التي حققنا بها معلومات التسمية على المولد أو التمييز.
EMA: التحديث المتوسط المتحرك الأسي إلى المولد. CBN: تطبيع الدُفعات الشرطية. كادان: نسخة مشروطة من تطبيع المثيل التكيفي. AC: المصنف المساعد. PD: تمييز الإسقاط. TAC: المصنف المساعد التوأم. SPD: PD المعدلة لـ Stylegan. 2C: فقدان التباين الشرطي. MH: خسارة متعددة المفصلات. ADC: المصنف التمييزي المساعدة. D2D-CE: البيانات المتقاطعة بيانات إلى بيانات.
| طريقة | مكان | بنيان |
|---|---|---|
| درجة البدء (IS) | Neupips'16 | InceptionV3 |
| مسافة تأسيس فريشيت (FID) | Neupips'17 | InceptionV3 |
| تحسين الدقة والاستدعاء | Neupips'19 | InceptionV3 |
| درجة دقة المصنف (CAS) | Neupips'19 | InceptionV3 |
| الكثافة والتغطية | ICML'20 | InceptionV3 |
| intra فئة FID | - | InceptionV3 |
| Slav Fid | ICLR'21 | سرب |
| مقاييس نظيفة (IS ، FID ، PRDC) | CVPR'22 | InceptionV3 |
| مقاييس الصديقة للهندسة المعمارية (IS ، FID ، PRDC) | arxiv'22 | لا تقتصر على inceptionv3 |
| طريقة | مكان | الهندسة المعمارية المستهدفة |
|---|---|---|
| تجميد | CVPRW'20 | باستثناء Stylegan2 |
| التدريب العلوي K. | Neupips'2020 | - |
| DDLs | Neupips'2020 | - |
| سيفا | CVPR'2021 | بيغان |
نحن نتحقق من استنساخ Gans المنفذ في Studiogan من خلال المقارنة IS و FID مع الأوراق الأصلية. نحدد منصتنا ناجحة في إعادة إنتاج معظم Gans التمثيلية باستثناء PD-GAN و ACGAN و LOGAN و SAGAN و BIGGAN-DEP. FQ تعني مجموعة بيانات Flickr-Faces-HQ (FFHQ). قرارات ImageNet و AFHQV2 و FQ هي 128 و 512 و 1024 على التوالي.
أولاً ، قم بتثبيت Pytorch تلبية بيئتك (على الأقل 1.7):
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu116ثم ، استخدم الأمر التالي لتثبيت بقية المكتبات:
pip install tqdm ninja h5py kornia matplotlib pandas sklearn scipy seaborn wandb PyYaml click requests pyspng imageio-ffmpeg timmمع Docker ، يمكنك استخدام (تم تحديث 14/ديسمبر/2022):
docker pull alex4727/experiment:pytorch113_cuda116هذا هو أمرنا لصنع حاوية تسمى "Studiogan".
docker run -it --gpus all --shm-size 128g --name StudioGAN -v /path_to_your_folders:/root/code --workdir /root/code alex4727/experiment:pytorch113_cuda116 /bin/zshإذا لم يكن إصدار برنامج تشغيل NVIDIA الخاص بك لا يفي بالمتطلبات ، فيمكنك محاولة الإضافة أدناه إلى الأمر أعلاه.
--env NVIDIA_DISABLE_REQUIRE=true CIFAR10/CIFAR100: ستقوم Studiogan بتنزيل مجموعة البيانات تلقائيًا بمجرد تنفيذ main.py
Tiny ImageNet ، ImageNet ، أو مجموعة بيانات مخصصة:
data
└── ImageNet, Tiny_ImageNet, Baby ImageNet, Papa ImageNet, or Grandpa ImageNet
├── train
│ ├── cls0
│ │ ├── train0.png
│ │ ├── train1.png
│ │ └── ...
│ ├── cls1
│ └── ...
└── valid
├── cls0
│ ├── valid0.png
│ ├── valid1.png
│ └── ...
├── cls1
└── ...
قبل البدء ، يجب على المستخدمين تسجيل الدخول إلى WANDB باستخدام مفتاح API الشخصي الخاص بهم.
wandb login PERSONAL_API_KEY من الإصدار 0.3.0 ، يمكنك الآن تحديد مقاييس التقييم التي يجب استخدامها من خلال خيار -metrics . عدم تحديد الإعدادات الافتراضية للخيار لحساب FID فقط. IE -metrics is fid يحسب فقط هو و -Fid و -metrics none Skips تقييم.
-t ) and Evaluate IS ، FID ، PRC ، REC ، DNS ، CVG ( -metrics is fid prdc ) من النموذج المحدد في CONFIG_PATH باستخدام GPU 0 . CUDA_VISIBLE_DEVICES=0 python3 src/main.py -t -metrics is fid prdc -cfg CONFIG_PATH -data DATA_PATH -save SAVE_PATH--pre_resizer lanczos ). بعد ذلك ، قم بتدريب ( -t ) وتقييم الودية ، ودية ، ودية ، ودية ، ودية ، ودية ، ودية ، ودية ، ودية ، ودية ( -metrics is fid prdc --post_resizer clean ) للنموذج المحدد في CONFIG_PATH باستخدام GPU 0 . CUDA_VISIBLE_DEVICES=0 python3 src/main.py -t -metrics is fid prdc --pre_resizer lanczos --post_resizer clean -cfg CONFIG_PATH -data DATA_PATH -save SAVE_PATH-t ) وتقييم FID للنموذج المحدد في CONFIG_PATH من خلال DataParallel باستخدام وحدات معالجة الرسومات (0, 1, 2, 3) . لا يتطلب تقييم FID حجة ( -metrics )! CUDA_VISIBLE_DEVICES=0,1,2,3 python3 src/main.py -t -cfg CONFIG_PATH -data DATA_PATH -save SAVE_PATH-t ) وتقييم التقييم ( -metrics none ) للنموذج المحدد في CONFIG_PATH من خلال DistributedDataParallel باستخدام GPUs (0, 1, 2, 3) ، Synchronized batch norm ، Mixed precision . export MASTER_ADDR= " localhost "
export MASTER_PORT=2222
CUDA_VISIBLE_DEVICES=0,1,2,3 python3 src/main.py -t -metrics none -cfg CONFIG_PATH -data DATA_PATH -save SAVE_PATH -DDP -sync_bn -mpc جرب python3 src/main.py لمعرفة الخيارات المتاحة.
تحميل جميع البيانات في الذاكرة الرئيسية ( -hdf5 -l )
CUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -t -hdf5 -l -cfg CONFIG_PATH -data DATA_PATH -save SAVE_PATH distributedDataparallay (يرجى الرجوع إلى هنا) ( -DDP )
# ## NODE_0, 4_GPUs, All ports are open to NODE_1
~ /code>>> export MASTER_ADDR=PUBLIC_IP_OF_NODE_0
~ /code>>> export MASTER_PORT=AVAILABLE_PORT_OF_NODE_0
~ /code/PyTorch-StudioGAN>>> CUDA_VISIBLE_DEVICES=0,1,2,3 python3 src/main.py -t -DDP -tn 2 -cn 0 -cfg CONFIG_PATH -data DATA_PATH -save SAVE_PATH # ## NODE_1, 4_GPUs, All ports are open to NODE_0
~ /code>>> export MASTER_ADDR=PUBLIC_IP_OF_NODE_0
~ /code>>> export MASTER_PORT=AVAILABLE_PORT_OF_NODE_0
~ /code/PyTorch-StudioGAN>>> CUDA_VISIBLE_DEVICES=0,1,2,3 python3 src/main.py -t -DDP -tn 2 -cn 1 -cfg CONFIG_PATH -data DATA_PATH -save SAVE_PATH التدريب الدقيق المختلط ( -mpc )
CUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -t -mpc -cfg CONFIG_PATH -data DATA_PATH -save SAVE_PATHتغيير إحصائيات تطبيع الدُفعات
# Synchronized batchNorm (-sync_bn)
CUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -t -sync_bn -cfg CONFIG_PATH -data DATA_PATH -save SAVE_PATH
# Standing statistics (-std_stat, -std_max, -std_step)
CUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -std_stat -std_max STD_MAX -std_step STD_STEP -cfg CONFIG_PATH -ckpt CKPT -data DATA_PATH -save SAVE_PATH
# Batch statistics (-batch_stat)
CUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -batch_stat -cfg CONFIG_PATH -ckpt CKPT -data DATA_PATH -save SAVE_PATHخدعة الاقتطاع
CUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py --truncation_factor TRUNCATION_FACTOR -cfg CONFIG_PATH -ckpt CKPT -data DATA_PATH -save SAVE_PATH ddls ( -lgv -lgv_rate -lgv_std -lgv_decay -lgv_decay_steps -lgv_steps )
CUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -lgv -lgv_rate LGV_RATE -lgv_std LGV_STD -lgv_decay LGV_DECAY -lgv_decay_steps LGV_DECAY_STEPS -lgv_steps LGV_STEPS -cfg CONFIG_PATH -ckpt CKPT -data DATA_PATH -save SAVE_PATH تجميد التمييز ( -freezeD )
CUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -t --freezeD FREEZED -ckpt SOURCE_CKPT -cfg TARGET_CONFIG_PATH -data DATA_PATH -save SAVE_PATH يدعم Studiogan Image visualization, K-nearest neighbor analysis, Linear interpolation, Frequency analysis, TSNE analysis, and Semantic factorization . سيتم حفظ جميع النتائج في SAVE_DIR/figures/RUN_NAME/*.png .
CUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -v -cfg CONFIG_PATH -ckpt CKPT -save SAVE_DIR
CUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -knn -cfg CONFIG_PATH -ckpt CKPT -data DATA_PATH -save SAVE_PATHCUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -itp -cfg CONFIG_PATH -ckpt CKPT -save SAVE_DIRCUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -fa -cfg CONFIG_PATH -ckpt CKPT -data DATA_PATH -save SAVE_PATHCUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -tsne -cfg CONFIG_PATH -ckpt CKPT -data DATA_PATH -save SAVE_PATHCUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -sefa -sefa_axis SEFA_AXIS -sefa_max SEFA_MAX -cfg CONFIG_PATH -ckpt CKPT -save SAVE_PATHيدعم Studiogan تدريب 30 ممثل من DCGAN إلى Stylegan3-R.
استخدمنا البرامج النصية المختلفة اعتمادًا على مجموعة البيانات والنموذج ، وهي كما يلي:
CUDA_VISIBLE_DEVICES=0 python3 src/main.py -t -hdf5 -l -std_stat -std_max STD_MAX -std_step STD_STEP -metrics is fid prdc -ref " train " -cfg CONFIG_PATH -data DATA_PATH -save SAVE_PATH -mpc --post_resizer " friendly " --eval_backbone " InceptionV3_tf "CUDA_VISIBLE_DEVICES=0 python3 src/main.py -t -hdf5 -l -metrics is fid prdc -ref " train " -cfg CONFIG_PATH -data DATA_PATH -save SAVE_PATH -mpc --post_resizer " friendly " --eval_backbone " InceptionV3_tf "CUDA_VISIBLE_DEVICES=0,1,2,3 python3 src/main.py -t -hdf5 -l -sync_bn -std_stat -std_max STD_MAX -std_step STD_STEP -metrics is fid prdc -ref " train " -cfg CONFIG_PATH -data DATA_PATH -save SAVE_PATH -mpc --pre_resizer " lanczos " --post_resizer " friendly " --eval_backbone " InceptionV3_tf " export MASTER_ADDR= " localhost "
export MASTER_PORT=8888
CUDA_VISIBLE_DEVICES=0,1,2,3 python3 src/main.py -t -metrics is fid prdc -ref " train " -cfg CONFIG_PATH -data DATA_PATH -save SAVE_PATH -mpc --pre_resizer " lanczos " --post_resizer " friendly " --eval_backbone " InceptionV3_tf " export MASTER_ADDR= " localhost "
export MASTER_PORT=8888
CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 python3 src/main.py -t -metrics is fid prdc -ref " train " -cfg CONFIG_PATH -data DATA_PATH -save SAVE_PATH -mpc --pre_resizer " lanczos " --post_resizer " friendly " --eval_backbone " InceptionV3_tf " يدعم Studiogan درجة البداية ، ومسافة تأسيس Frechet ، وتحسين الدقة والاستدعاء ، والكثافة والتغطية ، ودرجات الدقة داخل الفئة ، ودرج دقة المصنف. يمكن للمستخدمين الحصول على درجات Intra-Class FID, Classifier Accuracy Score وخيارات -iFID, -GAN_train, and -GAN_test ، على التوالي.
يمكن للمستخدمين تغيير العمود الفقري للتقييم من InceptionV3 إلى Resnet50 أو Swav أو Dino أو Swin باستخدام- --eval_backbone ResNet50_torch, SwAV_torch, DINO_torch, or Swin-T_torch .
بالإضافة إلى ذلك ، يمكن للمستخدمين حساب المقاييس باستخدام خيار --post_resizer clean or friendly .
درجة البداية (IS) هي مقياس لقياس مقدار ما يولد GAN عالي الدقة والمواد المتنوعة. يتطلب الحساب شبكة Incepted-V3 التي تم تدريبها مسبقًا. لاحظ أننا لا نقسم مجموعة بيانات إلى عشرة أضعاف لحسابها هي عشر مرات.
FID هو مقياس مستخدم على نطاق واسع لتقييم أداء نموذج GAN. يتطلب حساب FID شبكة Incepted-V3 التي تم تدريبها مسبقًا ، وتستخدم الأساليب الحديثة FID المستندة إلى TensorFlow. يستخدم Studiogan FID المستند إلى Pytorch لاختبار نماذج GAN في نفس بيئة Pytorch. نوضح أن تطبيق FID المستند إلى Pytorch يوفر نفس النتائج تقريبًا مع تنفيذ TensorFlow (انظر الملحق F من ورقة Cortragan).
تم تطوير الدقة المحسنة والاستدعاء لتعويض أوجه القصور في الدقة والاستدعاء. مثل ، FID ، يتطلب حساب الدقة المحسّنة والاستدعاء نموذج التأسيس-V3 الذي تم تدريبه مسبقًا. يستخدم Studiogan تطبيق Pytorch الذي يوفره مطورو الكثافة والتغطية.
يمكن لمقاييس الكثافة والتغطية تقدير إخلاص وتنوع الصور التي تم إنشاؤها باستخدام نموذج Inception-V3 الذي تم تدريبه مسبقًا. من المعروف أن المقاييس قوية في القيم المتطرفة ، ويمكنها اكتشاف توزيعات حقيقية ومزيفة متطابقة. يستخدم Studiogan تطبيق Pytorch الرسمي للمؤلفين ، ويتبع Studiogan اقتراح المؤلف للاختيار المفرط.
أبلغنا عن أن الأفضل هو ، FID ، الدقة المحسّنة والاستدعاء ، والكثافة وتغطية Gans.
لتنزيل جميع نقاط التفتيش المبلغ عنها في Studiogan ، يرجى النقر هنا (Hugging Face Hub).
يمكنك تقييم نقطة التفتيش عن طريق إضافة خيار -ckpt CKPT_PATH مع مسار التكوين المقابل -cfg CORRESPONDING_CONFIG_PATH
تعد قرارات CIFAR10 و Baby ImageNet و Papa ImageNet و Grandpa ImageNet و ImageNet و AFHQV2 و FQ هي 32 و 64 و 64 و 64 و 128 و 512 و 1024 على التوالي.
نستخدم نفس العدد من الصور التي تم إنشاؤها مثل صور التدريب لمسافة تأسيس Frechet (FID) ، والدقة ، والاستدعاء ، والكثافة ، وحساب التغطية. بالنسبة للتجارب التي تستخدم Baby/Papa/Grandpa ImageNet و ImageNet ، فإننا نستخدم بشكل استثنائي صورًا مزيفة 50K مقابل مجموعة تدريب كاملة كصور حقيقية.
يمكن تنزيل جميع الميزات ولحظات مجموعات البيانات المرجعية عبر الميزات واللحظات .
قرارات ImageNet-128 و ImageNet 256 هي 128 و 256 ، على التوالي.
يمكن تنزيل جميع الصور المستخدمة في Benchmark عبر محرك أقراص واحد (سيتم تحميله قريبًا).
-metrics is fid prdc ) من مجلدات الصور (المعالجة بالفعل) المحفوظة في DSET1 و DSET2 باستخدام وحدات معالجة الرسومات (0,...,N) . CUDA_VISIBLE_DEVICES=0,...,N python3 src/evaluate.py -metrics is fid prdc --dset1 DSET1 --dset2 DSET2-metrics is fid prdc ) من مجلد الصورة المحفوظة في DSET2 باستخدام ميزات مسبقة الحساب ( --dset1_feats DSET1_FEATS ) ، لحظات DSET1 ( --dset1_moments DSET1_MOMENTS ) ، و GPUS (0,...,N) . CUDA_VISIBLE_DEVICES=0,...,N python3 src/evaluate.py -metrics is fid prdc --dset1_feats DSET1_FEATS --dset1_moments DSET1_MOMENTS --dset2 DSET2-metrics is fid prdc --post_resizer friendly ) لمجلدات الصور المحفوظة في DSET1 و DSET2 من خلال DistributedDataParallel باستخدام وحدات معالجة الرسومات (0,...,N) . export MASTER_ADDR= " localhost "
export MASTER_PORT=2222
CUDA_VISIBLE_DEVICES=0,...,N python3 src/evaluate.py -metrics is fid prdc --post_resizer friendly --dset1 DSET1 --dset2 DSET2 -DDP[ترخيص معهد ماساتشوستس للتكنولوجيا] مزامنة الدفع: https://github.com/vacancy/synchronized-batchnorm-pytorch
[ترخيص معهد ماساتشوستس للتكنولوجيا] وحدة الاهتمام الذاتي: https://github.com/voletiv/self-attention-gan-pytorch
[ترخيص معهد ماساتشوستس للتكنولوجيا] diffaugment: https://github.com/mit-han-lab/data-
[mit_license] Pytorch تحسين الدقة واستدعاء: https://github.com/clovaai/generative-valuation-prdc
[MIT_LICENSE] كثافة وتغطية Pytorch: https://github.com/clovaai/generative-evaluation-prdc
[ترخيص MIT] Pytorch Clean-FID: https://github.com/gaparmar/clean-fid
[NVIDIA Source Code License] Stylegan2: https://github.com/nvlabs/stylegan2
[ترخيص رمز المصدر NVIDIA] تعزيز التمييز التكيفي: https://github.com/nvlabs/stylegan2
[ترخيص Apache] Pytorch Fid: https://github.com/mseitzer/pytorch-fid
Pytorch-Studiogan هي مكتبة مفتوحة المصدر تحت رخصة معهد ماساتشوستس للتكنولوجيا (MIT). ومع ذلك ، يتم ترخيص أجزاء من المكتبة بموجب شروط ترخيص مميزة: تم ترخيص Stylegan2 و Stylegan2 -ADA و Stylegan3 بموجب ترخيص رمز مصدر NVIDIA ، ويتم ترخيص Pytorch-FID بموجب ترخيص Apache.
تم إنشاء Studiogan لمشاريع البحث التالية. يرجى الاستشهاد بعملنا إذا كنت تستخدم Studiogan.
@article { kang2023StudioGANpami ,
title = { {StudioGAN: A Taxonomy and Benchmark of GANs for Image Synthesis} } ,
author = { MinGuk Kang and Joonghyuk Shin and Jaesik Park } ,
journal = { IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI) } ,
year = { 2023 }
} @inproceedings { kang2021ReACGAN ,
title = { {Rebooting ACGAN: Auxiliary Classifier GANs with Stable Training} } ,
author = { Minguk Kang, Woohyeon Shim, Minsu Cho, and Jaesik Park } ,
journal = { Conference on Neural Information Processing Systems (NeurIPS) } ,
year = { 2021 }
} @inproceedings { kang2020ContraGAN ,
title = { {ContraGAN: Contrastive Learning for Conditional Image Generation} } ,
author = { Minguk Kang and Jaesik Park } ,
journal = { Conference on Neural Information Processing Systems (NeurIPS) } ,
year = { 2020 }
}[1] تجري التجارب على ImageNet Tiny باستخدام بنية RESNET بدلاً من CNN.
[2] إعادة تنفيذ ACGAN (ICML'17) مع تعديلات طفيفة ، والتي تجلب تعزيزًا قويًا للأداء للتجربة باستخدام CIFAR10.