Проект | Бумага | Слайды | Colab-fid | Colab-Resize | Таблицы таблицы лидеров
Быстрый старт: рассчитайте FID | Рассчитайте ребенка
[Новая] вычисление FID с использованием функций клипа [Kynkäänniemi et al, 2022] теперь поддерживается. Смотрите здесь для более подробной информации.
Расчет FID включает в себя множество этапов, которые могут создавать несоответствия в окончательной метрике. Как показано ниже, различные реализации используют различные низкоуровневые квантовании изображения и изменения размера, последние из которых часто реализуются неправильно.
Мы предоставляем простую в использовании библиотеку для решения вышеуказанных проблем и делаем оценки FID сравнимыми по различным методам, статьям и группам.
При псевдониме изменения размера и удивительных тонкостей в оценке GAN
Гаурав Пармар, Ричард Чжан, Джун-Янь Чжу
CVPR, 2022
CMU и Adobe
Если вы найдете этот репозиторий полезным для вашего исследования, пожалуйста, укажите следующую работу.
@inproceedings{parmar2021cleanfid,
title={On Aliased Resizing and Surprising Subtleties in GAN Evaluation},
author={Parmar, Gaurav and Zhang, Richard and Zhu, Jun-Yan},
booktitle={CVPR},
year={2022}
}
Псевдонициальный изменение размера операций
Определения функций изменения размера являются математическими и никогда не должны быть функцией используемой библиотеки . К сожалению, реализации различаются по широко используемым библиотекам. Они часто не внедряются неправильно популярными библиотеками. Попробуйте здесь различные реализации изменения размера в ноутбуке Google Colab здесь.
Несоответствия между реализациями могут иметь радикальный эффект показателей оценки. Приведенная ниже таблица показывает, что изображения набора данных FFHQ изменялись с бикубической реализацией из других библиотек (OpenCV, Pytorch, Tensorflow, OpenCV) имеют большой балл FID (≥ 6) по сравнению с теми же изображениями, измененными с правильным реализованным пили-бикубическим фильтром. Другие правильно реализованные фильтры из PIL (Lanczos, Bilinear, Box) приводят к относительно меньшей оценке FID (≤ 0,75). Обратите внимание, что со времен TF 2.0 новый флаг antialias (по умолчанию: False ) может дать результаты, близкие к PIL. Тем не менее, он не использовался в существующем репо TF-FID и по умолчанию как False .
JPEG сжатие изображения
Сжатие изображения может оказать удивительно большое влияние на FID. Изображения воспринимаются неразличимы друг от друга, но имеют большой счет FID. Оценки FID по изображениям рассчитываются между всеми изображениями FFHQ, сохраненными с использованием соответствующего формата JPEG и форматом PNG.
Ниже мы изучаем влияние сжатия JPEG для моделей StyleGAN2, обученных набору данных FFHQ (слева) и набора данных LSUN Outdoor Church (справа). Обратите внимание, что изображения набора данных LSUN были собраны с помощью сжатия JPEG (качество 75), тогда как изображения FFHQ были собраны в виде PNG. Интересно, что для набора данных LSUN лучший показатель FID (3,48) получается, когда сгенерированные изображения сжимаются с помощью JPEG Calize 87.
pip install clean-fid
from cleanfid import fid
score = fid.compute_fid(fdir1, fdir2)
FFHQ ) from cleanfid import fid
score = fid.compute_fid(fdir1, dataset_name="FFHQ", dataset_res=1024, dataset_split="trainval70k")
from cleanfid import fid
# function that accepts a latent and returns an image in range[0,255]
gen = lambda z: GAN(latent=z, ... , <other_flags>)
score = fid.compute_fid(gen=gen, dataset_name="FFHQ",
dataset_res=256, num_gen=50_000, dataset_split="trainval70k")
Чтобы использовать функции клипа при вычислении FID [kynkäänniemi et al, 2022], укажите флаг model_name="clip_vit_b_32"
from cleanfid import fid
score = fid.compute_fid(fdir1, fdir2, mode="clean", model_name="clip_vit_b_32")
Оценка Kid может быть рассчитана с использованием аналогичного интерфейса, как FID. Статистика набора данных для ребенка предварительно предварительно выпускается только для более мелких наборов данных AFHQ , BreCaHAD и MetFaces .
from cleanfid import fid
score = fid.compute_kid(fdir1, fdir2)
from cleanfid import fid
score = fid.compute_kid(fdir1, dataset_name="brecahad", dataset_res=512, dataset_split="train")
from cleanfid import fid
# function that accepts a latent and returns an image in range[0,255]
gen = lambda z: GAN(latent=z, ... , <other_flags>)
score = fid.compute_kid(gen=gen, dataset_name="brecahad", dataset_res=512, num_gen=50_000, dataset_split="train")
Мы предоставляем предварительную статистику для следующих обычно используемых конфигураций. Пожалуйста, свяжитесь с нами, если вы хотите добавить статистику для ваших новых наборов данных.
| Задача | Набор данных | Разрешение | Справочный раздел | # Справочные изображения | режим |
|---|---|---|---|---|---|
| Генерация изображений | cifar10 | 32 | train | 50 000 | clean , legacy_tensorflow , legacy_pytorch |
| Генерация изображений | cifar10 | 32 | test | 10000 | clean , legacy_tensorflow , legacy_pytorch |
| Генерация изображений | ffhq | 1024, 256 | trainval | 50 000 | clean , legacy_tensorflow , legacy_pytorch |
| Генерация изображений | ffhq | 1024, 256 | trainval70k | 70 000 | clean , legacy_tensorflow , legacy_pytorch |
| Генерация изображений | lsun_church | 256 | train | 50 000 | clean , legacy_tensorflow , legacy_pytorch |
| Генерация изображений | lsun_church | 256 | trainfull | 126,227 | clean |
| Генерация изображений | lsun_horse | 256 | train | 50 000 | clean , legacy_tensorflow , legacy_pytorch |
| Генерация изображений | lsun_horse | 256 | trainfull | 2000 340 | clean |
| Генерация изображений | lsun_cat | 256 | train | 50 000 | clean , legacy_tensorflow , legacy_pytorch |
| Генерация изображений | lsun_cat | 256 | trainfull | 1 657 264 | clean , legacy_tensorflow , legacy_pytorch |
| Несколько выстрелов | afhq_cat | 512 | train | 5153 | clean , legacy_tensorflow , legacy_pytorch |
| Несколько выстрелов | afhq_dog | 512 | train | 4739 | clean , legacy_tensorflow , legacy_pytorch |
| Несколько выстрелов | afhq_wild | 512 | train | 4738 | clean , legacy_tensorflow , legacy_pytorch |
| Несколько выстрелов | brecahad | 512 | train | 1944 | clean , legacy_tensorflow , legacy_pytorch |
| Несколько выстрелов | metfaces | 1024 | train | 1336 | clean , legacy_tensorflow , legacy_pytorch |
| Изображение на изображение | horse2zebra | 256 | test | 140 | clean , legacy_tensorflow , legacy_pytorch |
| Изображение на изображение | cat2dog | 256 | test | 500 | clean , legacy_tensorflow , legacy_pytorch |
Используя предварительную статистику , чтобы вычислить оценку FID со статистикой предварительно вычисленного набора данных, используйте соответствующие параметры. Например, чтобы вычислить оценку чистого пята на сгенерированных изображениях 256x256 FFHQ Используйте команду:
fid_score = fid.compute_fid(fdir1, dataset_name="ffhq", dataset_res=256, mode="clean", dataset_split="trainval70k")
DateSet_Path : папка, где хранятся изображения набора данных
custom_name : имя, которое будет использоваться для статистики
Создание пользовательской статистики (сохранено для локального кеша)
from cleanfid import fid
fid.make_custom_stats(custom_name, dataset_path, mode="clean")
Использование сгенерированной пользовательской статистики
from cleanfid import fid
score = fid.compute_fid("folder_fake", dataset_name=custom_name,
mode="clean", dataset_split="custom")
Удаление пользовательской статистики
from cleanfid import fid
fid.remove_custom_stats(custom_name, mode="clean")
Проверьте, существует ли индивидуальная статистика
from cleanfid import fid
fid.test_stats_exists(custom_name, mode)
Мы предоставляем два флага, чтобы воспроизвести наследную оценку FID.
mode="legacy_pytorch"
Этот флаг эквивалентен использованию популярной реализации Pytorch FID, предоставленной здесь
Разница между использованием чистого фид с этой опцией и кодом составляет ~ 2E-06
Смотрите DOC о том, как сравниваются методы
mode="legacy_tensorflow"
Этот флаг эквивалентен использованию официальной реализации FID, выпущенной авторами.
Разница между использованием чистого фид с этой опцией и кодом составляет ~ 2E-05
См. Док для подробных шагов для того, как сравниваются методы
python setup.py bdist_wheel
pip install dist/*
Мы вычисляем оценки FID, используя соответствующие методы, используемые в исходных бумагах, и используя здесь, предложенную здесь чистую фиду. Все значения вычисляются с использованием 10 прогонов оценки. Мы предоставляем API для запроса результатов, показанных в таблицах, ниже, непосредственно из пакета PIP.
Если вы хотите добавить новые номера и модели в нашу таблицу лидеров, не стесняйтесь обращаться к нам.
test набор используется в качестве эталонного распределения и сравнивается с изображениями, сгенерированными 10K.
100% данные (безусловные)
| Модель | Наследие (сообщается) | Наследие (воспроизводится) | Чистый Фид |
|---|---|---|---|
| Stylegan2 ( + ADA + настройка) [Karras et al, 2020] | - † | - † | 8,20 ± 0,10 |
| Stylegan2 (+ADA) [Karras et al, 2020] | - † | - † | 9,26 ± 0,06 |
| Stylegan2 (Diff-Augment) [Zhao et al, 2020] [CKPT] | 9.89 | 9,90 ± 0,09 | 10,85 ± 0,10 |
| Stylegan2 (зеркальные потоки) [Karras et al, 2020] [CKPT] | 11.07 | 11,07 ± 0,10 | 12,96 ± 0,07 |
| Stylegan2 (без Flips) [Karras et al, 2020] | - † | - † | 14,53 ± 0,13 |
| Autogan (config a) [Gong et al, 2019] | - † | - † | 21,18 ± 0,12 |
| Autogan (config b) [Gong et al, 2019] | - † | - † | 22,46 ± 0,15 |
| Autogan (config C) [Gong et al, 2019] | - † | - † | 23,62 ± 0,30 |
† Эти методы используют обучающий набор в качестве эталонного распределения и сравните с 50K сгенерированными изображениями
20% данных
| Модель | Наследие (сообщается) | Наследие (воспроизводится) | Чистый Фид |
|---|---|---|---|
| Stylegan2-Diff-Augment [Zhao et al, 2020] [CKPT] | 12.15 | 12,12 ± 0,15 | 14,18 ± 0,13 |
| Stylegan2-Mirror-Flips [Karras et al, 2020] [CKPT] | 23.08 | 23,01 ± 0,19 | 29,49 ± 0,17 |
10% данных
| Модель | Наследие (сообщается) | Наследие (воспроизводится) | Чистый Фид |
|---|---|---|---|
| Stylegan2-Diff-Augment [Zhao et al, 2020] [CKPT] | 14.50 | 14,53 ± 0,12 | 16,98 ± 0,18 |
| Stylegan2-Mirror-Flips [Karras et al, 2020] [CKPT] | 36.02 | 35,94 ± 0,17 | 43,60 ± 0,17 |
test набор используется в качестве эталонного распределения и сравнивается с изображениями, сгенерированными 10K.
100% данные
| Модель | Наследие (сообщается) | Наследие (воспроизводится) | Чистый Фид |
|---|---|---|---|
| Stylegan2-Mirror-Flips [Karras et al, 2020] [CKPT] | 16.54 | 16,44 ± 0,19 | 18,44 ± 0,24 |
| Stylegan2-Diff-Augment [Zhao et al, 2020] [CKPT] | 15.22 | 15,15 ± 0,13 | 16,80 ± 0,13 |
20% данных
| Модель | Наследие (сообщается) | Наследие (воспроизводится) | Чистый Фид |
|---|---|---|---|
| Stylegan2-Mirror-Flips [Karras et al, 2020] [CKPT] | 32.30 | 32,26 ± 0,19 | 34,88 ± 0,14 |
| Stylegan2-Diff-Augment [Zhao et al, 2020] [CKPT] | 16.65 | 16,74 ± 0,10 | 18,49 ± 0,08 |
10% данных
| Модель | Наследие (сообщается) | Наследие (воспроизводится) | Чистый Фид |
|---|---|---|---|
| Stylegan2-Mirror-Flips [Karras et al, 2020] [CKPT] | 45,87 | 45,97 ± 0,20 | 46,77 ± 0,19 |
| Stylegan2-Diff-Augment [Zhao et al, 2020] [CKPT] | 20,75 | 20,69 ± 0,12 | 23,40 ± 0,09 |
Все изображения @ 1024x1024
Значения вычисляются с использованием сгенерированных 50 -километровых изображений
| Модель | Наследие (сообщается) | Наследие (воспроизводится) | Чистый Фид | Справочный раздел |
|---|---|---|---|---|
| Stylegan1 (config a) [Karras et al, 2020] | 4.4 | 4,39 ± 0,03 | 4,77 ± 0,03 | trainval |
| Stylegan2 (config b) [Karras et al, 2020] | 4.39 | 4,43 ± 0,03 | 4,89 ± 0,03 | trainval |
| Stylegan2 (config C) [Karras et al, 2020] | 4.38 | 4,40 ± 0,02 | 4,79 ± 0,02 | trainval |
| Stylegan2 (config D) [Karras et al, 2020] | 4.34 | 4,34 ± 0,02 | 4,78 ± 0,03 | trainval |
| Stylegan2 (config e) [Karras et al, 2020] | 3.31 | 3,33 ± 0,02 | 3,79 ± 0,02 | trainval |
| Stylegan2 (config f) [Karras et al, 2020] [CKPT] | 2.84 | 2,83 +- 0,03 | 3,06 +- 0,02 | trainval |
| Stylegan2 [Karras et al, 2020] [CKPT] | N/a | 2,76 ± 0,03 | 2,98 ± 0,03 | trainval70k |
140K - Images @ 256x256 (весь учебный набор с горизонтальными флипами) Изображения 70K из набора trainval70k используются в качестве эталонных изображений и сравниваются с 50 -километровым изображением.
| Модель | Наследие (сообщается) | Наследие (воспроизводится) | Чистый Фид |
|---|---|---|---|
| ZCR [Zhao et al, 2020] † | 3,45 ± 0,19 | 3,29 ± 0,01 | 3,40 ± 0,01 |
| Stylegan2 [Karras et al, 2020] † | 3,66 ± 0,10 | 3,57 ± 0,03 | 3,73 ± 0,03 |
| Pa-Gan [Zhang and Khoreva et al, 2019] † | 3,78 ± 0,06 | 3,67 ± 0,03 | 3,81 ± 0,03 |
| Stylegan2-Ada [Karras et al, 2020] † | 3,88 ± 0,13 | 3,84 ± 0,02 | 3,93 ± 0,02 |
| Вспомогательное вращение [Chen et al, 2019] † | 4,16 ± 0,05 | 4,10 ± 0,02 | 4,29 ± 0,03 |
| Адаптивное отсечение [Karras et al, 2020] † | 4,16 ± 0,05 | 4,09 ± 0,02 | 4,20 ± 0,02 |
| Спектральная норма [Miyato et al, 2018] † | 4,60 ± 0,19 | 4,43 ± 0,02 | 4,65 ± 0,02 |
| Wgan-GP [Gulrajani et al, 2017] † | 6,54 ± 0,37 | 6,19 ± 0,03 | 6,62 ± 0,03 |
† Сообщается [Karras et al, 2020]
30K - изображения @ 256x256 (несколько выстрелов)
В качестве эталонных изображений используются изображения 70K из набора trainval70k и сравниваются с сгенерированными 50 -километровыми изображениями.
| Модель | Наследие (сообщается) | Наследие (воспроизводится) | Чистый Фид |
|---|---|---|---|
| Stylegan2 [Karras et al, 2020] [CKPT] | 6.16 | 6,14 ± 0,064 | 6,49 ± 0,068 |
| Diffaugment-Stylegan2 [Zhao et al, 2020] [CKPT] | 5.05 | 5,07 ± 0,030 | 5,18 ± 0,032 |
10K - изображения @ 256x256 (несколько выстрелов)
В качестве эталонных изображений используются изображения 70K из набора trainval70k и сравниваются с сгенерированными 50 -километровыми изображениями.
| Модель | Наследие (сообщается) | Наследие (воспроизводится) | Чистый Фид |
|---|---|---|---|
| Stylegan2 [Karras et al, 2020] [CKPT] | 14.75 | 14,88 ± 0,070 | 16,04 ± 0,078 |
| Diffaugment-Stylegan2 [Zhao et al, 2020] [CKPT] | 7.86 | 7,82 ± 0,045 | 8,12 ± 0,044 |
5K - изображения @ 256x256 (несколько выстрелов)
В качестве эталонных изображений используются изображения 70K из набора trainval70k и сравниваются с сгенерированными 50 -километровыми изображениями.
| Модель | Наследие (сообщается) | Наследие (воспроизводится) | Чистый Фид |
|---|---|---|---|
| Stylegan2 [Karras et al, 2020] [CKPT] | 26.60 | 26,64 ± 0,086 | 28,17 ± 0,090 |
| Diffaugment-Stylegan2 [Zhao et al, 2020] [CKPT] | 10.45 | 10,45 ± 0,047 | 10,99 ± 0,050 |
1K - изображения @ 256x256 (несколько выстрелов)
В качестве эталонных изображений используются изображения 70K из набора trainval70k и сравниваются с сгенерированными 50 -километровыми изображениями.
| Модель | Наследие (сообщается) | Наследие (воспроизводится) | Чистый Фид |
|---|---|---|---|
| Stylegan2 [Karras et al, 2020] [CKPT] | 62.16 | 62,14 ± 0,108 | 64,17 ± 0,113 |
| Diffaugment-Stylegan2 [Zhao et al, 2020] [CKPT] | 25.66 | 25,60 ± 0,071 | 27,26 ± 0,077 |
100% данные
50K изображений из набора train используются в качестве эталонных изображений и сравниваются с 50 -километровыми изображениями.
| Категория | Модель | Наследие (сообщается) | Наследие (воспроизводится) | Чистый Фид |
|---|---|---|---|---|
| Открытые церкви | Stylegan2 [Karras et al, 2020] [CKPT] | 3.86 | 3,87 ± 0,029 | 4,08 ± 0,028 |
| Лошади | Stylegan2 [Karras et al, 2020] [CKPT] | 3.43 | 3,41 ± 0,021 | 3,62 ± 0,023 |
| Кот | Stylegan2 [Karras et al, 2020] [CKPT] | 6.93 | 7,02 ± 0,039 | 7,47 ± 0,035 |
Lsun Cat - 30K изображения (несколько выстрелов)
Все 1657 264 изображения из trainfull Split используются в качестве эталонных изображений и сравниваются с 50 -километровыми изображениями.
| Модель | Наследие (сообщается) | Наследие (воспроизводится) | Чистый Фид |
|---|---|---|---|
| Stylegan2-Mirror-Flips [Karras et al, 2020] [CKPT] | 10.12 | 10,15 ± 0,04 | 10,87 ± 0,04 |
| Stylegan2-Diff-Augment [Zhao et al, 2020] [CKPT] | 9.68 | 9,70 ± 0,07 | 10,25 ± 0,07 |
Lsun Cat - 10K изображения (несколько выстрелов)
Все 1657 264 изображения из trainfull Split используются в качестве эталонных изображений и сравниваются с 50 -километровыми изображениями.
| Модель | Наследие (сообщается) | Наследие (воспроизводится) | Чистый Фид |
|---|---|---|---|
| Stylegan2-Mirror-Flips [Karras et al, 2020] [CKPT] | 17.93 | 17,98 ± 0,09 | 18,71 ± 0,09 |
| Stylegan2-Diff-Augment [Zhao et al, 2020] [CKPT] | 12.07 | 12,04 ± 0,08 | 12,53 ± 0,08 |
Lsun Cat - 5K изображения (несколько выстрелов)
Все 1657 264 изображения из trainfull Split используются в качестве эталонных изображений и сравниваются с 50 -километровыми изображениями.
| Модель | Наследие (сообщается) | Наследие (воспроизводится) | Чистый Фид |
|---|---|---|---|
| Stylegan2-Mirror-Flips [Karras et al, 2020] [CKPT] | 34,69 | 34,66 ± 0,12 | 35,85 ± 0,12 |
| Stylegan2-Diff-Augment [Zhao et al, 2020] [CKPT] | 16.11 | 16,11 ± 0,09 | 16,79 ± 0,09 |
Lsun Cat - 1K изображения (несколько выстрелов)
Все 1657 264 изображения из trainfull Split используются в качестве эталонных изображений и сравниваются с 50 -километровыми изображениями.
| Модель | Наследие (сообщается) | Наследие (воспроизводится) | Чистый Фид |
|---|---|---|---|
| Stylegan2-Mirror-Flips [Karras et al, 2020] [CKPT] | 182,85 | 182,80 ± 0,21 | 185,86 ± 0,21 |
| Stylegan2-Diff-Augment [Zhao et al, 2020] [CKPT] | 42,26 | 42,07 ± 0,16 | 43,12 ± 0,16 |
AFHQ собака
Все 4739 изображений из разделения train используются в качестве эталонных изображений и сравниваются с 50 -километровыми изображениями.
| Модель | Наследие (сообщается) | Наследие (воспроизводится) | Чистый Фид |
|---|---|---|---|
| Stylegan2 [Karras et al, 2020] [CKPT] | 19.37 | 19,34 ± 0,08 | 20,10 ± 0,08 |
| Stylegan2-Ada [Karras et al, 2020] [CKPT] | 7.40 | 7,41 ± 0,02 | 7,61 ± 0,02 |
AFHQ WILD
Все 4738 изображений из разделения train используются в качестве эталонных изображений и сравниваются с 50 -километровыми изображениями.
| Модель | Наследие (сообщается) | Наследие (воспроизводится) | Чистый Фид |
|---|---|---|---|
| Stylegan2 [Karras et al, 2020] [CKPT] | 3.48 | 3,55 ± 0,03 | 3,66 ± 0,02 |
| Stylegan2-Ada [Karras et al, 2020] [CKPT] | 3.05 | 3,01 ± 0,02 | 3,03 ± 0,02 |
Все изображения 1944 года из разделения train используются в качестве эталонных изображений и сравниваются с 50 -километровыми изображениями.
| Модель | Наследие Фид (сообщается) | Наследие Фид (воспроизводится) | Чистый Фид | Наследие РЕБЕНОК (сообщается) 10^3 | Наследие РЕБЕНОК (воспроизводится) 10^3 | Чистый РЕБЕНОК 10^3 |
|---|---|---|---|---|---|---|
| Stylegan2 [Karras et al, 2020] [CKPT] | 97.72 | 97,46 ± 0,17 | 98,35 ± 0,17 | 89,76 | 89,90 ± 0,31 | 92,51 ± 0,32 |
| Stylegan2-Ada [Karras et al, 2020] [CKPT] | 15.71 | 15,70 ± 0,06 | 15,63 ± 0,06 | 2.88 | 2,93 ± 0,08 | 3,08 ± 0,08 |
Все 1336 изображений из разделения train используются в качестве эталонных изображений и сравниваются с 50 -километровыми изображениями.
| Модель | Наследие Фид (сообщается) | Наследие Фид (воспроизводится) | Чистый Фид | Наследие РЕБЕНОК (сообщается) 10^3 | Наследие РЕБЕНОК (воспроизводится) 10^3 | Чистый РЕБЕНОК 10^3 |
|---|---|---|---|---|---|---|
| Stylegan2 [Karras et al, 2020] [CKPT] | 57.26 | 57,36 ± 0,10 | 65,74 ± 0,11 | 35,66 | 35,69 ± 0,16 | 40,90 ± 0,14 |
| Stylegan2-Ada [Karras et al, 2020] [CKPT] | 18.22 | 18,18 ± 0,03 | 19,60 ± 0,03 | 2.41 | 2,38 ± 0,05 | 2,86 ± 0,04 |
Все 140 изображений из test разделения используются в качестве эталонных изображений и сравниваются с 120 переведенными изображениями.
| Модель | Наследие (сообщается) | Наследие (воспроизводится) | Чистый Фид |
|---|---|---|---|
| Cut [Park et al, 2020] | 45,5 | 45,51 | 43,71 |
| Расстояние [Benaim and Wolf et al, 2017] сообщили [Park et al, 2020] | 72,0 | 71.97 | 71.01 |
| Fastcut [Park et al, 2020] | 73,4 | 73,38 | 72,53 |
| Cyclegan [Zhu et al, 2017] сообщили [Park et al, 2020] | 77.2 | 77.20 | 75,17 |
| Самостоятельность [Benaim and Wolf et al, 2017] сообщили [Park et al, 2020] | 80.8 | 80.78 | 79,28 |
| Gcgan [Fu et al, 2019] сообщили [Park et al, 2020] | 86.7 | 85,86 | 83,65 |
| Munit [Huang et al, 2018] сообщили [Park et al, 2020] | 133,8 | - † | 120.48 |
| Drit [Lee et al, 2017] сообщили [Park et al, 2020] | 140.0 | - † | 99,56 |
† Переведенные изображения для этих методов были интенсивно сравнены [Park et al, 2020] с использованием сжатия .jpeg. Мы перепродаем эти два метода, используя один и тот же протокал и генерируем изображения в качестве .png для справедливого сравнения.
Все 500 изображений из test разделения используются в качестве эталонных изображений и сравниваются с 500 переведенными изображениями.
| Модель | Наследие (сообщается) | Наследие (воспроизводится) | Чистый Фид |
|---|---|---|---|
| Cut [Park et al, 2020] | 76.2 | 76.21 | 77.58 |
| Fastcut [Park et al, 2020] | 94.0 | 93,95 | 95,37 |
| Gcgan [Fu et al, 2019] сообщили [Park et al, 2020] | 96.6 | 96.61 | 96.49 |
| Munit [Huang et al, 2018] сообщили [Park et al, 2020] | 104.4 | - † | 123,73 |
| Drit [Lee et al, 2017] сообщили [Park et al, 2020] | 123,4 | - † | 127.21 |
| Самостоятельность [Benaim and Wolf et al, 2017] сообщили [Park et al, 2020] | 144.4 | 144.42 | 147.23 |
| Расстояние [Benaim and Wolf et al, 2017] сообщили [Park et al, 2020] | 155,3 | 155,34 | 158.39 |
† Переведенные изображения для этих методов были интенсивно сравнены [Park et al, 2020] с использованием сжатия .jpeg. Мы перепродаем эти два метода, используя один и тот же протокал и генерируем изображения в качестве .png для справедливого сравнения.
Факел-негативность: показатели производительности высокой точки зрения для генеративных моделей в Pytorch.
Ttur: два правила обновления в масштабе времени для обучения Gans.
Lpips: метрика сходства перцептивного сходства и набор данных.
Все материалы в этом хранилище предоставляются по лицензии MIT.
Начальник_pytorch.py получена из реализации FID Pytorch, предоставленной Maximilian Seitzer. Эти файлы изначально были переданы по лицензии Apache 2.0.
Начало-2015-12-05.pt-это модель TorchScript предварительно обученной сети «Начало v3» Кристиан Сегеди, Винсент Ванхоук, Сергей Иоффе, Джонатон Шленс и Збигьют Война. Первоначально сеть была разделена по лицензии Apache 2.0 в репозитории Tensorflow Models. Обертка TorchScript предоставлена Теро Каррасом и Мика Аттала, Янн Хеллстен, а также Самули Лейн и Яакко Лехтинен и Тимо Айла, которые выпускаются по лицензии исходного кода NVIDIA.