clean fid Download - clean fid Source Code Скачать

clean fid

Питон

1.0.0

Скачать

Чистый фид для оценки генеративных моделей

[Новая] вычисление FID с использованием функций клипа [Kynkäänniemi et al, 2022] теперь поддерживается. Смотрите здесь для более подробной информации.

Расчет FID включает в себя множество этапов, которые могут создавать несоответствия в окончательной метрике. Как показано ниже, различные реализации используют различные низкоуровневые квантовании изображения и изменения размера, последние из которых часто реализуются неправильно.

Мы предоставляем простую в использовании библиотеку для решения вышеуказанных проблем и делаем оценки FID сравнимыми по различным методам, статьям и группам.

Соответствующая рукопись

При псевдониме изменения размера и удивительных тонкостей в оценке GAN
Гаурав Пармар, Ричард Чжан, Джун-Янь Чжу
CVPR, 2022
CMU и Adobe

Если вы найдете этот репозиторий полезным для вашего исследования, пожалуйста, укажите следующую работу.

 @inproceedings{parmar2021cleanfid,
  title={On Aliased Resizing and Surprising Subtleties in GAN Evaluation},
  author={Parmar, Gaurav and Zhang, Richard and Zhu, Jun-Yan},
  booktitle={CVPR},
  year={2022}
}

Псевдонициальный изменение размера операций

Определения функций изменения размера являются математическими и никогда не должны быть функцией используемой библиотеки . К сожалению, реализации различаются по широко используемым библиотекам. Они часто не внедряются неправильно популярными библиотеками. Попробуйте здесь различные реализации изменения размера в ноутбуке Google Colab здесь.

Несоответствия между реализациями могут иметь радикальный эффект показателей оценки. Приведенная ниже таблица показывает, что изображения набора данных FFHQ изменялись с бикубической реализацией из других библиотек (OpenCV, Pytorch, Tensorflow, OpenCV) имеют большой балл FID (≥ 6) по сравнению с теми же изображениями, измененными с правильным реализованным пили-бикубическим фильтром. Другие правильно реализованные фильтры из PIL (Lanczos, Bilinear, Box) приводят к относительно меньшей оценке FID (≤ 0,75). Обратите внимание, что со времен TF 2.0 новый флаг antialias (по умолчанию: False ) может дать результаты, близкие к PIL. Тем не менее, он не использовался в существующем репо TF-FID и по умолчанию как False .

JPEG сжатие изображения

Сжатие изображения может оказать удивительно большое влияние на FID. Изображения воспринимаются неразличимы друг от друга, но имеют большой счет FID. Оценки FID по изображениям рассчитываются между всеми изображениями FFHQ, сохраненными с использованием соответствующего формата JPEG и форматом PNG.

Ниже мы изучаем влияние сжатия JPEG для моделей StyleGAN2, обученных набору данных FFHQ (слева) и набора данных LSUN Outdoor Church (справа). Обратите внимание, что изображения набора данных LSUN были собраны с помощью сжатия JPEG (качество 75), тогда как изображения FFHQ были собраны в виде PNG. Интересно, что для набора данных LSUN лучший показатель FID (3,48) получается, когда сгенерированные изображения сжимаются с помощью JPEG Calize 87.

Быстрый старт

Установите библиотеку
```
 pip install clean-fid
```

Вычислительный фид

Вычислить FID между двумя папками изображения
```
 from cleanfid import fid
score = fid.compute_fid(fdir1, fdir2)
```
Вычислить FID между одной папкой изображений и статистикой предварительно вычисленных наборов данных (например, FFHQ )
```
 from cleanfid import fid
score = fid.compute_fid(fdir1, dataset_name="FFHQ", dataset_res=1024, dataset_split="trainval70k")
```

Вычислить FID, используя генеративную модель и предварительно вычисленную статистику набора данных:

 from cleanfid import fid
# function that accepts a latent and returns an image in range[0,255]
gen = lambda z: GAN(latent=z, ... , <other_flags>)
score = fid.compute_fid(gen=gen, dataset_name="FFHQ",
        dataset_res=256, num_gen=50_000, dataset_split="trainval70k")

Вычислительный клип-фид

Чтобы использовать функции клипа при вычислении FID [kynkäänniemi et al, 2022], укажите флаг model_name="clip_vit_b_32"

Например, чтобы вычислить фиксатор между двумя папками изображений. Используйте следующие команды.
```
 from cleanfid import fid
score = fid.compute_fid(fdir1, fdir2, mode="clean", model_name="clip_vit_b_32")
```

Компьютерный ребенок

Оценка Kid может быть рассчитана с использованием аналогичного интерфейса, как FID. Статистика набора данных для ребенка предварительно предварительно выпускается только для более мелких наборов данных AFHQ , BreCaHAD и MetFaces .

Вычислить ребенка между двумя папками изображения
```
 from cleanfid import fid
score = fid.compute_kid(fdir1, fdir2)
```
Вычислить KID между одной папкой изображений и предварительно вычисленными статистикой наборов данных
```
 from cleanfid import fid
score = fid.compute_kid(fdir1, dataset_name="brecahad", dataset_res=512, dataset_split="train")
```

Вычислите Kid, используя генеративную модель и предварительно вычисленную статистику набора данных:

 from cleanfid import fid
# function that accepts a latent and returns an image in range[0,255]
gen = lambda z: GAN(latent=z, ... , <other_flags>)
score = fid.compute_kid(gen=gen, dataset_name="brecahad", dataset_res=512, num_gen=50_000, dataset_split="train")

Поддерживается предварительно вычисленные наборы данных

Мы предоставляем предварительную статистику для следующих обычно используемых конфигураций. Пожалуйста, свяжитесь с нами, если вы хотите добавить статистику для ваших новых наборов данных.

Задача	Набор данных	Разрешение	Справочный раздел	# Справочные изображения	режим
Генерация изображений	`cifar10`	32	`train`	50 000	`clean` , `legacy_tensorflow` , `legacy_pytorch`
Генерация изображений	`cifar10`	32	`test`	10000	`clean` , `legacy_tensorflow` , `legacy_pytorch`
Генерация изображений	`ffhq`	1024, 256	`trainval`	50 000	`clean` , `legacy_tensorflow` , `legacy_pytorch`
Генерация изображений	`ffhq`	1024, 256	`trainval70k`	70 000	`clean` , `legacy_tensorflow` , `legacy_pytorch`
Генерация изображений	`lsun_church`	256	`train`	50 000	`clean` , `legacy_tensorflow` , `legacy_pytorch`
Генерация изображений	`lsun_church`	256	`trainfull`	126,227	`clean`
Генерация изображений	`lsun_horse`	256	`train`	50 000	`clean` , `legacy_tensorflow` , `legacy_pytorch`
Генерация изображений	`lsun_horse`	256	`trainfull`	2000 340	`clean`
Генерация изображений	`lsun_cat`	256	`train`	50 000	`clean` , `legacy_tensorflow` , `legacy_pytorch`
Генерация изображений	`lsun_cat`	256	`trainfull`	1 657 264	`clean` , `legacy_tensorflow` , `legacy_pytorch`
Несколько выстрелов	`afhq_cat`	512	`train`	5153	`clean` , `legacy_tensorflow` , `legacy_pytorch`
Несколько выстрелов	`afhq_dog`	512	`train`	4739	`clean` , `legacy_tensorflow` , `legacy_pytorch`
Несколько выстрелов	`afhq_wild`	512	`train`	4738	`clean` , `legacy_tensorflow` , `legacy_pytorch`
Несколько выстрелов	`brecahad`	512	`train`	1944	`clean` , `legacy_tensorflow` , `legacy_pytorch`
Несколько выстрелов	`metfaces`	1024	`train`	1336	`clean` , `legacy_tensorflow` , `legacy_pytorch`
Изображение на изображение	`horse2zebra`	256	`test`	140	`clean` , `legacy_tensorflow` , `legacy_pytorch`
Изображение на изображение	`cat2dog`	256	`test`	500	`clean` , `legacy_tensorflow` , `legacy_pytorch`

Используя предварительную статистику , чтобы вычислить оценку FID со статистикой предварительно вычисленного набора данных, используйте соответствующие параметры. Например, чтобы вычислить оценку чистого пята на сгенерированных изображениях 256x256 FFHQ Используйте команду:

 fid_score = fid.compute_fid(fdir1, dataset_name="ffhq", dataset_res=256,  mode="clean", dataset_split="trainval70k")

Создание пользовательской статистики наборов данных

DateSet_Path : папка, где хранятся изображения набора данных
custom_name : имя, которое будет использоваться для статистики
Создание пользовательской статистики (сохранено для локального кеша)
```
 from cleanfid import fid
fid.make_custom_stats(custom_name, dataset_path, mode="clean")
```

Использование сгенерированной пользовательской статистики

 from cleanfid import fid
score = fid.compute_fid("folder_fake", dataset_name=custom_name,
          mode="clean", dataset_split="custom")

Удаление пользовательской статистики

 from cleanfid import fid
fid.remove_custom_stats(custom_name, mode="clean")

Проверьте, существует ли индивидуальная статистика
```
 from cleanfid import fid
fid.test_stats_exists(custom_name, mode)
```

Обратная совместимость

Мы предоставляем два флага, чтобы воспроизвести наследную оценку FID.

mode="legacy_pytorch"
Этот флаг эквивалентен использованию популярной реализации Pytorch FID, предоставленной здесь
Разница между использованием чистого фид с этой опцией и кодом составляет ~ 2E-06
Смотрите DOC о том, как сравниваются методы
mode="legacy_tensorflow"
Этот флаг эквивалентен использованию официальной реализации FID, выпущенной авторами.
Разница между использованием чистого фид с этой опцией и кодом составляет ~ 2E-05
См. Док для подробных шагов для того, как сравниваются методы

Строительство чистого фигура на местном уровне от источника

 python setup.py bdist_wheel
pip install dist/*

Таблица лидеров Cleanfid для общих задач

Мы вычисляем оценки FID, используя соответствующие методы, используемые в исходных бумагах, и используя здесь, предложенную здесь чистую фиду. Все значения вычисляются с использованием 10 прогонов оценки. Мы предоставляем API для запроса результатов, показанных в таблицах, ниже, непосредственно из пакета PIP.

Если вы хотите добавить новые номера и модели в нашу таблицу лидеров, не стесняйтесь обращаться к нам.

Cifar-10 (мало выстрела)

test набор используется в качестве эталонного распределения и сравнивается с изображениями, сгенерированными 10K.

100% данные (безусловные)

Модель	Наследие (сообщается)	Наследие (воспроизводится)	Чистый Фид
Stylegan2 ( + ADA + настройка) [Karras et al, 2020]	- †	- †	8,20 ± 0,10
Stylegan2 (+ADA) [Karras et al, 2020]	- †	- †	9,26 ± 0,06
Stylegan2 (Diff-Augment) [Zhao et al, 2020] [CKPT]	9.89	9,90 ± 0,09	10,85 ± 0,10
Stylegan2 (зеркальные потоки) [Karras et al, 2020] [CKPT]	11.07	11,07 ± 0,10	12,96 ± 0,07
Stylegan2 (без Flips) [Karras et al, 2020]	- †	- †	14,53 ± 0,13
Autogan (config a) [Gong et al, 2019]	- †	- †	21,18 ± 0,12
Autogan (config b) [Gong et al, 2019]	- †	- †	22,46 ± 0,15
Autogan (config C) [Gong et al, 2019]	- †	- †	23,62 ± 0,30

† Эти методы используют обучающий набор в качестве эталонного распределения и сравните с 50K сгенерированными изображениями

20% данных

Модель	Наследие (сообщается)	Наследие (воспроизводится)	Чистый Фид
Stylegan2-Diff-Augment [Zhao et al, 2020] [CKPT]	12.15	12,12 ± 0,15	14,18 ± 0,13
Stylegan2-Mirror-Flips [Karras et al, 2020] [CKPT]	23.08	23,01 ± 0,19	29,49 ± 0,17

10% данных

Модель	Наследие (сообщается)	Наследие (воспроизводится)	Чистый Фид
Stylegan2-Diff-Augment [Zhao et al, 2020] [CKPT]	14.50	14,53 ± 0,12	16,98 ± 0,18
Stylegan2-Mirror-Flips [Karras et al, 2020] [CKPT]	36.02	35,94 ± 0,17	43,60 ± 0,17

Cifar-100 (мало выстрела)

test набор используется в качестве эталонного распределения и сравнивается с изображениями, сгенерированными 10K.

100% данные

Модель	Наследие (сообщается)	Наследие (воспроизводится)	Чистый Фид
Stylegan2-Mirror-Flips [Karras et al, 2020] [CKPT]	16.54	16,44 ± 0,19	18,44 ± 0,24
Stylegan2-Diff-Augment [Zhao et al, 2020] [CKPT]	15.22	15,15 ± 0,13	16,80 ± 0,13

20% данных

Модель	Наследие (сообщается)	Наследие (воспроизводится)	Чистый Фид
Stylegan2-Mirror-Flips [Karras et al, 2020] [CKPT]	32.30	32,26 ± 0,19	34,88 ± 0,14
Stylegan2-Diff-Augment [Zhao et al, 2020] [CKPT]	16.65	16,74 ± 0,10	18,49 ± 0,08

10% данных

Модель	Наследие (сообщается)	Наследие (воспроизводится)	Чистый Фид
Stylegan2-Mirror-Flips [Karras et al, 2020] [CKPT]	45,87	45,97 ± 0,20	46,77 ± 0,19
Stylegan2-Diff-Augment [Zhao et al, 2020] [CKPT]	20,75	20,69 ± 0,12	23,40 ± 0,09

Ffhq

Все изображения @ 1024x1024
Значения вычисляются с использованием сгенерированных 50 -километровых изображений

Модель	Наследие (сообщается)	Наследие (воспроизводится)	Чистый Фид	Справочный раздел
Stylegan1 (config a) [Karras et al, 2020]	4.4	4,39 ± 0,03	4,77 ± 0,03	`trainval`
Stylegan2 (config b) [Karras et al, 2020]	4.39	4,43 ± 0,03	4,89 ± 0,03	`trainval`
Stylegan2 (config C) [Karras et al, 2020]	4.38	4,40 ± 0,02	4,79 ± 0,02	`trainval`
Stylegan2 (config D) [Karras et al, 2020]	4.34	4,34 ± 0,02	4,78 ± 0,03	`trainval`
Stylegan2 (config e) [Karras et al, 2020]	3.31	3,33 ± 0,02	3,79 ± 0,02	`trainval`
Stylegan2 (config f) [Karras et al, 2020] [CKPT]	2.84	2,83 +- 0,03	3,06 +- 0,02	`trainval`
Stylegan2 [Karras et al, 2020] [CKPT]	N/a	2,76 ± 0,03	2,98 ± 0,03	`trainval70k`

140K - Images @ 256x256 (весь учебный набор с горизонтальными флипами) Изображения 70K из набора trainval70k используются в качестве эталонных изображений и сравниваются с 50 -километровым изображением.

Модель	Наследие (сообщается)	Наследие (воспроизводится)	Чистый Фид
ZCR [Zhao et al, 2020] †	3,45 ± 0,19	3,29 ± 0,01	3,40 ± 0,01
Stylegan2 [Karras et al, 2020] †	3,66 ± 0,10	3,57 ± 0,03	3,73 ± 0,03
Pa-Gan [Zhang and Khoreva et al, 2019] †	3,78 ± 0,06	3,67 ± 0,03	3,81 ± 0,03
Stylegan2-Ada [Karras et al, 2020] †	3,88 ± 0,13	3,84 ± 0,02	3,93 ± 0,02
Вспомогательное вращение [Chen et al, 2019] †	4,16 ± 0,05	4,10 ± 0,02	4,29 ± 0,03
Адаптивное отсечение [Karras et al, 2020] †	4,16 ± 0,05	4,09 ± 0,02	4,20 ± 0,02
Спектральная норма [Miyato et al, 2018] †	4,60 ± 0,19	4,43 ± 0,02	4,65 ± 0,02
Wgan-GP [Gulrajani et al, 2017] †	6,54 ± 0,37	6,19 ± 0,03	6,62 ± 0,03

† Сообщается [Karras et al, 2020]

30K - изображения @ 256x256 (несколько выстрелов)
В качестве эталонных изображений используются изображения 70K из набора trainval70k и сравниваются с сгенерированными 50 -километровыми изображениями.

Модель	Наследие (сообщается)	Наследие (воспроизводится)	Чистый Фид
Stylegan2 [Karras et al, 2020] [CKPT]	6.16	6,14 ± 0,064	6,49 ± 0,068
Diffaugment-Stylegan2 [Zhao et al, 2020] [CKPT]	5.05	5,07 ± 0,030	5,18 ± 0,032

10K - изображения @ 256x256 (несколько выстрелов)
В качестве эталонных изображений используются изображения 70K из набора trainval70k и сравниваются с сгенерированными 50 -километровыми изображениями.

Модель	Наследие (сообщается)	Наследие (воспроизводится)	Чистый Фид
Stylegan2 [Karras et al, 2020] [CKPT]	14.75	14,88 ± 0,070	16,04 ± 0,078
Diffaugment-Stylegan2 [Zhao et al, 2020] [CKPT]	7.86	7,82 ± 0,045	8,12 ± 0,044

5K - изображения @ 256x256 (несколько выстрелов)
В качестве эталонных изображений используются изображения 70K из набора trainval70k и сравниваются с сгенерированными 50 -километровыми изображениями.

Модель	Наследие (сообщается)	Наследие (воспроизводится)	Чистый Фид
Stylegan2 [Karras et al, 2020] [CKPT]	26.60	26,64 ± 0,086	28,17 ± 0,090
Diffaugment-Stylegan2 [Zhao et al, 2020] [CKPT]	10.45	10,45 ± 0,047	10,99 ± 0,050

1K - изображения @ 256x256 (несколько выстрелов)
В качестве эталонных изображений используются изображения 70K из набора trainval70k и сравниваются с сгенерированными 50 -километровыми изображениями.

Модель	Наследие (сообщается)	Наследие (воспроизводится)	Чистый Фид
Stylegan2 [Karras et al, 2020] [CKPT]	62.16	62,14 ± 0,108	64,17 ± 0,113
Diffaugment-Stylegan2 [Zhao et al, 2020] [CKPT]	25.66	25,60 ± 0,071	27,26 ± 0,077

Категории LSUN

100% данные
50K изображений из набора train используются в качестве эталонных изображений и сравниваются с 50 -километровыми изображениями.

Категория	Модель	Наследие (сообщается)	Наследие (воспроизводится)	Чистый Фид
Открытые церкви	Stylegan2 [Karras et al, 2020] [CKPT]	3.86	3,87 ± 0,029	4,08 ± 0,028
Лошади	Stylegan2 [Karras et al, 2020] [CKPT]	3.43	3,41 ± 0,021	3,62 ± 0,023
Кот	Stylegan2 [Karras et al, 2020] [CKPT]	6.93	7,02 ± 0,039	7,47 ± 0,035

Lsun Cat - 30K изображения (несколько выстрелов)
Все 1657 264 изображения из trainfull Split используются в качестве эталонных изображений и сравниваются с 50 -километровыми изображениями.

Модель	Наследие (сообщается)	Наследие (воспроизводится)	Чистый Фид
Stylegan2-Mirror-Flips [Karras et al, 2020] [CKPT]	10.12	10,15 ± 0,04	10,87 ± 0,04
Stylegan2-Diff-Augment [Zhao et al, 2020] [CKPT]	9.68	9,70 ± 0,07	10,25 ± 0,07

Lsun Cat - 10K изображения (несколько выстрелов)
Все 1657 264 изображения из trainfull Split используются в качестве эталонных изображений и сравниваются с 50 -километровыми изображениями.

Модель	Наследие (сообщается)	Наследие (воспроизводится)	Чистый Фид
Stylegan2-Mirror-Flips [Karras et al, 2020] [CKPT]	17.93	17,98 ± 0,09	18,71 ± 0,09
Stylegan2-Diff-Augment [Zhao et al, 2020] [CKPT]	12.07	12,04 ± 0,08	12,53 ± 0,08

Lsun Cat - 5K изображения (несколько выстрелов)
Все 1657 264 изображения из trainfull Split используются в качестве эталонных изображений и сравниваются с 50 -километровыми изображениями.

Модель	Наследие (сообщается)	Наследие (воспроизводится)	Чистый Фид
Stylegan2-Mirror-Flips [Karras et al, 2020] [CKPT]	34,69	34,66 ± 0,12	35,85 ± 0,12
Stylegan2-Diff-Augment [Zhao et al, 2020] [CKPT]	16.11	16,11 ± 0,09	16,79 ± 0,09

Lsun Cat - 1K изображения (несколько выстрелов)
Все 1657 264 изображения из trainfull Split используются в качестве эталонных изображений и сравниваются с 50 -километровыми изображениями.

Модель	Наследие (сообщается)	Наследие (воспроизводится)	Чистый Фид
Stylegan2-Mirror-Flips [Karras et al, 2020] [CKPT]	182,85	182,80 ± 0,21	185,86 ± 0,21
Stylegan2-Diff-Augment [Zhao et al, 2020] [CKPT]	42,26	42,07 ± 0,16	43,12 ± 0,16

AFHQ (несколько выстрелов)

AFHQ собака
Все 4739 изображений из разделения train используются в качестве эталонных изображений и сравниваются с 50 -километровыми изображениями.

Модель	Наследие (сообщается)	Наследие (воспроизводится)	Чистый Фид
Stylegan2 [Karras et al, 2020] [CKPT]	19.37	19,34 ± 0,08	20,10 ± 0,08
Stylegan2-Ada [Karras et al, 2020] [CKPT]	7.40	7,41 ± 0,02	7,61 ± 0,02

AFHQ WILD
Все 4738 изображений из разделения train используются в качестве эталонных изображений и сравниваются с 50 -километровыми изображениями.

Модель	Наследие (сообщается)	Наследие (воспроизводится)	Чистый Фид
Stylegan2 [Karras et al, 2020] [CKPT]	3.48	3,55 ± 0,03	3,66 ± 0,02
Stylegan2-Ada [Karras et al, 2020] [CKPT]	3.05	3,01 ± 0,02	3,03 ± 0,02

Брекахад (несколько выстрелов.

Все изображения 1944 года из разделения train используются в качестве эталонных изображений и сравниваются с 50 -километровыми изображениями.

Модель	Наследие Фид (сообщается)	Наследие Фид (воспроизводится)	Чистый Фид	Наследие РЕБЕНОК (сообщается) 10^3	Наследие РЕБЕНОК (воспроизводится) 10^3	Чистый РЕБЕНОК 10^3
Stylegan2 [Karras et al, 2020] [CKPT]	97.72	97,46 ± 0,17	98,35 ± 0,17	89,76	89,90 ± 0,31	92,51 ± 0,32
Stylegan2-Ada [Karras et al, 2020] [CKPT]	15.71	15,70 ± 0,06	15,63 ± 0,06	2.88	2,93 ± 0,08	3,08 ± 0,08

Metfaces (несколько выстрелов)

Все 1336 изображений из разделения train используются в качестве эталонных изображений и сравниваются с 50 -километровыми изображениями.

Модель	Наследие Фид (сообщается)	Наследие Фид (воспроизводится)	Чистый Фид	Наследие РЕБЕНОК (сообщается) 10^3	Наследие РЕБЕНОК (воспроизводится) 10^3	Чистый РЕБЕНОК 10^3
Stylegan2 [Karras et al, 2020] [CKPT]	57.26	57,36 ± 0,10	65,74 ± 0,11	35,66	35,69 ± 0,16	40,90 ± 0,14
Stylegan2-Ada [Karras et al, 2020] [CKPT]	18.22	18,18 ± 0,03	19,60 ± 0,03	2.41	2,38 ± 0,05	2,86 ± 0,04

Horse2zebra (изображение на перевод изображения)

Все 140 изображений из test разделения используются в качестве эталонных изображений и сравниваются с 120 переведенными изображениями.

Модель	Наследие (сообщается)	Наследие (воспроизводится)	Чистый Фид
Cut [Park et al, 2020]	45,5	45,51	43,71
Расстояние [Benaim and Wolf et al, 2017] сообщили [Park et al, 2020]	72,0	71.97	71.01
Fastcut [Park et al, 2020]	73,4	73,38	72,53
Cyclegan [Zhu et al, 2017] сообщили [Park et al, 2020]	77.2	77.20	75,17
Самостоятельность [Benaim and Wolf et al, 2017] сообщили [Park et al, 2020]	80.8	80.78	79,28
Gcgan [Fu et al, 2019] сообщили [Park et al, 2020]	86.7	85,86	83,65
Munit [Huang et al, 2018] сообщили [Park et al, 2020]	133,8	- †	120.48
Drit [Lee et al, 2017] сообщили [Park et al, 2020]	140.0	- †	99,56

† Переведенные изображения для этих методов были интенсивно сравнены [Park et al, 2020] с использованием сжатия .jpeg. Мы перепродаем эти два метода, используя один и тот же протокал и генерируем изображения в качестве .png для справедливого сравнения.

Cat2dog (перевод изображения на изображение)

Все 500 изображений из test разделения используются в качестве эталонных изображений и сравниваются с 500 переведенными изображениями.

Модель	Наследие (сообщается)	Наследие (воспроизводится)	Чистый Фид
Cut [Park et al, 2020]	76.2	76.21	77.58
Fastcut [Park et al, 2020]	94.0	93,95	95,37
Gcgan [Fu et al, 2019] сообщили [Park et al, 2020]	96.6	96.61	96.49
Munit [Huang et al, 2018] сообщили [Park et al, 2020]	104.4	- †	123,73
Drit [Lee et al, 2017] сообщили [Park et al, 2020]	123,4	- †	127.21
Самостоятельность [Benaim and Wolf et al, 2017] сообщили [Park et al, 2020]	144.4	144.42	147.23
Расстояние [Benaim and Wolf et al, 2017] сообщили [Park et al, 2020]	155,3	155,34	158.39

† Переведенные изображения для этих методов были интенсивно сравнены [Park et al, 2020] с использованием сжатия .jpeg. Мы перепродаем эти два метода, используя один и тот же протокал и генерируем изображения в качестве .png для справедливого сравнения.

Связанные проекты

Факел-негативность: показатели производительности высокой точки зрения для генеративных моделей в Pytorch.
Ttur: два правила обновления в масштабе времени для обучения Gans.
Lpips: метрика сходства перцептивного сходства и набор данных.

Лицензии

Все материалы в этом хранилище предоставляются по лицензии MIT.

Начальник_pytorch.py получена из реализации FID Pytorch, предоставленной Maximilian Seitzer. Эти файлы изначально были переданы по лицензии Apache 2.0.

Начало-2015-12-05.pt-это модель TorchScript предварительно обученной сети «Начало v3» Кристиан Сегеди, Винсент Ванхоук, Сергей Иоффе, Джонатон Шленс и Збигьют Война. Первоначально сеть была разделена по лицензии Apache 2.0 в репозитории Tensorflow Models. Обертка TorchScript предоставлена Теро Каррасом и Мика Аттала, Янн Хеллстен, а также Самули Лейн и Яакко Лехтинен и Тимо Айла, которые выпускаются по лицензии исходного кода NVIDIA.

Расширять

Дополнительная информация