Une mise en œuvre pytorch de SRGAN basée sur la super-résolution de l'image unique photo-réaliste en papier CVPR 2017 à l'aide d'un réseau adversaire génératif.
conda install pytorch torchvision -c pytorch
conda install opencv
Les ensembles de données Train et Val sont échantillonnés à partir de VOC2012. Train DataSet a 16700 images et l'ensemble de données VAL dispose de 425 images. Téléchargez les ensembles de données à partir d'ici (code d'accès: 5TZP), puis les extraire dans le répertoire data .
L'ensemble de données d'image de test est échantillonné à partir de | Set 5 | Bevilacqua et al. BMVC 2012 | Set 14 | Zeyde et al. LNCS 2010 | BSD 100 | Martin et al. ICCV 2001 | Sun-Hays 80 | Sun et Hays ICCP 2012 | Urban 100 | Huang et al. CVPR 2015. Téléchargez l'ensemble de données d'image à partir d'ici (code d'accès: xwhy), puis extraire dans le répertoire data .
L'ensemble de données vidéo de test est trois bandes-annonces. Téléchargez l'ensemble de données vidéo à partir d'ici (code d'accès: 956d).
python train.py
optional arguments:
--crop_size training images crop size [default value is 88]
--upscale_factor super resolution upscale factor [default value is 4](choices:[2, 4, 8])
--num_epochs train epoch number [default value is 100]
Les images de sortie Val Super Resolution sont sur le répertoire training_results .
python test_benchmark.py
optional arguments:
--upscale_factor super resolution upscale factor [default value is 4]
--model_name generator model epoch name [default value is netG_epoch_4_100.pth]
Les images de super résolution de sortie sont sur le répertoire benchmark_results .
python test_image.py
optional arguments:
--upscale_factor super resolution upscale factor [default value is 4]
--test_mode using GPU or CPU [default value is 'GPU'](choices:['GPU', 'CPU'])
--image_name test low resolution image name
--model_name generator model epoch name [default value is netG_epoch_4_100.pth]
L'image de super résolution de sortie est sur le même répertoire.
python test_video.py
optional arguments:
--upscale_factor super resolution upscale factor [default value is 4]
--video_name test low resolution video name
--model_name generator model epoch name [default value is netG_epoch_4_100.pth]
La vidéo de sortie super résolution et la vidéo comparée sont sur le même répertoire.
Facteur haut de gamme = 2
Les époques avec une taille de lot de 64 prennent ~ 2 minutes 30 secondes sur un GPU NVIDIA GTX 1080TI.
Résultats de l'image
La gauche est l'image d'interpolation bicubique, l'image du milieu est à haute résolution et l'image à droite est une super résolution (sortie du SRGAN).




Résultats vidéo
La gauche est une vidéo d'interpolation bicubique, la droite est une vidéo de super résolution (sortie du SRGAN).

Facteur haut de gamme = 4
Les époques avec une taille de lot de 64 prennent ~ 4 minutes 30 secondes sur un GPU NVIDIA GTX 1080TI.
Résultats de l'image
La gauche est l'image d'interpolation bicubique, l'image du milieu est à haute résolution et l'image à droite est une super résolution (sortie du SRGAN).




Résultats vidéo
La gauche est une vidéo d'interpolation bicubique, la droite est une vidéo de super résolution (sortie du SRGAN).

Facteur haut de gamme = 8
Les époques avec une taille de lot de 64 prennent ~ 3 minutes 30 secondes sur un GPU NVIDIA GTX 1080TI.
Résultats de l'image
La gauche est l'image d'interpolation bicubique, l'image du milieu est à haute résolution et l'image à droite est une super résolution (sortie du SRGAN).




Résultats vidéo
La gauche est une vidéo d'interpolation bicubique, la droite est une vidéo de super résolution (sortie du SRGAN).

Les résultats complets des tests pourraient être téléchargés à partir d'ici (code d'accès: NKH9).