Download do SUPIR - Download do código -fonte SUPIR

SUPIR

Pitão

1.0.0

Baixar

(CVPR2024) Escalando a excelência: praticando escala de modelo para restauração de imagens foto-realistas na natureza

[Paper] [Página do projeto] [aplicativo online]
Fanghua, Yu, Jinjin Gu, Zheyuan Li, Jinfan Hu, Xiangtao Kong, Xintao Wang, Jingwen He, Yu Qiao, Chao Dong
Instituto Shenzhen de Tecnologia Avançada; Laboratório de Xangai AI; Universidade de Sydney; A Universidade Politécnica de Hong Kong; Laboratório de arco, tencent PCG; A Universidade Chinesa de Hong Kong

Estamos entusiasmados em anunciar o lançamento oficial do Supixel AI! Experimente o próximo nível de processamento de imagens e aumento da nossa tecnologia de IA de ponta baseada no SUPIR. Explore agora em supixel.ai.

? Dependências e instalação

Repo Clone

git clone https://github.com/Fanghua-Yu/SUPIR.git
cd SUPIR

Instale pacotes dependentes

conda create -n SUPIR python=3.8 -y
conda activate SUPIR
pip install --upgrade pip
pip install -r requirements.txt

Baixar pontos de verificação

Para usuários que podem se conectar ao HuggingFace, configurando LLAVA_CLIP_PATH, SDXL_CLIP1_PATH, SDXL_CLIP2_CKPT_PTH em CKPT_PTH.py como None . Esses clipes serão baixados automaticamente.

Modelos dependentes

Codificador clipe-1 sdxl
Codificador de clipe sdxl-2
Base SDXL 1.0_0.9VAE
Clipe llava
Llava v1.5 13b
(Opcional) Juggernaut-xl_v9_rundiffusionphoto_v2
- Substituição da SDXL base 1.0_0.9vae para foto realista
(Opcional) Juggernaut_rundiffusionphoto2_lightning_4steps
- Modelo de destilação usado em SUPIR_v0_Juggernautv9_lightning.yaml

Modelos que fornecemos:

SUPIR-v0Q : Baidu NetDisk, Google Drive
Configurações de treinamento padrão com papel. Alta generalização e alta qualidade de imagem na maioria dos casos.
SUPIR-v0F : Baidu NetDisk, Google Drive
Treinamento com configurações de degradação leve. O codificador do Stage1 do SUPIR-v0F continua sendo mais detalhes ao enfrentar degradações leves.

Editar caminho personalizado para pontos de verificação

 * [CKPT_PTH.py] --> LLAVA_CLIP_PATH, LLAVA_MODEL_PATH, SDXL_CLIP1_PATH, SDXL_CLIP2_CACHE_DIR 
* [options/SUPIR_v0.yaml] --> SDXL_CKPT, SUPIR_CKPT_Q, SUPIR_CKPT_F

⚡ Inferência rápida

Val DataSet

Realphoto60: Baidu NetDisk, Google Drive

Uso de Supir

Usage: 
-- python test.py [options] 
-- python gradio_demo.py [interactive options]

--img_dir                Input folder.
--save_dir               Output folder.
--upscale                Upsampling ratio of given inputs. Default: 1
--SUPIR_sign             Model selection. Default: ' Q ' ; Options: [ ' F ' , ' Q ' ]
--seed                   Random seed. Default: 1234
--min_size               Minimum resolution of output images. Default: 1024
--edm_steps              Numb of steps for EDM Sampling Scheduler. Default: 50
--s_stage1               Control Strength of Stage1. Default: -1 (negative means invalid)
--s_churn                Original hy-param of EDM. Default: 5
--s_noise                Original hy-param of EDM. Default: 1.003
--s_cfg                  Classifier-free guidance scale for prompts. Default: 7.5
--s_stage2               Control Strength of Stage2. Default: 1.0
--num_samples            Number of samples for each input. Default: 1
--a_prompt               Additive positive prompt for all inputs. 
    Default: ' Cinematic, High Contrast, highly detailed, taken using a Canon EOS R camera, 
    hyper detailed photo - realistic maximum detail, 32k, Color Grading, ultra HD, extreme
     meticulous detailing, skin pore detailing, hyper sharpness, perfect without deformations. '
--n_prompt               Fixed negative prompt for all inputs. 
    Default: ' painting, oil painting, illustration, drawing, art, sketch, oil painting, 
    cartoon, CG Style, 3D render, unreal engine, blurring, dirty, messy, worst quality, 
    low quality, frames, watermark, signature, jpeg artifacts, deformed, lowres, over-smooth '
--color_fix_type         Color Fixing Type. Default: ' Wavelet ' ; Options: [ ' None ' , ' AdaIn ' , ' Wavelet ' ]
--linear_CFG             Linearly (with sigma) increase CFG from ' spt_linear_CFG ' to s_cfg. Default: False
--linear_s_stage2        Linearly (with sigma) increase s_stage2 from ' spt_linear_s_stage2 ' to s_stage2. Default: False
--spt_linear_CFG         Start point of linearly increasing CFG. Default: 1.0
--spt_linear_s_stage2    Start point of linearly increasing s_stage2. Default: 0.0
--ae_dtype               Inference data type of AutoEncoder. Default: ' bf16 ' ; Options: [ ' fp32 ' , ' bf16 ' ]
--diff_dtype             Inference data type of Diffusion. Default: ' fp16 ' ; Options: [ ' fp32 ' , ' fp16 ' , ' bf16 ' ]

Script Python

 # Seek for best quality for most cases
CUDA_VISIBLE_DEVICES=0,1 python test.py --img_dir ' /opt/data/private/LV_Dataset/DiffGLV-Test-All/RealPhoto60/LQ ' --save_dir ./results-Q --SUPIR_sign Q --upscale 2
# for light degradation and high fidelity
CUDA_VISIBLE_DEVICES=0,1 python test.py --img_dir ' /opt/data/private/LV_Dataset/DiffGLV-Test-All/RealPhoto60/LQ ' --save_dir ./results-F --SUPIR_sign F --upscale 2 --s_cfg 4.0 --linear_CFG

Demo Gradio

CUDA_VISIBLE_DEVICES=0,1 python gradio_demo.py --ip 0.0.0.0 --port 6688 --use_image_slider --log_history

# Juggernaut_RunDiffusionPhoto2_Lightning_4Steps and DPM++ M2 SDE Karras for fast sampling
CUDA_VISIBLE_DEVICES=0,1 python gradio_demo.py --ip 0.0.0.0 --port 6688 --use_image_slider --log_history --opt options/SUPIR_v0_Juggernautv9_lightning.yaml

# less VRAM & slower (12G for Diffusion, 16G for LLaVA)
CUDA_VISIBLE_DEVICES=0,1 python gradio_demo.py --ip 0.0.0.0 --port 6688 --use_image_slider --log_history --loading_half_params --use_tile_vae --load_8bit_llava

Aplicativo online

Acabamos de lançar a Supixel AI, uma ferramenta fácil de usar projetada para ajudar no processamento e aumento de imagens de alta qualidade. Ele se baseia no supir. Se você gosta de fotografia, arte digital ou simplesmente adora brincar com aprimoramento da imagem, adoraríamos que você confira. ~

Bibtex

 @misc{yu2024scaling,
  title={Scaling Up to Excellence: Practicing Model Scaling for Photo-Realistic Image Restoration In the Wild}, 
  author={Fanghua Yu and Jinjin Gu and Zheyuan Li and Jinfan Hu and Xiangtao Kong and Xintao Wang and Jingwen He and Yu Qiao and Chao Dong},
  year={2024},
  eprint={2401.13627},
  archivePrefix={arXiv},
  primaryClass={cs.CV}
}

? Contato

Se você tiver alguma dúvida, envie um email para [email protected] ou [email protected] .

Uso não comercial apenas declaração

O supir ("software") é disponibilizado para uso, reprodução e distribuição estritamente para fins não comerciais. Para os propósitos desta declaração, "não comercial" é definido como não destinado principalmente a ou direcionado à vantagem comercial ou compensação monetária.

Ao usar, reproduzir ou distribuir o software, você concorda em cumprir essa restrição e não usar o software para fins comerciais sem obter permissão prévia por escrito do Dr. Jinjin Gu.

Esta declaração não limita de forma alguma os direitos sob nenhuma licença de código aberto que possa se aplicar ao software; Ele acrescenta apenas uma condição de que o software não deve ser usado para fins comerciais.

Em nenhum caso os autores ou detentores de direitos autorais serão responsáveis por qualquer reclamação, danos ou outro passivo, seja em uma ação de contrato, delito ou não, decorrente de, fora ou em conexão com o software ou o uso ou outras negociações no software.

Para obter consultas ou para obter permissão para uso comercial, entre em contato com o Dr. Jinjin Gu ([email protected]).

Expandir

Informações adicionais