Palette Image to Image Diffusion Models Download - Palette Image to Image Diffusion Models Download do Código Fonte

Palette Image to Image Diffusion Models

Pitão

1.0.0

Baixar

Paleta: modelos de difusão de imagem a imagem

Papel | Projeto

Apresentação

Esta é uma implementação não oficial da paleta: modelos de difusão de imagem a imagem por Pytorch e é herdado principalmente de sua versão de super-resolução, imagem-super-resolução-revolução-refinamento. O modelo de código é do meu outro projeto de semente: Distributed-Pytorch-Template.

Existem alguns detalhes da implementação com descrições de papel:

Adaptamos a arquitetura U-Net usada na Guided-Diffusion , que dão um impulso substancial à qualidade da amostra.
Utilizamos o mecanismo de atenção em características de baixa resolução (16 × 16) como DDPM de baunilha.
Nós codificamos o $ gamma $ em vez de $ t $ na Palette e incorporá -la com transformação afim.
Nós corrigimos a variação $ Σ_ theta (x_t, t) $ a uma constante durante a inferência, conforme descrito na Palette .

Status

Código

Pipeline do modelo de difusão
Processo de trem/teste
Estado de treinamento em salvar/carregar
Logger/Tensorboard
Treinamento de GPU múltiplo (DDP)
Ema
Métricas (agora para FID, é)
DataSet (agora para incluir, sem escritos, colorização)
Script do Google Colab? (Agora para pintar)

Tarefa

Eu tento terminar as seguintes tarefas em ordem:

Painting no Celebahq (Google Colab)
Pintando em Places2 com 128 × 128 Centering Mask

O experimento de acompanhamento é incerto, devido à falta de tempo e aos recursos da GPU:

Uncropping on Places2
Colorização no conjunto de imagenet val

Resultados

O modelo DDPM requer recursos computacionais significativos, e construímos apenas alguns modelos de exemplo para validar as idéias neste artigo.

Visuais

Celeba-HQ

Resultados com 200 épocas e iterações de 930k, e as 100 primeiras amostras em máscara central e máscara irregular.

Places2 com 128 × 128 Centering Mask

Resultados com 16 épocas e iterações de 660k, e as várias amostras escolhidas na máscara central.

Uncropping on Places2

Resultados com 8 épocas e iterações de 330k, e as várias amostras escolhidas em desbropping.

Métricas

Tarefas	Conjunto de dados	Ema	Fid (-)	É (+)
Pintando com a Máscara de Centração	Celeba-HQ	Falso	5.7873	3.0705
Passando com máscara irregular	Celeba-HQ	Falso	5.4026	3.1221

Uso

Ambiente

 pip install - r requirements . txt

Modelo pré-treinado

Conjunto de dados	Tarefa	Iterações	GPUS × Days × Bs	Url
Celeba-HQ	Painting	930K	2 × 5 × 3	Google Drive
Places2	Painting	660K	4 × 8 × 10	Google Drive

BS indica o tamanho da amostra por GPU.

Dados preparam

Recebemos a maioria deles de Kaggle, que pode ser um pouco diferente da versão oficial, e você também pode baixá -los no site oficial.

Celeba-HQ redimensionado (256x256) Kaggle
Places2 OFICIAL | Places2 Kaggle
Imagenet Oficial

Utilizamos a divisão padrão desses conjuntos de dados para treinamento e avaliação. As listas de arquivos que usamos podem ser encontradas no Celeba-HQ, Places2.

Depois de preparar os dados próprios, você precisa modificar o arquivo de configuração correspondente para apontar para seus dados. Tome o seguinte como exemplo:

 " which_dataset " : {  // import designated dataset using arguments 
    " name " : ["data.dataset", "InpaintDataset"], // import Dataset() class
    " args " :{ // arguments to initialize dataset
    	" data_root " : " your data path " ,
    	" data_len " : -1,
    	" mask_mode " : " hybrid "
    } 
},

Mais opções sobre Dataloader e Split de validação também podem ser encontradas nos datasets em parte do arquivo de configuração.

Treinamento/currículo de treinamento

Faça o download dos pontos de verificação dos links especificados.
Defina resume_state do arquivo de configuração no diretório do ponto de verificação anterior. Tome o seguinte como exemplo, este diretório contém estados de treinamento e modelo salvo:

 " path " : { //set every part file path
	" resume_state " : "experiments/inpainting_celebahq_220426_150122/checkpoint/100" 
},

Defina seu rótulo de rede na função load_everything of model.py , o padrão é uma rede . Siga as configurações do tutorial, os otimizadores e modelos serão carregados em 100.State e 100_Network.PTH, respectivamente.

 netG_label = self . netG . __class__ . __name__
self . load_network ( network = self . netG , network_label = netG_label , strict = False )

Execute o script:

 python run . py - p train - c config / inpainting_celebahq . json

Testamos o backbone da rede U usada no SR3 e Guided Diffusion , e Guided Diffusion é um desempenho mais robusto em nossos experimentos atuais. Mais opções sobre backbone , perda e métrica podem ser encontradas na which_networks parte do arquivo de configuração.

Teste

Modifique o arquivo de configuração para apontar para seus dados seguindo as etapas nos dados Prepare a peça.
Defina o caminho do seu modelo seguindo as etapas no currículo da parte de treinamento .
Execute o script:

 python run . py - p test - c config / inpainting_celebahq . json

Avaliação

Crie duas pastas salvando imagens da verdade do solo e imagens de amostra, e seus nomes de arquivos precisam corresponder um ao outro.
Execute o script:

 python eval . py - s [ ground image path ] - d [ sample image path ]

Reconhecer

Nosso trabalho é baseado nos seguintes trabalhos teóricos:

Modelos probabilísticos de difusão denoising
Paleta: modelos de difusão de imagem a imagem
Modelos de difusão batem gans na síntese de imagem

E estamos nos beneficiando muito dos seguintes projetos:

Openai/Diffusão Guiada
LouISROSS/Modelo baseado em difusão por colorização

Expandir

Informações adicionais

Versão 1.0.0
Tipo Pitão
Data da Última Atualização 2025-07-14
tamanho 5.89MB
Vindo de Github

Aplicativos Relacionados

pytorch image models

2024-11-03
galeria de imagens moa

2011-09-14
Host de imagem CF

2011-04-26
Host de imagem CF

2011-04-26
Redimensionador de imagem VSO

2009-06-04
Plug-in de superimagem

2009-04-18

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ToDo Co

Pitão

1.0.0
Python Portfolio

Pitão
datamule python

Pitão
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos