Download matfuse sd - matfuse sd download de código fonte

matfuse sd

Outro código-fonte

1.0.0

Baixar

Matfuse: geração de material controlável com modelos de difusão

Giuseppe Vecchio, Renato Sortino, Simone Palazzo e Concetto Spampinato

Teaser

? Visão geral

A implementação oficial do Pytorch para o artigo "Matfuse: geração controlável de material com modelos de difusão" .

O Matfuse é uma abordagem nova que simplifica a criação de mapas SVBRDF (função de distribuição de refletância bidirecional espacialmente variável).

Ele aproveita o poder generativo dos modelos de difusão (DM) para otimizar o processo de síntese do material. Ao integrar várias fontes de condicionamento, incluindo paletas de cores, esboços, texto e figuras, ele fornece controle e flexibilidade de granulação fina na geração de materiais.

Além disso, o Matfuse ativou a edição ou o refinamento dos materiais sintetizados após a geração inicial. Ele suporta uma edição no nível do mapa, mascarando áreas específicas de mapas específicos ou todo o material.

Veja mais Exaples do Matfuse na página do projeto.

? Artigo resumo

Criar materiais de alta qualidade em computadores gráficos é uma tarefa desafiadora e demorada, que requer grande experiência. Para simplesmente esse processo, introduzimos o Matfuse , uma abordagem unificada que aproveita o poder generativo dos modelos de difusão para simplificar a criação de mapas SVBRDF. Nosso oleoduto integra várias fontes de condicionamento, incluindo paletas de cores, esboços, texto e imagens, para um controle e flexibilidade de granulação fina na síntese de materiais. Esse design permite a combinação de diversas fontes de informação (por exemplo, esboço + texto), aprimorando as possibilidades criativas de acordo com o princípio da composicionalidade. Além disso, propomos um modelo de compactação com vários codificadores com um propósito duplo: melhora o desempenho da reconstrução, aprendendo uma representação latente separada para cada mapa e permite um recurso de edição de materiais no nível do mapa. Demonstramos a eficácia do Matfuse em várias configurações de condicionamento e exploramos o potencial da edição de materiais. Também avaliamos quantitativamente a qualidade dos materiais gerados em termos de pontuações CLIP-IQA e FID.

Leia o papel completo do Matfuse sobre Arxiv.

Detalhes do repositório

Este repo conta com a implementação original de difusão latente (https://github.com/compvis/stable-diffusion), que foi modificada para incluir os recursos descritos no papel Matfuse . Se você estiver familiarizado com a base de código de difusão estável original, não terá problemas para executar este.

As mudanças mais relevantes são:

Uma nova arquitetura VQ-VAE multi-codificador que processa cada mapa de material (difuso, normal, rugosidade e especular) de forma independente, aprendendo uma representação latente sem desintegrado.
Um novo vqmaterialloss , que combina o VQLPIPSWithDiscriminator original com uma perda de renderização.
Mecanismo de fusão de várias condições.

Matfuse é treinado em uma combinação do conjunto de dados de Deschaintre et al. (2018) e materiais da Biblioteca Polyheaven. Não planejamos liberar esse conjunto de dados, pois pode ser facilmente coletado. De qualquer forma, se você planeja treinar seu próprio Matfuse, recomendamos fortemente usando o conjunto de dados lançado recentemente Matsynth , que contém uma variedade maior de materiais e anotações de alta resolução.

? Instalação

1. Clone o repo

git clone https://github.com/giuvecchio/matfuse-sd.git
cd matfuse-sd

2. Configurando o VirtualEnv

Isso supõe que você tenha navegado na raiz matfuse-sd após a clonagem.

Nota: Isso é testado em python3.10 . Para outras versões do Python, você pode encontrar conflitos de versão.

Pytorch 1.13.1

 # create environment (can use venv instead of conda)
conda create -n matfuse python==3.10.13
conda activate matfuse
# install required packages
pip install -r requirements.txt

? Treinamento

O treinamento do Matfuse requer duas etapas:

Treinamento do AutoEncoder (VQ-VAE)
Treinamento do modelo de difusão (LDM)

Ambos são acessados através do script main.py na pasta src e depende do uso de arquivos de configuração para configurar os modelos, conjuntos de dados e perdas.
Os arquivos de configuração estão localizados em src/configs/ , e são divididos em subpastas autoencoder e diffusion .
Use o arquivo de configuração certo, dependendo da parte do modelo que você deseja treinar.

O comando geral para iniciar um treinamento é:

python src/main.py --base src/configs/ < model > / < config.yaml > --train --gpus < indices, >

Preparação de dados

Fornecemos uma classe de conjunto de dados para o treinamento do Matfuse. Este conjunto de dados espera que a pasta de dados seja estruturada, como mostrado abaixo.

 ./data/MatFuse/{split}/
├── bricks_045
│   ├── metadata.json
│   ├── diffuse.png
│   ├── normal.png
│   ├── roughness.png
│   ├── specular.png
│   ├── sketch.png
│   ├── renders
│       ├── render_00.png
│       ├── render_01.png
│       ├── ...
├── ...

Os dados devem ser divididos entre os conjuntos de train e test . Cada pasta de material contém os mapas SVBRDF necessários (difuso, normal, rugosidade, especular), o esboço e um arquivo de metadata.json com a legenda do texto e a paleta de cores.

️ Nota: Para executar um treinamento, atualize a propriedade data_root no arquivo de configuração para apontar para a pasta onde você possui seu conjunto de dados.

Processando os dados

Fornecemos um script para extrair a paleta de cores das renderizações na pasta src/scripts/data . Para executá -lo, execute:

python src/scripts/data/extract_palette.py --data < path/to/dataset >

Treinando o AutoEncoder

As configurações para o treinamento de um AutoEncoder são fornecidas no src/configs/autoencoder .
O Matfuse usa um modelo regulado por VQ. Para mais informações, consulte o repositório de transformadores de doming.

O treinamento pode ser iniciado correndo

python src/main.py --base src/configs/autoencoder/multi-vq_f8.yaml --train --gpus 0,

Treinando o LDM

Em src/configs/diffusion/ Fornecemos configurações para treinar o Matfuse LDMS.
️ Antes de passar para a próxima etapa, atualize o ckpt_path em first_stage_config no matfuse-ldm-vq_f8.yaml para apontar para o seu ponto de verificação VQ-VAE.

O treinamento pode ser iniciado correndo

python src/main.py --base src/configs/diffusion/matfuse-ldm-vq_f8.yaml --train --gpus 0,

Retomando um treinamento

Para retomar um treinamento, anexa os argumentos --resume <log/folder> ao comando de treinamento.

Notas:

Se você estiver treinando no Windows, lembre -se de definir o back -end distribuído para gloo . Outros não são apoiados!

 $env :PL_TORCH_DISTRIBUTED_BACKEND= ' gloo '

Para limitar o número de GPUs visíveis:

CUDA_VISIBLE_DEVICES= < GPU_ID > python src/main.py ...

As experiências são automaticamente registradas usando pesos e vieses. Para especificar seu próprio espaço de projeto e nome do projeto, defina as seguintes variáveis de ambiente:

WANDB_PROJECT= ' {YOUR_PROJECT_NAME} '
WANDB_ENTITY= ' {YOUR_PROJECT_SPACE_NAME} '

? Inferência

Para executar a inferência em um modelo treinado, execute o script gradio_app.py especificando o caminho para o ponto de verificação do modelo e a configuração.
Isso abrirá uma interface da Web para executar a geração condicional e a edição de materiais.

️ Notas

Para inferência, são necessários pelo menos 12 GB de GPU VRAM.
Os pesos estão disponíveis em huggingface.co/gvecchio/matfuse. Fornecemos apenas pesos da EMA (podada) e pesos completos. O aplicativo Gradio espera que os pesos completos sejam fornecidos.

python src/gradio_app.py --ckpt < path/to/checkpoint.ckpt > --config src/configs/diffusion/ < config.yaml >

Citação

 @inproceedings { vecchio2024matfuse ,
  author    = { Vecchio, Giuseppe and Sortino, Renato and Palazzo, Simone and Spampinato, Concetto } ,
  title     = { MatFuse: Controllable Material Generation with Diffusion Models } ,
  booktitle = { Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) } ,
  month     = { June } ,
  year      = { 2024 } ,
  pages     = { 4429-4438 }
}

Expandir

Informações adicionais

Versão 1.0.0
Tipo Outro código-fonte
Data da Última Atualização 2025-03-10
tamanho 6.77MB
Vindo de Github

Aplicativos Relacionados

Empregada SD

2024-04-10
Versão gratuita do aplicativo de vídeo SD

2024-01-09
aplicativo SD de pilha elétrica

2023-08-01
Purgatório Celestial SD

2023-06-13
Versão mais recente autônoma do SD Kuaishou Tornado

2023-02-20
Versão Android do SD Quick Fight Tornado

2023-02-17

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos