matfuse sd Download - matfuse sd Source Code Download

matfuse sd

Autre code source

1.0.0

Télécharger

Matfuse: génération de matériaux contrôlables avec des modèles de diffusion

Giuseppe Vecchio, Renato Tritino, Simone Palazzo et Contetto Spampinato

Teaser

? Aperçu

La mise en œuvre officielle de Pytorch pour le papier "MATFUSE: Génération de matériaux contrôlables avec des modèles de diffusion" .

Matfuse est une nouvelle approche qui simplifie la création de cartes SVBRDF (fonction de distribution de réflectance bidirectionnelle variant spatialement).

Il exploite la puissance générative des modèles de diffusion (DM) pour rationaliser le processus de synthèse des matériaux. En intégrant plusieurs sources de conditionnement, y compris les palettes de couleurs, les croquis, le texte et les images, il offre un contrôle et une flexibilité à grains fins dans la génération de matériaux.

De plus, MATFUS a permis de modifier ou de raffiner les matériaux synthétisés après leur génération initiale. Il prend en charge un montage au niveau de la carte en masquant des zones spécifiques de cartes spécifiques ou de l'ensemble du matériau.

Voir plus d'Exaples de Matfuse sur la page du projet.

? Résumé du papier

La création de matériaux de haute qualité en informatique est une tâche difficile et chronophage, ce qui nécessite une grande expertise. Pour simplement ce processus, nous introduisons Matfuse , une approche unifiée qui exploite la puissance générative des modèles de diffusion pour simplifier la création de cartes SVBRDF. Notre pipeline intègre plusieurs sources de conditionnement, y compris les palettes de couleurs, les croquis, le texte et les images, pour un contrôle et une flexibilité à grains fins dans la synthèse des matériaux. Cette conception permet la combinaison de diverses sources d'information (par exemple, Sketch + Text), améliorant les possibilités créatives conformément au principe de la compositionnalité. De plus, nous proposons un modèle de compression multi-encodeur à deux fins: il améliore les performances de reconstruction en apprenant une représentation latente séparée pour chaque carte et permet des capacités d'édition de matériau au niveau de la carte. Nous démontrons l'efficacité du matfuse sous plusieurs paramètres de conditionnement et explorons le potentiel de l'édition de matériaux. Nous évaluons également quantitativement la qualité des matériaux générés en termes de scores CLIP-IQA et FID.

Lisez le papier matfuse complet sur Arxiv.

Détails du référentiel

Ce repo s'appuie sur l'implémentation d'origine de diffusion latente (https://github.com/compvis/stable-diffusion) qui a été modifié pour inclure les fonctionnalités décrites dans le papier matfuse . Si vous connaissez la base de code de diffusion stable d'origine, vous ne devriez avoir aucun problème à exécuter celui-ci.

Les changements les plus pertinents sont:

Une nouvelle architecture VQ-VAE multi-encadeur qui traite indépendamment chaque carte matérielle (diffuse, normale, rugosité et spéculaire), apprenant une représentation latente démêlée.
Un nouveau VqMaterialLoss qui combine le VQLPipsWithDiscriminator d'origine avec une perte de rendu.
Mécanisme de fusion multi-conditions.

Matfuse est formé sur une combinaison de l'ensemble de données par Deschaintre et al. (2018) et les matériaux de la bibliothèque Polyheaven. Nous ne prévoyons pas de publier un tel ensemble de données car il peut être facilement collecté. Quoi qu'il en soit, si vous prévoyez de former votre propre Matfuse, nous recommandons fortement en utilisant le jeu de données récemment publié Matsynth qui contient une plus grande variété de matériaux et d'annotations haute résolution.

? Installation

1. Clone le repo

git clone https://github.com/giuvecchio/matfuse-sd.git
cd matfuse-sd

2. Configuration du VirtualEnv

Cela suppose que vous avez navigué à la racine matfuse-sd après l'avoir cloné.

Remarque: Ceci est testé sous python3.10 . Pour d'autres versions Python, vous pourriez rencontrer des conflits de version.

Pytorch 1.13.1

 # create environment (can use venv instead of conda)
conda create -n matfuse python==3.10.13
conda activate matfuse
# install required packages
pip install -r requirements.txt

? Entraînement

La formation de Matfuse nécessite deux étapes:

Formation de l'autoencoder (VQ-VAE)
Formation du modèle de diffusion (LDM)

Les deux sont accessibles via le script main.py dans le dossier src et s'appuient sur l'utilisation des fichiers de configuration pour configurer les modèles, les ensembles de données et les pertes.
Les fichiers de configuration sont situés sous src/configs/ et sont divisés dans autoencoder et des sous-dossiers diffusion .
Utilisez le bon fichier de configuration en fonction de la partie du modèle que vous souhaitez former.

La commande générale pour lancer une formation est:

python src/main.py --base src/configs/ < model > / < config.yaml > --train --gpus < indices, >

Préparation des données

Nous fournissons une classe d'ensemble de données pour la formation de Matfuse. Cet ensemble de données s'attend à ce que le dossier de données soit structuré comme indiqué ci-dessous.

 ./data/MatFuse/{split}/
├── bricks_045
│   ├── metadata.json
│   ├── diffuse.png
│   ├── normal.png
│   ├── roughness.png
│   ├── specular.png
│   ├── sketch.png
│   ├── renders
│       ├── render_00.png
│       ├── render_01.png
│       ├── ...
├── ...

Les données doivent être divisées entre les ensembles train et test . Chaque dossier de matériau contient les cartes SVBRDF requises (diffuse, normale, rugosité, spéculaire), l'esquisse et un fichier metadata.json avec la légende du texte et la palette de couleurs.

️ Remarque: Pour exécuter une formation, mettez à jour la propriété data_root dans le fichier de configuration pour pointer vers le dossier où vous avez stocké votre ensemble de données.

Traitement des données

Nous fournissons un script pour extraire la palette de couleurs des rendus dans le dossier src/scripts/data . Pour l'exécuter, fonctionne:

python src/scripts/data/extract_palette.py --data < path/to/dataset >

Former l'autoencoder

Des configurations pour la formation d'un autoencoder sont fournies à src/configs/autoencoder .
Matfuse utilise un modèle régularisé VQ. Pour plus d'informations, consultez le référentiel de transformateurs à l'approvisionnement.

La formation peut être lancée par courir

python src/main.py --base src/configs/autoencoder/multi-vq_f8.yaml --train --gpus 0,

Formation du LDM

Dans src/configs/diffusion/ Nous fournissons des configurations pour la formation des Matfuse LDMS.
️ Avant de passer à l'étape suivante, mettez à jour le ckpt_path sous first_stage_config dans le matfuse-ldm-vq_f8.yaml pour pointer votre point de contrôle VQ-VAE.

La formation peut être lancée par courir

python src/main.py --base src/configs/diffusion/matfuse-ldm-vq_f8.yaml --train --gpus 0,

Reprendre une formation

Pour reprendre une formation, ajoutez les arguments --resume <log/folder> à la commande de formation.

Notes:

Si vous vous entraînez sur Windows, n'oubliez pas de définir le backend distribué sur gloo . D'autres ne sont pas pris en charge!

 $env :PL_TORCH_DISTRIBUTED_BACKEND= ' gloo '

Pour limiter le nombre de GPU visibles à utiliser:

CUDA_VISIBLE_DEVICES= < GPU_ID > python src/main.py ...

Les expériences sont automatiquement enregistrées à l'aide de poids et de biais. Pour spécifier votre propre espace de projet et le nom de projet Définissez les variables d'environnement suivantes:

WANDB_PROJECT= ' {YOUR_PROJECT_NAME} '
WANDB_ENTITY= ' {YOUR_PROJECT_SPACE_NAME} '

? Inférence

Pour exécuter l'inférence sur un modèle formé, exécutez le script gradio_app.py spécifiant le chemin d'accès au point de contrôle du modèle et à la configuration.
Cela ouvrira une interface Web pour effectuer la génération conditionnelle et l'édition de matériaux.

️ Notes

Pour l'inférence, au moins 12 Go de GPU VRAM sont nécessaires.
Des poids sont disponibles sur HuggingFace.co/gvecchio/matfuse. Nous fournissons à la fois des poids EMA uniquement (taillés) et des poids complets. L'application Gradio s'attend à ce que les poids complets soient fournis.

python src/gradio_app.py --ckpt < path/to/checkpoint.ckpt > --config src/configs/diffusion/ < config.yaml >

Citation

 @inproceedings { vecchio2024matfuse ,
  author    = { Vecchio, Giuseppe and Sortino, Renato and Palazzo, Simone and Spampinato, Concetto } ,
  title     = { MatFuse: Controllable Material Generation with Diffusion Models } ,
  booktitle = { Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) } ,
  month     = { June } ,
  year      = { 2024 } ,
  pages     = { 4429-4438 }
}

Développer

Informations supplémentaires

Version 1.0.0
Type Autre code source
Date de mise à jour 2025-03-10
taille 6.77MB
Provenant de Github

Applications connexes

Femme de ménage SD

2024-04-10
Version gratuite de l'application vidéo SD

2024-01-09
application sd pour pieux électriques

2023-08-01
Purgatoire Céleste SD

2023-06-13
Dernière version autonome de SD Kuaishou Tornado

2023-02-20
Version Android de SD Quick Fight Tornado

2023-02-17

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout