Download matfuse sd - Unduh Kode Sumber matfuse sd

matfuse sd

Kode sumber lainnya

1.0.0

Unduh

Matfuse: Generasi Bahan yang Dapat Dikontrol dengan Model Difusi

Giuseppe Vecchio, Renato Sortino, Simone Palazzo dan Concetto Spampinato

Teaser

? Ringkasan

Implementasi Pytorch resmi untuk kertas "Matfuse: Generasi Bahan yang Dapat Dikontrol dengan Model Difusi" .

Matfuse adalah pendekatan baru yang menyederhanakan penciptaan SVBRDF (fungsi distribusi refleksi dua arah yang bervariasi secara spasial).

Ini memanfaatkan kekuatan generatif model difusi (DM) untuk merampingkan proses sintesis material. Dengan mengintegrasikan berbagai sumber pengkondisian, termasuk palet warna, sketsa, teks, dan gambar, ia memberikan kontrol berbutir halus dan fleksibilitas dalam pembuatan material.

Selain itu, Matfuse mengaktifkan pengeditan atau penyempurnaan bahan yang disintesis setelah generasi awal mereka. Ini mendukung pengeditan tingkat peta dengan menutupi area spesifik peta spesifik atau seluruh materi.

Lihat lebih banyak exaples dari Matfuse di halaman proyek.

? Abstrak kertas

Membuat bahan berkualitas tinggi dalam grafik komputer adalah tugas yang menantang dan memakan waktu, yang membutuhkan keahlian yang hebat. Untuk hanya proses ini, kami memperkenalkan Matfuse , pendekatan terpadu yang memanfaatkan kekuatan generatif model difusi untuk menyederhanakan penciptaan peta SVBRDF. Pipa kami mengintegrasikan berbagai sumber pengkondisian, termasuk palet warna, sketsa, teks, dan gambar, untuk kontrol berbutir halus dan fleksibilitas dalam sintesis material. Desain ini memungkinkan kombinasi beragam sumber informasi (misalnya, sketsa + teks), meningkatkan kemungkinan kreatif sejalan dengan prinsip komposisi. Selain itu, kami mengusulkan model kompresi multi-encoder dengan tujuan dua kali lipat: ini meningkatkan kinerja rekonstruksi dengan mempelajari representasi laten terpisah untuk setiap peta dan memungkinkan kemampuan pengeditan material tingkat peta. Kami menunjukkan efektivitas Matfuse di bawah pengaturan pengkondisian berganda dan mengeksplorasi potensi pengeditan material. Kami juga secara kuantitatif menilai kualitas bahan yang dihasilkan dalam hal skor Clip-IQA dan FID.

Baca kertas matfuse lengkap tentang arxiv.

Detail Repositori

Repo ini bergantung pada implementasi difusi laten asli (https://github.com/compvis/stable-diffusion) yang telah dimodifikasi untuk memasukkan fitur yang dijelaskan dalam kertas Matfuse . Jika Anda terbiasa dengan basis kode difusi stabil asli, Anda seharusnya tidak memiliki masalah yang menjalankan yang satu ini.

Perubahan yang paling relevan adalah:

Arsitektur VQ-VAE multi-encoder baru yang memproses setiap peta material (difus, normal, kekasaran dan specular) secara independen, mempelajari representasi laten yang terputus-putus.
A VQMaterialloss A baru yang menggabungkan vqlpipswithDiscriminator asli dengan kerugian rendering.
Mekanisme Fusi Multi-Kondisi.

Matfuse dilatih pada kombinasi dataset oleh Deschaintre et al. (2018) dan bahan dari perpustakaan polyheaven. Kami tidak berencana untuk merilis dataset seperti itu karena dapat dengan mudah dikumpulkan. Ngomong-ngomong, jika Anda berencana untuk melatih Matfuse Anda sendiri, kami sangat merekomendasikan menggunakan Dataset Matsynth yang baru-baru ini dirilis yang berisi variasi yang lebih luas dari bahan dan anotasi resolusi tinggi.

? Instalasi

1. Kloning repo

git clone https://github.com/giuvecchio/matfuse-sd.git
cd matfuse-sd

2. Menyiapkan VirtualEnv

Ini dengan asumsi Anda telah menavigasi ke akar matfuse-sd setelah mengkloningnya.

Catatan: Ini diuji di bawah python3.10 . Untuk versi Python lainnya, Anda mungkin menghadapi konflik versi.

Pytorch 1.13.1

 # create environment (can use venv instead of conda)
conda create -n matfuse python==3.10.13
conda activate matfuse
# install required packages
pip install -r requirements.txt

? Pelatihan

Pelatihan Matfuse membutuhkan dua langkah:

Pelatihan Autoencoder (VQ-VAE)
Pelatihan Model Difusi (LDM)

Keduanya diakses melalui skrip main.py di folder src dan bergantung pada penggunaan file konfigurasi untuk mengatur model, kumpulan data, dan kerugian.
File konfigurasi terletak di bawah src/configs/ , dan dibagi dalam subfolder autoencoder dan diffusion .
Gunakan file konfigurasi yang tepat tergantung pada bagian dari model yang ingin Anda latih.

Perintah umum untuk meluncurkan pelatihan adalah:

python src/main.py --base src/configs/ < model > / < config.yaml > --train --gpus < indices, >

Persiapan data

Kami menyediakan kelas dataset untuk pelatihan Matfuse. Dataset ini mengharapkan folder data disusun seperti yang ditunjukkan di bawah ini.

 ./data/MatFuse/{split}/
├── bricks_045
│   ├── metadata.json
│   ├── diffuse.png
│   ├── normal.png
│   ├── roughness.png
│   ├── specular.png
│   ├── sketch.png
│   ├── renders
│       ├── render_00.png
│       ├── render_01.png
│       ├── ...
├── ...

Data harus terpecah antara train dan set test . Setiap folder material berisi peta SVBRDF yang diperlukan (difus, normal, kekasaran, specular), sketsa dan file metadata.json dengan teks teks dan palet warna.

️ Catatan: Untuk menjalankan pelatihan, perbarui properti data_root di file konfigurasi untuk menunjuk ke folder di mana Anda memiliki dataset Anda disimpan.

Memproses data

Kami menyediakan skrip untuk mengekstrak palet warna dari render di bawah src/scripts/data . Untuk menjalankannya lari:

python src/scripts/data/extract_palette.py --data < path/to/dataset >

Melatih Autoencoder

Konfigurasi untuk Pelatihan Autoencoder disediakan di src/configs/autoencoder .
Matfuse menggunakan model yang diatur VQ. Untuk info lebih lanjut, lihat repositori Taming-Transformers.

Pelatihan dapat dimulai dengan berlari

python src/main.py --base src/configs/autoencoder/multi-vq_f8.yaml --train --gpus 0,

Melatih LDM

Dalam src/configs/diffusion/ kami menyediakan konfigurasi untuk melatih Matfuse LDMS.
️ Sebelum pindah ke langkah berikutnya perbarui ckpt_path di bawah first_stage_config di matfuse-ldm-vq_f8.yaml untuk menunjuk ke pos pemeriksaan VQ-VAE Anda.

Pelatihan dapat dimulai dengan berlari

python src/main.py --base src/configs/diffusion/matfuse-ldm-vq_f8.yaml --train --gpus 0,

Melanjutkan pelatihan

Untuk melanjutkan pelatihan, tambahkan argumen --resume <log/folder> ke perintah pelatihan.

Catatan:

Jika Anda berlatih di Windows, ingatlah untuk mengatur backend terdistribusi ke gloo . Yang lain tidak didukung!

 $env :PL_TORCH_DISTRIBUTED_BACKEND= ' gloo '

Untuk membatasi jumlah penggunaan GPU yang terlihat:

CUDA_VISIBLE_DEVICES= < GPU_ID > python src/main.py ...

Eksperimen secara otomatis dicatat menggunakan bobot dan bias. Untuk menentukan ruang proyek dan nama proyek Anda sendiri, atur variabel lingkungan berikut:

WANDB_PROJECT= ' {YOUR_PROJECT_NAME} '
WANDB_ENTITY= ' {YOUR_PROJECT_SPACE_NAME} '

? Kesimpulan

Untuk menjalankan inferensi pada model yang terlatih, jalankan skrip gradio_app.py yang menentukan jalur ke pos pemeriksaan model dan konfigurasi.
Ini akan membuka antarmuka web untuk melakukan pembuatan bersyarat dan pengeditan materi.

️ Catatan

Untuk inferensi, setidaknya 12GB GPU VRAM diperlukan.
Bobot tersedia di huggingface.co/gvecchio/matfuse. Kami memberikan bobot EMA saja (dipangkas) dan bobot penuh. Aplikasi Gradio mengharapkan bobot penuh disediakan.

python src/gradio_app.py --ckpt < path/to/checkpoint.ckpt > --config src/configs/diffusion/ < config.yaml >

Kutipan

 @inproceedings { vecchio2024matfuse ,
  author    = { Vecchio, Giuseppe and Sortino, Renato and Palazzo, Simone and Spampinato, Concetto } ,
  title     = { MatFuse: Controllable Material Generation with Diffusion Models } ,
  booktitle = { Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) } ,
  month     = { June } ,
  year      = { 2024 } ,
  pages     = { 4429-4438 }
}

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-03-10
ukuran 6.77MB
Berasal dari Github

Aplikasi Terkait

pembantu SD

2024-04-10
Versi gratis aplikasi video SD

2024-01-09
aplikasi sd tumpukan listrik

2023-08-01
SD Api Penyucian Surgawi

2023-06-13
SD Kuaishou Tornado versi terbaru yang berdiri sendiri

2023-02-20
SD Quick Fight Tornado versi Android

2023-02-17

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua