Descargar triplane_edit - descarga de código fuente triplane

triplane_edit

Otro código fuente

1.0.0

Descargar

Edición de imágenes 3D consciente basada en referencias con triplanos

Rompecabezas

Bahri Batuhan Bilecen, Yigit Yalin, Ning Yu y Aysegul Dundar

Las redes adversas generativas (GAN) han surgido como herramientas poderosas para la generación de imágenes de alta calidad y la edición de imágenes reales mediante la manipulación de sus espacios latentes. Los avances recientes en GANS incluyen modelos 3D con conocimiento como EG3D, que cuentan con arquitecturas eficientes basadas en triplanos capaces de reconstruir la geometría 3D a partir de imágenes individuales. Sin embargo, se ha prestado atención limitada a proporcionar un marco integrado para la edición de imágenes basada en referencias de alta calidad y de alta calidad. Este estudio aborda esta brecha explorando y demostrando la efectividad del espacio de triplano para ediciones avanzadas basadas en referencias. Nuestro enfoque novedoso integra la codificación, la localización automática, el desenredado espacial de las características de triplano y el aprendizaje de fusión para lograr las ediciones deseadas. Además, nuestro marco demuestra versatilidad y robustez en varios dominios, extendiendo su efectividad a las ediciones faciales de animales, ediciones parcialmente estilizadas como caras de dibujos animados, ediciones de ropa de cuerpo completo y ediciones de 360 grados. Nuestro método muestra un rendimiento de vanguardia sobre la dirección latente relevante, el texto y los métodos GaN y GaN con consumo 3D guiados por imágenes, tanto cualitativa como cuantitativamente.

Requisitos e instalación

Asegúrese de tener Python 3.8 de 64 bits, Pytorch 11.1 (o arriba) y Cuda 11.3 (o arriba).
Preferiblemente, cree un nuevo entorno a través de Conda o VenV y active el entorno.
Repositorio de clonos: git clone --recursive https://github.com/three-bee/triplane_edit.git
Instalar dependencias PIP: cd ./triplane_edit && pip install -r requirements.txt

Preparación del conjunto de datos ✂️

Seguimos la preparación del conjunto de datos de EG3D para la extracción de pose y la alineación facial. Asegúrese de no omitir la configuración de Deep3DFacerCon_Pytorch. Luego, ejecute el código de preprocesamiento en el flujo:

 cd ./dataset_preprocessing/ffhq
python preprocess_in_the_wild.py --indir=YOUR_INPUT_IMAGE_FOLDER

Esto generará imágenes alineadas y un dataset.json que contiene matrices de cámara en YOUR_INPUT_IMAGE_FOLDER/preprocessed/ .

Hemos incluido imágenes de ejemplo y poses en ./example/ .

? Puntos de control

Pon todos los archivos descargados en ./checkpoints/ .

Red	Nombre del archivo
EG3D Generador reequilibrado	`ffhqrebalanced512-128.pkl`
EG3D-goae codificadores	`encoder_FFHQ.pt` & `afa_FFHQ.pt`
Codificador de fusión finetened	`encoder_FFHQ_finetuned.pt`
Segmentación de Bisenet	`79999_iter.pth`
IR-SE50 para la pérdida de identificación	`model_ir_se50.pth`

Inicio rápido

Ejecute demo.ipynb para varios ejemplos de edición.

? Citación

Nuestra base de código utiliza las siguientes excelentes obras: EG3D, EG3D-GOAE, Triplanenetv2, Bisenet y Deep3DFacerCon_Pytorch. Agradecemos a los autores por proporcionarlos.

 @misc{bilecen2024referencebased,
      title={Reference-Based 3D-Aware Image Editing with Triplanes}, 
      author={Bahri Batuhan Bilecen and Yigit Yalin and Ning Yu and Aysegul Dundar},
      year={2024},
      eprint={2404.03632},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

Expandir

Información adicional

Versión 1.0.0
Tipo Otro código fuente
Fecha de actualización 2025-03-07
tamaño 7.62MB
Proviene de Github

Aplicaciones relacionadas

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
perro_zorro_conejito

2022-08-01
Motor de análisis de datos Lihua versión gratuita 3.0_search_navigation_collection_public opinion_ranking_api

2022-06-28

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo