Descarga lama - Descargar el código fuente lama

? LAMA: resolución de la máscara grande de la resolución Inpenación con convoluciones de Fourier

por Roman Suvorov, Elizaveta Logacheva, Anton Mashikhin, Anastasia Remizova, Arsenii Ashukha, Aleksei Silvestrov, Naejin Kong, Harshith Goka, Kiwoong Park, Victor Lempitsky.

LAMA generaliza sorprendentemente bien a resoluciones mucho más altas (~ 2k❗️) de lo que vio durante el entrenamiento (256x256), y logra el excelente rendimiento incluso en escenarios desafiantes, por ejemplo, finalización de estructuras periódicas.

[Página del proyecto] [ARXIV] [Suplementario] [Bibtex] [Resumen de documentos de GaN casual]

Prueba en Google Colab

Desarrollo de lama

(No dude en compartir su trabajo creando un problema)

https://github.com/geekyutao/inpaint- anythhing --- inPaint cualquier cosa: segmento cualquier cosa se encuentra con la imagen de la imagen

Refinamiento de características para mejorar la pintura de imagen de alta resolución / video / código #112 / por Geomagical Labs (geomagical.com)

Aplicaciones no oficiales de terceros:

(No dude en compartir su aplicación/implementación/demostración creando un problema)

https://github.com/enesmsahin/simple-lama-inpainting-Un paquete PIP simple para la interpago de Lama.
https://github.com/mallman/coremlama - Formato de modelo ML Core de Apple
https://cleanup.pictures: una herramienta simple de eliminación de objetos interactivos de @CyrdIgne
- Lama-Cleaner de @sanster es una versión de auto-anfitrión de https://cleanup.pictures
Integrado a los espacios de la cara de abrazos con Gradio. Ver demostración: por @AK391
Telegram Bot @magiceraserbot por @moldoteck, código
Auto-lama = DE: TR Detección de objetos + Inpainting de Lama por @Andy971022
Lama-Magic-Eraser-Local = una aplicación de entrada independiente construida con pyqt5 por @zhaoyun0071
Hama: eliminación de objetos con un pincel inteligente que simplifica el dibujo de máscara.
ModelsCope = la comunidad modelo más grande en chino por @Chenbinghui1.
Lama con Maskdino = Detección de objetos Maskdino + Inpainta de Lama con refinamiento por @Qwopqwop200.
Coremlama: un guión para convertir el puerto de Lama de Lama en el formato de modelo ML Core ML de Apple.

Configuración del medio ambiente

Clon the Repo: git clone https://github.com/advimman/lama.git

Hay tres opciones de un entorno:

Python VirtualEnv:

 virtualenv inpenv --python=/usr/bin/python3
source inpenv/bin/activate
pip install torch==1.8.0 torchvision==0.9.0

cd lama
pip install -r requirements.txt

Condición

 % Install conda for Linux, for other OS download miniconda at https://docs.conda.io/en/latest/miniconda.html
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh -b -p $HOME/miniconda
$HOME/miniconda/bin/conda init bash

cd lama
conda env create -f conda_env.yml
conda activate lama
conda install pytorch torchvision torchaudio cudatoolkit=10.2 -c pytorch -y
pip install pytorch-lightning==1.2.9

Docker: ¿No se necesitan acciones?

Inferencia

Correr

 cd lama
export TORCH_HOME=$(pwd) && export PYTHONPATH=$(pwd)

1. Descargar modelos previamente capacitados

El mejor modelo (lugares2, desafío de lugares):

 curl -LJO https://huggingface.co/smartywu/big-lama/resolve/main/big-lama.zip
unzip big-lama.zip

Todos los modelos (lugares y Celeba-HQ):

 download [https://drive.google.com/drive/folders/1B2x7eQDgecTL0oh3LSIBDGj0fTxs6Ips?usp=drive_link]
unzip lama-models.zip

2. Prepare imágenes y máscaras

Descargar imágenes de prueba:

 unzip LaMa_test_images.zip

O prepare sus datos:

1) Cree máscaras nombradas como `[Images_Name] _MASKXXX [Image_Suffix]`, coloque imágenes y máscaras en la misma carpeta.

Puede usar el script para la generación de máscaras aleatorias.

Verifique el formato de los archivos:

 image1_mask001.png
image1.png
image2_mask001.png
image2.png

Especifique image_suffix , por ejemplo .png o .jpg o _input.jpg en configs/prediction/default.yaml .

3. Predecir

En la máquina host:

 python3 bin/predict.py model.path=$(pwd)/big-lama indir=$(pwd)/LaMa_test_images outdir=$(pwd)/output

O en el Docker

El siguiente comando extraerá la imagen Docker desde Docker Hub y ejecutará el script de predicción

 bash docker/2_predict.sh $(pwd)/big-lama $(pwd)/LaMa_test_images $(pwd)/output device=cpu

Docker Cuda:

 bash docker/2_predict_with_gpu.sh $(pwd)/big-lama $(pwd)/LaMa_test_images $(pwd)/output

4. Predecir con el refinamiento

En la máquina host:

 python3 bin/predict.py refine=True model.path=$(pwd)/big-lama indir=$(pwd)/LaMa_test_images outdir=$(pwd)/output

Tren y evaluación

Asegúrate de correr:

 cd lama
export TORCH_HOME=$(pwd) && export PYTHONPATH=$(pwd)

Luego descargue modelos para pérdida perceptual :

 mkdir -p ade20k/ade20k-resnet50dilated-ppm_deepsup/
wget -P ade20k/ade20k-resnet50dilated-ppm_deepsup/ http://sceneparsing.csail.mit.edu/model/pytorch/ade20k-resnet50dilated-ppm_deepsup/encoder_epoch_20.pth

Lugares

️ NB: los valores métricos FID/SSIM/LPIPS para lugares que vemos en papel LAMA se calculan en 30000 imágenes que producimos en la sección de evaluación a continuación. Para obtener más detalles sobre la verificación de datos de evaluación [Sección 3. Datos del conjunto de datos en suplementarios] ️

En la máquina host:

 # Download data from http://places2.csail.mit.edu/download.html
# Places365-Standard: Train(105GB)/Test(19GB)/Val(2.1GB) from High-resolution images section
wget http://data.csail.mit.edu/places/places365/train_large_places365standard.tar
wget http://data.csail.mit.edu/places/places365/val_large.tar
wget http://data.csail.mit.edu/places/places365/test_large.tar

# Unpack train/test/val data and create .yaml config for it
bash fetch_data/places_standard_train_prepare.sh
bash fetch_data/places_standard_test_val_prepare.sh

# Sample images for test and viz at the end of epoch
bash fetch_data/places_standard_test_val_sample.sh
bash fetch_data/places_standard_test_val_gen_masks.sh

# Run training
python3 bin/train.py -cn lama-fourier location=places_standard

# To evaluate trained model and report metrics as in our paper
# we need to sample previously unseen 30k images and generate masks for them
bash fetch_data/places_standard_evaluation_prepare_data.sh

# Infer model on thick/thin/medium masks in 256 and 512 and run evaluation 
# like this:
python3 bin/predict.py 
model.path=$(pwd)/experiments/<user>_<date:time>_lama-fourier_/ 
indir=$(pwd)/places_standard_dataset/evaluation/random_thick_512/ 
outdir=$(pwd)/inference/random_thick_512 model.checkpoint=last.ckpt

python3 bin/evaluate_predicts.py 
$(pwd)/configs/eval2_gpu.yaml 
$(pwd)/places_standard_dataset/evaluation/random_thick_512/ 
$(pwd)/inference/random_thick_512 
$(pwd)/inference/random_thick_512_metrics.csv

Docker: TODO

Ceneba

En la máquina host:

 # Make shure you are in lama folder
cd lama
export TORCH_HOME=$(pwd) && export PYTHONPATH=$(pwd)

# Download CelebA-HQ dataset
# Download data256x256.zip from https://drive.google.com/drive/folders/11Vz0fqHS2rXDb5pprgTjpD7S2BAJhi1P

# unzip & split into train/test/visualization & create config for it
bash fetch_data/celebahq_dataset_prepare.sh

# generate masks for test and visual_test at the end of epoch
bash fetch_data/celebahq_gen_masks.sh

# Run training
python3 bin/train.py -cn lama-fourier-celeba data.batch_size=10

# Infer model on thick/thin/medium masks in 256 and run evaluation 
# like this:
python3 bin/predict.py 
model.path=$(pwd)/experiments/<user>_<date:time>_lama-fourier-celeba_/ 
indir=$(pwd)/celeba-hq-dataset/visual_test_256/random_thick_256/ 
outdir=$(pwd)/inference/celeba_random_thick_256 model.checkpoint=last.ckpt

Docker: TODO

Desafío de lugares

En la máquina host:

 # This script downloads multiple .tar files in parallel and unpacks them
# Places365-Challenge: Train(476GB) from High-resolution images (to train Big-Lama) 
bash places_challenge_train_download.sh

TODO: prepare
TODO: train 
TODO: eval

Docker: TODO

Crea tus datos

Consulte los scripts de bash para la preparación de datos y la generación de máscaras desde la sección CelebAHQ, si se quedó en uno de los siguientes pasos.

En la máquina host:

 # Make shure you are in lama folder
cd lama
export TORCH_HOME=$(pwd) && export PYTHONPATH=$(pwd)

# You need to prepare following image folders:
$ ls my_dataset
train
val_source # 2000 or more images
visual_test_source # 100 or more images
eval_source # 2000 or more images

# LaMa generates random masks for the train data on the flight,
# but needs fixed masks for test and visual_test for consistency of evaluation.

# Suppose, we want to evaluate and pick best models 
# on 512x512 val dataset  with thick/thin/medium masks 
# And your images have .jpg extention:

python3 bin/gen_mask_dataset.py 
$(pwd)/configs/data_gen/random_<size>_512.yaml  # thick, thin, medium
my_dataset/val_source/ 
my_dataset/val/random_<size>_512.yaml # thick, thin, medium
--ext jpg

# So the mask generator will: 
# 1. resize and crop val images and save them as .png
# 2. generate masks

ls my_dataset/val/random_medium_512/
image1_crop000_mask000.png
image1_crop000.png
image2_crop000_mask000.png
image2_crop000.png
...

# Generate thick, thin, medium masks for visual_test folder:

python3 bin/gen_mask_dataset.py 
$(pwd)/configs/data_gen/random_<size>_512.yaml   #thick, thin, medium
my_dataset/visual_test_source/ 
my_dataset/visual_test/random_<size>_512/  #thick, thin, medium
--ext jpg


ls my_dataset/visual_test/random_thick_512/
image1_crop000_mask000.png
image1_crop000.png
image2_crop000_mask000.png
image2_crop000.png
...

# Same process for eval_source image folder:

python3 bin/gen_mask_dataset.py 
$(pwd)/configs/data_gen/random_<size>_512.yaml   #thick, thin, medium
my_dataset/eval_source/ 
my_dataset/eval/random_<size>_512/  #thick, thin, medium
--ext jpg



# Generate location config file which locate these folders:

touch my_dataset.yaml
echo "data_root_dir: $(pwd)/my_dataset/" >> my_dataset.yaml
echo "out_root_dir: $(pwd)/experiments/" >> my_dataset.yaml
echo "tb_dir: $(pwd)/tb_logs/" >> my_dataset.yaml
mv my_dataset.yaml ${PWD}/configs/training/location/


# Check data config for consistency with my_dataset folder structure:
$ cat ${PWD}/configs/training/data/abl-04-256-mh-dist
...
train:
  indir: ${location.data_root_dir}/train
  ...
val:
  indir: ${location.data_root_dir}/val
  img_suffix: .png
visual_test:
  indir: ${location.data_root_dir}/visual_test
  img_suffix: .png


# Run training
python3 bin/train.py -cn lama-fourier location=my_dataset data.batch_size=10

# Evaluation: LaMa training procedure picks best few models according to 
# scores on my_dataset/val/ 

# To evaluate one of your best models (i.e. at epoch=32) 
# on previously unseen my_dataset/eval do the following 
# for thin, thick and medium:

# infer:
python3 bin/predict.py 
model.path=$(pwd)/experiments/<user>_<date:time>_lama-fourier_/ 
indir=$(pwd)/my_dataset/eval/random_<size>_512/ 
outdir=$(pwd)/inference/my_dataset/random_<size>_512 
model.checkpoint=epoch32.ckpt

# metrics calculation:
python3 bin/evaluate_predicts.py 
$(pwd)/configs/eval2_gpu.yaml 
$(pwd)/my_dataset/eval/random_<size>_512/ 
$(pwd)/inference/my_dataset/random_<size>_512 
$(pwd)/inference/my_dataset/random_<size>_512_metrics.csv

O en el Docker:

 TODO: train
TODO: eval

Pistas

Generar diferentes tipos de máscaras

El siguiente comando ejecutará un script que genera máscaras aleatorias.

 bash docker/1_generate_masks_from_raw_images.sh 
    configs/data_gen/random_medium_512.yaml 
    /directory_with_input_images 
    /directory_where_to_store_images_and_masks 
    --ext png

El comando de la generación de datos de prueba almacena imágenes en el formato, que es adecuado para la predicción.

La siguiente tabla describe qué configuraciones utilizamos para generar diferentes conjuntos de pruebas desde el documento. Tenga en cuenta que no solucionamos una semilla aleatoria , por lo que los resultados serán ligeramente diferentes cada vez.

	Lugares 512x512	Celeba 256x256
Angosto	random_thin_512.yaml	random_thin_256.yaml
Medio	Random_Medium_512.yaml	random_medium_256.yaml
Ancho	random_thick_512.yaml	random_thick_256.yaml

Siéntase libre de cambiar la ruta de configuración (argumento #1) a cualquier otra configuración en configs/data_gen o ajustar los archivos de configuración.

Anular los parámetros en las configuraciones

También puede anular los parámetros en la configuración como este:

 python3 bin/train.py -cn <config> data.batch_size=10 run_title=my-title

Donde se omite la extensión del archivo .yaml

Opciones de modelos

Nombres de configuración para modelos de papel (sustitución en el comando de entrenamiento):

 * big-lama
* big-lama-regular
* lama-fourier
* lama-regular
* lama_small_train_masks

Que están sentados en configuraciones/entrenamiento/carpeta

Campo de golf

Todos los datos (modelos, imágenes de prueba, etc.) https://disk.yandex.ru/d/amdeg-bijmvsug
Imágenes de prueba del documento https://disk.yandex.ru/d/xkqjzevrk5vllq
Los modelos previamente entrenados https://disk.yandex.ru/d/egqasnlohjuzag
Los modelos de pérdida perceptual https://disk.yandex.ru/d/ncvmqlmt_ktemq
Nuestros registros de capacitación están disponibles en https://disk.yandex.ru/d/9bt1wnsds4jdkq

Tiempo y recursos de capacitación

HACER

Expresiones de gratitud

Código de segmentación y modelos si se forman CSAILVision.
Lpips Metric es de Richzhang
Ssim es de po-hsun-su
Fid es de Mseitzer

Citación

Si encontró útil este código, considere citar:

 @article{suvorov2021resolution,
  title={Resolution-robust Large Mask Inpainting with Fourier Convolutions},
  author={Suvorov, Roman and Logacheva, Elizaveta and Mashikhin, Anton and Remizova, Anastasia and Ashukha, Arsenii and Silvestrov, Aleksei and Kong, Naejin and Goka, Harshith and Park, Kiwoong and Lempitsky, Victor},
  journal={arXiv preprint arXiv:2109.07161},
  year={2021}
}

Expandir