La implementación oficial de Pytorch de las líneas de base simples para la restauración de imágenes (ECCV2022)
Aunque recientemente ha habido avances significativos en el campo de la restauración de imágenes, la complejidad del sistema de los métodos de última generación (SOTA) también está aumentando, lo que puede obstaculizar el análisis conveniente y la comparación de los métodos. En este artículo, proponemos una línea de base simple que exceda los métodos SOTA y es computacionalmente eficiente. Para simplificar aún más la línea de base, revelamos que las funciones de activación no lineal, por ejemplo, sigmoides, Relu, Gelu, Softmax, etc. no son necesarias : podrían reemplazarse por multiplicación o eliminar. Por lo tanto, derivamos una red libre de activación no lineal, a saber, NAFNET, de la línea de base. Los resultados de SOTA se logran en varios puntos de referencia desafiantes, por ejemplo, 33.69 dB PSNR en GOPRO (para deshacerse de imágenes), excediendo el SOTA anterior de 0.38 dB con solo el 8.4% de sus costos computacionales; 40.30 dB PSNR en SIDD (para la renovación de imágenes), excediendo el SOTA anterior de 0.28 dB con menos de la mitad de sus costos computacionales.
![]() | ![]() | ![]() |
|---|---|---|
| Desanimado | Desorden | Stereosr (NAFSSR) |

2022.08.02 La línea de base, incluidos los modelos previos a la aparición y las configuraciones de trenes/pruebas, están disponibles ahora.
2022.07.03 Trabajo relacionado, Mejora de la restauración de imágenes revisando la agregación de información global (TLC, también conocido como TLSC en nuestro documento) es aceptado por ECCV2022 ? . El código está disponible en https://github.com/megvii-research/tlc.
2022.07.03 Nuestro documento es aceptado por ECCV2022 ?
2022.06.19 NAFSSR (como ganador del desafío) se selecciona para una presentación oral en CVPR 2022, Taller NTIRE? El video de presentación, las diapositivas y el póster están disponibles ahora.
2022.04.15 Solución de super-resolución de imagen estéreo basada en NAFNET (NAFSSR) ganó el primer lugar en el desafío de super-resolución de imagen estéreo NTIRE 2022! Instrucciones de capacitación/evaluación Ver aquí.
Esta implementación basada en BasicsR, que es una caja de herramientas de código abierto para tareas de restauración de imágenes/videos y Hinet
python 3.9 .5
pytorch 1.11 .0
cuda 11.3 git clone https://github.com/megvii-research/NAFNet
cd NAFNet
pip install -r requirements.txt
python setup.py develop --no_cuda_ext
python basicsr/demo.py -opt options/test/SIDD/NAFNet-width64.yml --input_path ./demo/noisy.png --output_path ./demo/denoise_img.png
python basicsr/demo.py -opt options/test/REDS/NAFNet-width64.yml --input_path ./demo/blurry.jpg --output_path ./demo/deblur_img.png
--input_path : la ruta de la imagen degradada--output_path : la ruta para guardar la imagen predicha python basicsr/demo_ssr.py -opt options/test/NAFSSR/NAFSSR-L_4x.yml
--input_l_path ./demo/lr_img_l.png --input_r_path ./demo/lr_img_r.png
--output_l_path ./demo/sr_img_l.png --output_r_path ./demo/sr_img_r.png
--input_l_path : la ruta de la imagen de la izquierda degradada--input_r_path : la ruta de la imagen derecha degradada--output_l_path : la ruta para guardar la imagen izquierda predicha--output_r_path : la ruta para guardar la imagen derecha prevista| nombre | Conjunto de datos | PSNR | Ssim | modelos previos a la aparición | configuraciones |
|---|---|---|---|---|---|
| Nafnet-gopro-width32 | Gopro | 32.8705 | 0.9606 | GDRIVE | 百度网盘 | tren | prueba |
| Nafnet-gopro-width64 | Gopro | 33.7103 | 0.9668 | GDRIVE | 百度网盘 | tren | prueba |
| Nafnet-sidd-width32 | Sidd | 39.9672 | 0.9599 | GDRIVE | 百度网盘 | tren | prueba |
| Nafnet-sidd-width64 | Sidd | 40.3045 | 0.9614 | GDRIVE | 百度网盘 | tren | prueba |
| NAFNET-REDS-WIDTH64 | Rojos | 29.0903 | 0.8671 | GDRIVE | 百度网盘 | tren | prueba |
| NAFSSR-L_4X | Flickr1024 | 24.17 | 0.7589 | GDRIVE | 百度网盘 | tren | prueba |
| Nafssr-l_2x | Flickr1024 | 29.68 | 0.9221 | GDRIVE | 百度网盘 | tren | prueba |
| Base-Gopro-Width32 | Gopro | 32.4799 | 0.9575 | GDRIVE | 百度网盘 | tren | prueba |
| Base-Gopro-Width64 | Gopro | 33.3960 | 0.9649 | GDRIVE | 百度网盘 | tren | prueba |
| Basal-sidd-width32 | Sidd | 39.8857 | 0.9596 | GDRIVE | 百度网盘 | tren | prueba |
| Basal-sidd-width64 | Sidd | 40.2970 | 0.9617 | GDRIVE | 百度网盘 | tren | prueba |
| Tarea | Conjunto de datos | Instrucciones de tren/prueba | Resultados de visualización |
|---|---|---|---|
| Desarrollado de imágenes | Gopro | enlace | GDRIVE | 百度网盘 |
| Deno de imagen de imagen | Sidd | enlace | GDRIVE | 百度网盘 |
| Imagen Deslizándose con artefactos JPEG | Rojos | enlace | GDRIVE | 百度网盘 |
| Imagen estéreo Super-resolución | Flickr1024+Middlebury | enlace | GDRIVE | 百度网盘 |
Si NAFNET ayuda a su investigación o trabajo, considere citar NAFNET.
@article{chen2022simple,
title={Simple Baselines for Image Restoration},
author={Chen, Liangyu and Chu, Xiaojie and Zhang, Xiangyu and Sun, Jian},
journal={arXiv preprint arXiv:2204.04676},
year={2022}
}
Si NAFSSR ayuda a su investigación o trabajo, considere citar NAFSSR.
@InProceedings{chu2022nafssr,
author = {Chu, Xiaojie and Chen, Liangyu and Yu, Wenqing},
title = {NAFSSR: Stereo Image Super-Resolution Using NAFNet},
booktitle = {Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) Workshops},
month = {June},
year = {2022},
pages = {1239-1248}
}
Si tiene alguna pregunta, comuníquese con [email protected] o [email protected]