Restormer DOWNLOAD - Restormer -Quellcode herunterladen

Restormer

Python

Pretrained Models

Herunterladen

Restormer: Effizienter Transformator für die hochauflösende Bildwiederherstellung (CVPR 2022-Oral)

Syed Waqas Zamir, Aditya Arora, Salman Khan, Munawar Hayat, Fahad Shahbaz Khan und Ming-Hsuan Yang

Nachricht

4. April 2022: In integrierte Räume in Huggingface? mit Gradio. Probieren Sie die Web -Demo aus:
30. März 2022: Colab Demo hinzugefügt.
29. März 2022: Rastormer wird für eine mündliche Präsentation bei CVPR 2022 ausgewählt?
10. März 2022: Trainingscodes werden veröffentlicht
3. März 2022: Papier bei CVPR 2022 angenommen?
21. November 2021: Testcodes und vorgebrachte Modelle werden veröffentlicht!

Abstract: Da Faltungsnetzwerke (CNNs) gut verallgemeinerbare Bildpriorente aus großflächigen Daten lernten, wurden diese Modelle ausführlich auf die Bildwiederherstellung und die damit verbundenen Aufgaben angewendet. In jüngster Zeit hat eine weitere Klasse von neuronalen Architekturen, Transformatoren, erhebliche Leistungssteigerungen für natürliche Sprache und Sichtaufgaben auf hoher Ebene gezeigt. Während das Transformatormodell die Mängel von CNNs (dh, begrenztes Empfängnisfeld und Uneingefügungsfähigkeit gegen Eingabeinhalte) mindert, wächst seine rechnerische Komplexität quadratisch mit der räumlichen Auflösung, wodurch es unmöglich ist, auf die meisten Bildwiederherstellungsaufgaben zu gelten, die hochauflösende Bilder beinhalten. In dieser Arbeit schlagen wir ein effizientes Transformatormodell vor, indem wir mehrere wichtige Entwürfe in den Bausteinen (Multi-Head-Aufmerksamkeit und Feed-Forward-Netzwerk) erstellen, sodass es Langstrecken-Pixel-Interaktionen erfassen kann und gleichzeitig auf große Bilder anwendbar bleibt. Unser Modell mit dem Namen Restoration Transformator (Restormer) erzielt auf mehreren Bildrestaurationsaufgaben, darunter bildübergreifende, einzelne Immobilienbewegungsablöhne, Defokus-Abläufe (Einzel-Images- und Dual-Pixel-Daten) und Bild-Beenging (Gauß-Gryscale/Farb-Deno-Denosing sowie Real-Pixel-Denosing).

Netzwerkarchitektur

Installation

In der Installation.MD finden Sie die Installation von Abhängigkeiten, die zum Ausführen von Wiedergängern erforderlich sind.

Demo

Um die vorgeborenen Wiedergutmachermodelle für die Entspannung, Bewegungsentwagring, Defokus-Deblurring und die demosing auf Ihren eigenen Bildern zu testen, können Sie entweder Google Colab oder die Befehlszeile wie folgt verwenden

 python demo.py --task Task_Name --input_dir path_to_images --result_dir save_images_here

Beispiel Verwendung zur Durchführung von Defokus -Deblurring in einem Bildernverzeichnis:

 python demo.py --task Single_Image_Defocus_Deblurring --input_dir './demo/degraded/' --result_dir './demo/restored/'

Beispiel Verwendung zur direkten Ausführung von Defokus -Deblurmen auf einem Bild direkt:

 python demo.py --task Single_Image_Defocus_Deblurring --input_dir './demo/degraded/portrait.jpg' --result_dir './demo/restored/'

Schulung und Bewertung

Trainings- und Prüfanweisungen zum Entfernen, Bewegungsentlebenden, Defokus -Deblurring und Denoising sind in ihren jeweiligen Verzeichnissen enthalten. Hier ist eine Zusammenfassungstabelle mit Hyperlinks für die einfache Navigation:

Aufgabe	Trainingsanweisungen	Testanweisungen	Die visuellen Ergebnisse von Restormer
Verderb	Link	Link	Herunterladen
Bewegung deblamellieren	Link	Link	Herunterladen
Defocus Deblurring	Link	Link	Herunterladen
Gaußsche Denoising	Link	Link	Herunterladen
Echte Denoising	Link	Link	Herunterladen

Ergebnisse

Die Experimente werden für verschiedene Bildverarbeitungsaufgaben durchgeführt, einschließlich Bildderbindungen, Einzel-Image-Bewegung, Defokus-Deblurren (sowohl auf einzelnen Bild- als auch Dual-Pixel-Daten) und Bild-Denoising (sowohl auf Gaußschen als auch auf realen Daten).

Bildspeicherung (klicken, um zu erweitern)

Ein-Image-Bewegung Deblurring (Klicken Sie hier, um zu erweitern)

Defocus Deblurring (klicken, um zu erweitern)

S: Ein-Image-Defokus-Deblurring. D: Dual-Pixel-Defokus-Deblurren.

Gaußsche Bild -Denoising (klicken, um zu erweitern)

Top Super-Reis: Erlernen eines einzelnen Modells, um verschiedene Geräuschpegel zu bewältigen. Bottom Super-Reis: Training eines separaten Modells für jeden Geräuschpegel.


Graustufen	Farbe

Real Image Denoising (Klicken, um zu erweitern)

Zitat

Wenn Sie Restormer verwenden, erwägen Sie bitte:

 @inproceedings{Zamir2021Restormer,
    title={Restormer: Efficient Transformer for High-Resolution Image Restoration}, 
    author={Syed Waqas Zamir and Aditya Arora and Salman Khan and Munawar Hayat 
            and Fahad Shahbaz Khan and Ming-Hsuan Yang},
    booktitle={CVPR},
    year={2022}
}

Kontakt

Wenn Sie Fragen haben, wenden Sie sich bitte an [email protected]

Bestätigung: Dieser Code basiert auf der Basicsr Toolbox und Hinet.

Unsere verwandten Werke

Lernen angereicherte Merkmale für die schnelle Bildwiederherstellung und -verbesserung, TPAMI 2022. Papier | Code
Multi-Stufe Progressive Bildrestauration, CVPR 2021. Papier | Code
Lernen angereicherte Merkmale für die echte Bildrestaurierung und -verbesserung, ECCV 2020. Papier | Code
CycleiSP: Real Bildrestauration über verbesserte Datensynthese, CVPR 2020. Papier | Code

Expandieren

Zusätzliche Informationen