Im Bereich der Bildgenerierung führt die Mehrschichtbildgenerierungstechnologie zu einer Revolution, die die Art und Weise, wie Benutzer mit generativen Modellen interagieren, vollständig verändert. Mit dieser Technologie können Benutzer bestimmte Bildebenen isolieren, auswählen und bearbeiten und so eine beispiellose kreative Freiheit bieten. Kürzlich hat das Forschungsteam von Microsoft eine innovative Technologie namens "Anonymous Region Transformer" (ART) auf den Markt gebracht, mit dem sich die transparenten Bilder mit mehreren Schichten direkt auf der Grundlage globaler Texthinweise und anonymer regionaler Layouts basierend auf variablen mehrschichtigen Bildern erzeugen kann.

Das Design von Art ist von der "Schema -Theorie" inspiriert, mit der das generative Modell unabhängig voneinander entscheiden kann, welche visuellen Informationen mit welchen Textinformationen durch Einführung anonymer regionales Layout ausgerichtet sind. Dieser Ansatz steht im scharfen Kontrast zum traditionellen semantischen Layout. Traditionelle semantische Layouts erfordern normalerweise eine klare Korrespondenz, während das anonyme Gebietslayout von Art eine größere Flexibilität bietet, wodurch der Erzeugungsprozess intelligenter und effizienter wird.
Erwähnenswert ist erwähnenswert, dass Art einen schichtartigen Flächenbasis-Basis-Mechanismus einführt, der nur visuelle Informationen zu jedem anonymen Bereich auswählt, wodurch die Kosten für die Aufmerksamkeitsberechnung erheblich gesenkt werden. Diese Methode beschleunigt nicht nur die Erzeugungsgeschwindigkeit, wodurch sie mehr als 12 -mal schneller als die vollständige Aufmerksamkeitsmethode, sondern auch effektiv Konflikte zwischen Schichten reduziert und die Bilderzeugung auf mehr als 50 verschiedenen Ebenen bewältigen kann. Diese effiziente Verarbeitungsfähigkeit bietet eine starke Unterstützung für komplexe Aufgaben zur Bilderzeugung.
Darüber hinaus schlug ART einen hochwertigen mehrschichtigen transparenten Bildautoencoder vor, der die Transparenz variabler Mehrschichtbilder unterstützt, die direkt codiert und dekodiert sind. Dieses innovative Design bietet neue Möglichkeiten für eine präzise Kontrolle und die skalierbare Schichtgenerierung und fördert die Entwicklung der interaktiven Inhaltserstellung weiter. Durch diese Technologie können Benutzer alle Bilderstufen flexibler steuern und eine raffinere Bearbeitung und Erstellung erreichen.
Projekt: https://art-msra.github.io/
Schlüsselpunkte:
ART kann direkt mehrschichtige transparente Bilder basierend auf globalen Texteingaben und anonymen regionaler Layout generieren.
Der Schicht-für-Schicht-Gebietsanbaus Mechanismus wird eingesetzt, um die Effizienz der Bilderzeugung erheblich zu verbessern, was 12-mal schneller ist als die herkömmliche Methode.
Der neue autocoder qualitativ hochwertige AutoEncoder unterstützt die genaue Kontrolle und Erzeugung von transparenten Bildern mehrschichtiger und fördert die Erstellung der interaktiven Inhalte.