axodox machinelearning Download - axodox machinelearning Quellcode Download

axodox machinelearning

C/C++

1.0.0

Herunterladen

Einführung

Dieses Repository enthält eine vollständige C ++ -Implementierung der stabilen diffusionsbasierten Bildsynthese, einschließlich der ursprünglichen Funktionen von TXT2IMG, IMG2IMG und Inpainting und der Sicherheitsprüfung. Diese Lösung hängt nicht von Python ab und führt den gesamten Bildgenerierungsprozess in einem einzigen Prozess mit Wettbewerbsleistung aus , wodurch die Bereitstellungen wesentlich einfacher und kleiner sind und im Wesentlichen einige ausführbare Dateien und Bibliotheksdateien sowie die Modellgewichte bestehen. Mit der Bibliothek ist es möglich, eine stabile Diffusion in fast jede Anwendung zu integrieren - solange sie C ++ - oder C -Funktionen importieren kann, ist jedoch für die Entwickler von Echtzeit -Grafikanwendungen und -spielen am nützlichsten , die häufig mit C ++ realisiert werden.

Ein Samurai zeichnet sein Schwert, um sein Land zu verteidigen

Ein Segelschiff, das das Hoch Meer, 18. Jahrhundert überquert, impressionistische Malerei, Nahaufnahme

Nahaufnahme Porträtfoto der Frau in Wastelander Kleidung, langer Haarschnitt, blasse Haut, schlanker Körper, Hintergrund sind Stadtruinen, (hohe detaillierte Haut: 1.2)

ControlNET -Unterstützung

Die Bibliothek unterstützt auch ControlNET. Dadurch werden Eingabebilder verwendet, um den Bildgenerierungsprozess zu leiten, beispielsweise:

Offenbares ControlNet In diesem ersten Beispiel verwenden wir einen geöffneten Schätzer und einen geöffneten konditionierten ControlNET.

HED -basierte Steuerung Mithilfe der HED -Kantenerkennung und des kantenbedingten Steuerungsnetzes ändern wir den Stil des Bildes, um einer Comic -Illustration zu ähneln, halten das Layout jedoch intakt.

Tiefenbasierte Steuerung Mit einem Tiefenschätzer und einer Tiefenkarte konditionierte Steuerung generieren wir ein anderes Zeichen, behalten jedoch das ursprüngliche Setup.

Feature -Extraktoren

Die Bibliothek bietet auch GPU -beschleunigte Implementierungen der folgenden Merkmalextraktoren (oben angezeigt):

Pose -Schätzung: Extrahiert das Skelett eines Menschen aus einem Bild mit Oneposition
Tiefenschätzung: Schätzt die Tiefe jedes Pixels aus einem einzelnen Bild mit Midas
Kantenerkennung: Extrahiert Kanten aus einem Bild unter Verwendung einer ganzheitlichten Kantenerkennung

Codebeispiele

Hier sind einige einfache Code -Beispiele:

Stabilitätsunterschied
ControlNet
Feature -Extraktion

Referenzmodelle

Die für die Bibliothek erforderlichen KI -Modelle werden im ONNX -Format gespeichert. Alle Modelle wurden durch Microsoft Olive durchgeführt und sind für DirectML optimiert. Ich habe die Bibliothek mit den folgenden Modellen getestet:

Stabile Diffusion 1.5 mit ControlNET -Unterstützung
Realistische Vision 1.4 mit ControlNet -Unterstützung
Steuerung mit Feature -Extraktoren

Sie können Ihre eigenen Modelle mitbringen, indem Sie diese mit diesem Handbuch konvertieren.

Bitte überprüfen Sie die ursprüngliche Lizenz der Modelle, wenn Sie sie in Ihre Produkte integrieren möchten.

Technischer Hintergrund

Die Implementierung verwendet das ONNX, um die an der Bildgenerierung beteiligten mathematischen Modelle zu speichern. Diese ONNX -Modelle werden dann mit der ONNX -Laufzeit ausgeführt, die eine Vielzahl von Plattformen (Windows, Linux, MacOS, Android, iOS, WebAssembly usw.) und Ausführungsanbieter (wie Nvidia cuda / tensorrt; AMD ROCM, Apple Coreml, Qualcomm Qnn, Microsoft Directml und vieles) unterstützen.

Wir bieten eine Beispielintegration namens Unbaint, die zeigt, wie die Bibliotheken in eine einfache Winui -basierte Benutzeroberfläche integriert werden können. Sie können die kostenlose App aus dem Microsoft Store herunterladen, um die Leistungsmerkmale der Lösung zu bewerten.

Die aktuelle Codebasis und die resultierenden Nuget -Pakete zielen auf Windows ab und verwenden DirectML. Nur kleine Abschnitte des Codes verwenden Windows -spezifische APIs und können daher mit minimalem Aufwand auf andere Plattformen portiert werden.

Lizenzierung

Der Quellcode dieser Bibliothek wird unter der MIT -Lizenz bereitgestellt.

Integration der Komponente

Vorgebaute Versionen des Projekts können unter dem Namen Axodox.MachineLearning aus Nuget abgerufen und zu Visual Studio C ++ - Projekten (sowohl Desktop- als auch UWP -Projekte) mit der X64 -Plattform hinzugefügt werden.

Grundintegration:

Fügen Sie Ihr Projekt die Axodox.Common und Axodox.MachineLearning -Pakete hinzu
Stellen Sie sicher, dass Sie nur eine X64 -Plattform in Ihrem Projekt haben
Stellen Sie sicher, dass Ihr Compiler auf C ++ 20 eingestellt ist. Wir empfehlen auch, alle Warnungen und Konformitätsmodus zu aktivieren
Fügen Sie Ihre Codedatei oder #include "Include/Axodox.MachineLearning.h" vorkompilierten Header die folgende Anweisung hinzu.
Folgen Sie diesem Beispielcode, um die Pipeline zu integrieren: https://github.com/axodox/unpaint/blob/main/unpaint/stablediffusionmodelexecutor.cpp

Wir empfehlen, Ihrer App geeignete Sicherheitsmechanismen hinzuzufügen, um unangemessene Ausgänge von stellvertretendem Stellvertreter zu unterdrücken. Der Leistungsaufwand ist unbedeutend.

Die von uns verwendeten stabilen Diffusionsmodelle wurden mit Microsoft Olive generiert. Befolgen Sie das verlinkte Beispiel, um Modelle aus dem Huggingface zu konvertieren. Durch Ändern des Skripts können Sie auch Modelle konvertieren, die auf Ihrer Festplatte aus verschiedenen Formaten gespeichert sind (z *.safetensors ). Hier finden Sie einige vorgefasste Modelle zum Testen.

Aufbau des Projekts

Das Erstellen der Bibliothek ist erforderlich, um Änderungen vorzunehmen und zu testen. Sie müssen Folgendes installieren lassen, um die Bibliothek zu erstellen:

Visual Studio 2022
- Wählen Sie die folgenden Workloads aus:
  - Desktop -Entwicklung mit C ++
  - Spielentwicklung mit C ++
- Um unpassende Erstellung zu erstellen, wählen Sie auch diese einzelnen Pakete aus:
  - Universelle Windows -Plattformentwicklung
  - C ++ (V143) Universal Windows Platform -Tools

Sie können entweder build_nuget.ps1 oder open Axodox.MachineLearning.sln und Build aus Visual Studio ausführen.

Sobald Sie die Bibliothek erstellt haben, überschreiben Sie Ihr vorhandenes Nuget-Paket Installation, indem Sie die AxodoxMachineLearning-Location Umgebungsvariable festlegen, um auf Ihren lokalen Build hinzuweisen.

Zum Beispiel C:devaxodox-machinelearningAxodox.MachineLearning.Universal für eine UWP-App und C:devaxodox-machinelearningAxodox.MachineLearning.Desktop für eine Desktop-App.

Fügen Sie dann das Projekt hinzu, das vom Pfad zur Lösung Ihres eigenen Projekts hingewiesen wurde. Dies ermöglicht es, alle Projekte in dieselbe Lösung hinzuzufügen und Änderungen in der Bibliothek und Ihrer App nahtlos vorzunehmen, ohne die Dateien wiederholt zu kopieren.

Expandieren

Zusätzliche Informationen