Leichte Netzwerke, die räumliche Informationen zur stabilen Diffusion unter Verwendung einer chinesischen Feinabstimmung steuern
Auf Englisch
Controllora ist ein Engineering, das die LORA -Technologie verwendet, um die stabile Diffusion einfach zu debuggen, um seine räumlichen Informationen zu kontrollieren. Im Allgemeinen wird ein einfaches und kleines Netzwerk verwendet (~ 7m Parameter, ~ 25m Speicher). Weitere Informationen finden Sie bei Controllora.
Dieses Projekt kann als Gabel von Controllora angesehen werden. Und zwei chinesische Felder werden basierend auf der Controllora -Methode angegeben.
Sie können den Online -Space -Face -Bereich verwenden, um Ihre Bilder und den chinesischen Eingabeaufforderungstext hochzuladen, um die Ausgabergebnisse anzuzeigen. Da es auf der CPU bereitgestellt und verwendet wird, empfehle ich Ihnen, diese Projekte lokal herunterzuladen und mit Ihrer GPU auszuführen. (Aufgrund der Einstellung von "IS_AVAILABLE" wechselt es dynamisch auf der Grundlage einer GPU.)
| Name | Umarmungsface -Modelllink | Umarmungspace -Space -Link |
|---|---|---|
| ControlNet von Canny Chinese? | https://huggingface.co/svjack/canny-control-lora-zh | https://huggingface.co/spaces/svjack/controlnet-canny-chinese |
| ControlNet von Pose Chinese? | https://huggingface.co/svjack/pose-control-lora-zh | https://huggingface.co/spaces/svjack/controlnet-pose-chinese |
pip install -r requirements.txtNach der Installation können Sie CD in ControlNet-Canny-Chinese und ControlNet-Pose-Chinese können, um separat auszuführen
python app.pyÖffnen Sie Ihren Browser und gehen Sie zu http: // localhost: 7860, um im Browser zu experimentieren.
| Name | Prompt | Originalbild | Rückgratbild | Transformiertes Bild |
|---|---|---|---|---|
| ControlNet von Canny Chinese? | Ein spielerischer Clown | ![]() | ![]() | ![]() |
| ControlNet von Canny Chinese? | Nacht voller Meteore | ![]() | ![]() | ![]() |
| ControlNet von Canny Chinese? | Katzenvampir | ![]() | ![]() | ![]() |
| ControlNet von Pose Chinese? | Weizenfeldbeobachter | ![]() | ![]() | ![]() |
| ControlNet von Pose Chinese? | Militäroffizier in Militäruniform | ![]() | ![]() | ![]() |
LORA: Niedrige Anpassung von Großsprachenmodellen LORA reduziert die Anzahl der Trainingsparameter, indem das Rang-Zersetzungsmatrixpaar gelernt und das ursprüngliche Gewicht eingefroren wird. Dies reduziert die Speicherbeschränkungen der nachgeschalteten Aufgaben erheblich, und das Wechsel des Big-Modells für die Feinabstimmung und Aufgabe, wodurch das Inferenzpotential bei der Bereitstellung geöffnet wird. LORA übertrifft auch viele andere Anpassungsmodelle (wie Adapter, Präfixabstimmung und Feinabstimmung)
Im stabilen Diffusionsfeld stelle ich auch 3 stabile Diffusionsmodelle an, die mit LORA fein abgestimmt sind. Der CC3M-Datensatz wird heruntergeladen und von SVJACK/IMG2DATASET-PQ2HF-Transform-Toolkit konvertiert.
| Name | Umarmungsface -Modelllink | Sprache | Fein des Datensatzes fein |
|---|---|---|---|
| svjack/pokemon-sd-lora-zh | https://huggingface.co/svjack/pokemon-sd-lora-zh | chinesisch | svjack/pokemon-blip-captions-en-zh |
| SVJACK/CONCECT-CAPTION-3M-SD-LORA-EN | https://huggingface.co/svjack/concept-caption-3m-sd-lora-en | Englisch | Konzeptionelle Untertitel (CC3M) |
| svjack/concept-caption-3m-sd-lora-zh | https://huggingface.co/svjack/concept-caption-3m-sd-lora-zh | chinesisch | Konzeptionelle Untertitel (CC3M) |
Sie können herausfinden, wie diese Modelle über die Modellkarte verwendet werden.
svjack - [email protected] - [email protected]
Projektlink: https: //github.com/svjack/controllora-chinese