Hinweis: Wir veröffentlichen das einheitliche Repository für eine Schuss-Schriftgeneration (Clovaai/WegeShot-Font-Generation). Wenn Sie an unserer Implementierung interessiert sind, besuchen Sie bitte das Unified Repository.
Die Pytorch-Implementierung mehrerer Köpfe ist besser als eins: wenige Schuss-Schriftgenerierung mit mehreren lokalisierten Experten . | Papier
Song Park 1 , Sanghyuk Chun 2, 3 , Junbum Cha 3 , Bado Lee 3 , Hyunjung Shim 1
1 School of Integrated Technology, Yonsei University
2 Naver AI Labor
3 Naver Clova
Eine FFG-Methode (SHOT-Schriftart (FOND-Erzeugung) muss zwei Ziele erfüllen: Die erzeugten Bilder sollten die zugrunde liegende globale Struktur des Zielcharakters bewahren und den vielfältigen lokalen Referenzstil darstellen. Bestehende FFG-Methoden zielen darauf ab, den Inhalt und den Stil entweder durch Extrahieren eines universellen Repräsentationsstils oder der Extraktion mehrerer Komponenten-Stil-Repräsentationen zu entwirren. Frühere Methoden erfassen jedoch nicht verschiedene lokale Stile oder können nicht auf einen Charakter mit unsichtbaren Komponenten, z. B. unsichtbare Sprachsysteme verallgemeinert werden. Um die Probleme zu mildern, schlagen wir eine neuartige FFG-Methode vor, die mit dem Namen mehrerer lokalisierter Experten nur wenige Schuss-Schriftgenerierungsnetzwerke (MX-FONT) bezeichnet. MX-font extrahiert mehrere Stilfunktionen, die nicht explizit auf Komponentenbezeichnungen konditioniert sind, sondern automatisch von mehreren Experten, um unterschiedliche lokale Konzepte darzustellen, z. B. die linke Sub-Glyphe. Aufgrund der mehreren Experten kann MX-FONT verschiedene lokale Konzepte erfassen und die Generalisierbarkeit auf unsichtbare Sprachen zeigen. Während des Trainings verwenden wir Komponentenbezeichnungen als schwache Aufsicht, um jeden Experten für verschiedene lokale Konzepte spezialisiert zu haben. Wir formulieren jedem Experten das Problem der Komponente zuzuordnen als das Problem der Grafikanpassung und lösen sie durch den ungarischen Algorithmus. Wir verwenden auch den Unabhängigkeitsverlust und den konthalsgeschwindigen Verlust im Stil des inhaltlichen Stils, um die Inhaltsstil-Entwirrung aufzuerlegen. In unseren Experimenten übertrifft MX-FONT frühere FFG-Methoden auf dem neuesten Stand der Technik in der chinesischen Generation und der bringlichen, z. B. chinesischen bis koreanischen Generation.
Weitere verwandte Projekte finden Sie unter den folgenden Links auf der Few-Shot-Schriftart:
Python> 3.6
Die Verwendung von Conda wird empfohlen: https://docs.anaconda.com/anaconda/install/linux/
Pytorch> = 1,5
Zu installieren: https://pytorch.org/get-started/locally/
SCONF, Numpy, Scipy, Scikit-Image, TQDM, Jsonlib, Fonttools
conda install numpy scipy scikit-image tqdm jsonlib-python3 fonttools
Beachten Sie, dass wir nur die Beispiel -Schriftdateien angeben. Nicht die für das Training verwendeten Schriftdateien für das bereitgestellte Gewicht (Generator.PTH) . Die Beispiel -Schriftdateien werden von hier heruntergeladen.
get_chars_from_ttf.py generieren # Generating the available characters file
python get_chars_from_ttf.py --root_dir path/to/ttf/dir
- use_ddp: whether to use DataDistributedParallel, for multi-GPUs.
- port: the port for the DataDistributedParallel training.
- work_dir: the directory to save checkpoints, validation images, and the log.
- decomposition: path to the "decomposition rule" file.
- primals: path to the "primals" file.
- dset: (leave blank)
- train: (leave blank)
- data_dir : path to .ttf files for the training
- val: (leave blank)
- data_dir : path to .ttf files for the validation
- source_font : path to .ttf file used as the source font during the validation
python train.py cfgs/train.yaml
* data_dir
|-- font1
|-- char1.png
|-- char2.png
|-- char3.png
|-- font2
|-- char1.png
|-- char2.png
.
.
.
- dset: (leave blank)
- test: (leave blank)
- data_dir: path to reference images
- source_font: path to .ttf file used as the source font during the generation
- gen_chars_file: path to file of the characters to generate. Leave blank if you want to generate all the available characters in the source font.
python eval.py
cfgs/eval.yaml
--weight generator.pth
--result_dir path/to/save/images
Dieses Projekt wird unter MIT -Lizenz verteilt, mit Ausnahme von modules.py, die von https://github.com/nvlabs/funit übernommen wird.
MX-Font
Copyright (c) 2021-present NAVER Corp.
Permission is hereby granted, free of charge, to any person obtaining a copy
of this software and associated documentation files (the "Software"), to deal
in the Software without restriction, including without limitation the rights
to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
copies of the Software, and to permit persons to whom the Software is
furnished to do so, subject to the following conditions:
The above copyright notice and this permission notice shall be included in
all copies or substantial portions of the Software.
THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN
THE SOFTWARE.
Dieses Projekt basiert auf Clovaai/DMFont und Clovaai/Lffont.
@inproceedings{park2021mxfont,
title={Multiple Heads are Better than One: Few-shot Font Generation with Multiple Localized Experts},
author={Park, Song and Chun, Sanghyuk and Cha, Junbum and Lee, Bado and Shim, Hyunjung},
year={2021},
booktitle={International Conference on Computer Vision (ICCV)},
}