AVISO: Lanzamos el repositorio de generación de fuentes de pocos disparos unificados (Generación de Clovaai/Pe Setshot-Font). Si está interesado en usar nuestra implementación, visite el repositorio unificado.
Implementación oficial de Pytorch de LF-Font | papel | Papel (extensión de Pami)
Song Park 1* , Sanghyuk Chun 2* , Junbum Cha 2 , Bado Lee 2 , Hyunjung Shim 1
* Contribución igual
1 Escuela de Tecnología Integrada, Universidad de Yonsei
2 Clova AI Research, Naver Corp.
La generación automática de fuentes de pocos disparos tiene una gran demanda porque los diseños manuales son caros y sensibles a la experiencia de los diseñadores. Los métodos existentes de generación de fuentes de pocos disparos tienen como objetivo aprender a desenredar el estilo y el elemento de contenido de algunos glifos de referencia y centrarse principalmente en una representación de estilo universal para cada estilo de fuente. Sin embargo, dicho enfoque limita el modelo para representar diversos estilos locales y, por lo tanto, lo hace inadecuado para el sistema de letras más complicado, por ejemplo, chino, cuyos caracteres consisten en un número variable de componentes (a menudo llamados "radicales") con una estructura altamente compleja. En este artículo, proponemos un nuevo método de generación de fuentes al aprender estilos localizados, a saber, representaciones de estilo componentes, en lugar de estilos universales. Las representaciones de estilo propuestas nos permiten sintetizar detalles locales complejos en diseños de texto. Sin embargo, los estilos de componentes de aprendizaje únicamente de los glifos de referencia es inviable en el escenario de generación de fuentes de pocos disparos, cuando un script objetivo tiene una gran cantidad de componentes, por ejemplo, más de 200 para los chinos. Para reducir el número de glifos de referencia, simplificamos los estilos de componentes mediante un producto del factor de componentes y el factor de estilo, inspirados en la factorización de la matriz de bajo rango. Gracias a la combinación de una fuerte representación y una estrategia de factorización compacta, nuestro método muestra resultados de generación de fuentes de pocos disparos notablemente mejores (con solo 8 imágenes de glifo de referencia) que otras artes de estado, sin utilizar una supervisión de localidad fuerte, por ejemplo, ubicación de cada componente, esqueleto o golpes.
Puede encontrar más proyectos relacionados en la generación de fuentes de pocos disparos en los siguientes enlaces:
Implementación de Pytorch de generación de fuentes de pocos disparos con representaciones de estilo localizadas y factorización .
Python> 3.6
Se recomienda usar conda: https://docs.anaconda.com/anaconda/install/linux/
pytorch> = 1.1 (recomendado: 1.1)
Para instalar: https://pytorch.org/get-started/locally/
chorro
Para instalar: https://github.com/khanrc/sconf
Numpy, TQDM, LMDB, YAML, JSONLIB, MSGPACK
conda install numpy tqdm lmdb ruamel.yaml jsonlib-python3 msgpack
Se puede acceder al archivo de fuente que utilizamos como fuente de contenido aquí.
python build_dataset.py
--lmdb_path path/to/dump/lmdb
--meta_path path/to/meta/file
--json_path path/to/save/dict
Meta de tren ( dict, formato JSON )
meta/train.json .prueba meta ( dict, formato JSON )
meta/test.json . Recomendamos modificar cfgs/custom.yaml en lugar de cfgs/default.yaml , cfgs/combined.yaml , o cfgs/factorize.yaml .
llaves
# Phase 1 training
python train.py
NAME_phase1
cfgs/custom.yaml cfgs/combined.yaml
# Phase 2 training
python train.py
NAME_phase2
cfgs/custom.yaml cfgs/factorize.yaml
--resume ./result/checkpoints/NAME_phase1/800000-NAME_phase1.pth
python evaluator.py
cfgs/factorize.yaml
--weight weight/generator.pth
--img_dir path/to/save/images
--test_meta meta/test.json
--data_path path/to/data
Este proyecto se distribuye bajo la licencia MIT, excepto Modules.py que se adopta de https://github.com/nvlabs/funit.
LF-Font
Copyright (c) 2020-present NAVER Corp.
Permission is hereby granted, free of charge, to any person obtaining a copy
of this software and associated documentation files (the "Software"), to deal
in the Software without restriction, including without limitation the rights
to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
copies of the Software, and to permit persons to whom the Software is
furnished to do so, subject to the following conditions:
The above copyright notice and this permission notice shall be included in
all copies or substantial portions of the Software.
THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN
THE SOFTWARE.
Este proyecto se basa en Clovaai/DMFONT.
@inproceedings{park2021lffont,
title={Few-shot Font Generation with Localized Style Representations and Factorization},
author={Park, Song and Chun, Sanghyuk and Cha, Junbum and Lee, Bado and Shim, Hyunjung},
year={2021},
booktitle={AAAI Conference on Artificial Intelligence},
}
@article{park2022lffont_extension,
author={Park, Song and Chun, Sanghyuk and Cha, Junbum and Lee, Bado and Shim, Hyunjung},
journal = {IEEE Transactions on Pattern Analysis & Machine Intelligence},
title = {Few-shot Font Generation with Weakly Supervised Localized Representations},
year = {5555},
volume = {},
number = {01},
issn = {1939-3539},
pages = {1-17},
keywords = {},
doi = {10.1109/TPAMI.2022.3196675},
publisher = {IEEE Computer Society},
address = {Los Alamitos, CA, USA},
month = {aug}
}