AVISO: Libertamos o repositório de geração de poucas fotos unificadas (Clovaai/Fewshot-Fonte-Geração). Se você estiver interessado em usar nossa implementação, visite o repositório unificado.
Implementação oficial de Pytorch de LF-Font | papel | papel (extensão Pami)
Song Park 1* , Sanghyuk Chun 2* , Junbum Cha 2 , Bado Lee 2 , Hyunjung Shim 1
* Igual contribuição
1 Escola de Tecnologia Integrada, Universidade Yonsei
2 Clova AI Research, Naver Corp.
A geração automática de poucas fontes está em alta demanda, porque os projetos manuais são caros e sensíveis à experiência dos designers. Os métodos existentes de geração de fontes de poucos tiros pretendem aprender a separar o elemento de estilo e conteúdo de alguns glifos de referência e se concentrar principalmente em uma representação de estilo universal para cada estilo de fonte. No entanto, essa abordagem limita o modelo a representar diversos estilos locais e, assim, o torna inadequado para o sistema de cartas mais complicado, por exemplo, chinês, cujos caracteres consistem em um número variável de componentes (geralmente chamados de "radical") com uma estrutura altamente complexa. Neste artigo, propomos um novo método de geração de fontes aprendendo estilos localizados, ou seja, representações de estilo componentes, em vez de estilos universais. As representações de estilo propostas nos permitem sintetizar detalhes locais complexos em projetos de texto. No entanto, os estilos de aprendizado em termos de componentes apenas dos glifos de referência são inviáveis no cenário de geração de fontes de poucos tiro, quando um script alvo tem um grande número de componentes, por exemplo, mais de 200 para chinês. Para reduzir o número de glifos de referência, simplificamos os estilos de componentes por um produto do fator de componente e do fator de estilo, inspirado na fatorização da matriz de baixo rank. Graças à combinação de forte representação e uma estratégia de fatorização compacta, nosso método mostra resultados de geração de fontes de poucas fotos extraordinariamente melhores (com apenas 8 imagens de glifos de referência) do que outros de última geração, sem utilizar uma forte supervisão da localidade, por exemplo, localização de cada componente, esqueleto ou golpes.
Você pode encontrar projetos mais relacionados na geração de fontes de poucos tiros nos links a seguir:
Implementação de Pytorch da geração de fontes com poucas fotos com representações e fatorização de estilo localizado .
Python> 3.6
Usando o CONDA é recomendado: https://docs.anaconda.com/anaconda/install/linux/
pytorch> = 1.1 (recomendado: 1.1)
Para instalar: https://pytorch.org/get-started/locally/
SCONF
Para instalar: https://github.com/khanrc/sconf
Numpy, TQDM, LMDB, YAML, JSONLIB, MSGPACK
conda install numpy tqdm lmdb ruamel.yaml jsonlib-python3 msgpack
O arquivo de fonte que usamos como fonte de conteúdo pode ser acessado aqui.
python build_dataset.py
--lmdb_path path/to/dump/lmdb
--meta_path path/to/meta/file
--json_path path/to/save/dict
Meta do trem ( Dict, JSON Format )
meta/train.json .Teste Meta ( Dict, JSON Format )
meta/test.json . Recomendamos modificar cfgs/custom.yaml em vez de cfgs/default.yaml , cfgs/combined.yaml ou cfgs/factorize.yaml .
chaves
# Phase 1 training
python train.py
NAME_phase1
cfgs/custom.yaml cfgs/combined.yaml
# Phase 2 training
python train.py
NAME_phase2
cfgs/custom.yaml cfgs/factorize.yaml
--resume ./result/checkpoints/NAME_phase1/800000-NAME_phase1.pth
python evaluator.py
cfgs/factorize.yaml
--weight weight/generator.pth
--img_dir path/to/save/images
--test_meta meta/test.json
--data_path path/to/data
Este projeto é distribuído pela licença do MIT, exceto Modules.py, que é adotado em https://github.com/nvlabs/funit.
LF-Font
Copyright (c) 2020-present NAVER Corp.
Permission is hereby granted, free of charge, to any person obtaining a copy
of this software and associated documentation files (the "Software"), to deal
in the Software without restriction, including without limitation the rights
to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
copies of the Software, and to permit persons to whom the Software is
furnished to do so, subject to the following conditions:
The above copyright notice and this permission notice shall be included in
all copies or substantial portions of the Software.
THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN
THE SOFTWARE.
Este projeto é baseado em Clovaai/DMFont.
@inproceedings{park2021lffont,
title={Few-shot Font Generation with Localized Style Representations and Factorization},
author={Park, Song and Chun, Sanghyuk and Cha, Junbum and Lee, Bado and Shim, Hyunjung},
year={2021},
booktitle={AAAI Conference on Artificial Intelligence},
}
@article{park2022lffont_extension,
author={Park, Song and Chun, Sanghyuk and Cha, Junbum and Lee, Bado and Shim, Hyunjung},
journal = {IEEE Transactions on Pattern Analysis & Machine Intelligence},
title = {Few-shot Font Generation with Weakly Supervised Localized Representations},
year = {5555},
volume = {},
number = {01},
issn = {1939-3539},
pages = {1-17},
keywords = {},
doi = {10.1109/TPAMI.2022.3196675},
publisher = {IEEE Computer Society},
address = {Los Alamitos, CA, USA},
month = {aug}
}