PEMBERITAHUAN: Kami merilis repositori generasi font beberapa-shot terpadu (clovaai/sewshot-font-generation). Jika Anda tertarik untuk menggunakan implementasi kami, silakan kunjungi repositori terpadu.
Implementasi Pytorch resmi LF-Font | Kertas | kertas (ekstensi pami)
Song Park 1* , Sanghyuk Chun 2* , Junbum Cha 2 , Bado Lee 2 , Hyunjung Shim 1
* Kontribusi yang sama
1 Sekolah Teknologi Terpadu, Universitas Yonsei
2 Penelitian Clova AI, Naver Corp.
Generasi font beberapa shot otomatis sangat diminati karena desain manual mahal dan sensitif terhadap keahlian desainer. Metode generasi font beberapa-shot yang ada bertujuan untuk belajar mengurai gaya dan elemen konten dari beberapa mesin terbang referensi dan terutama fokus pada representasi gaya universal untuk setiap gaya font. Namun, pendekatan semacam itu membatasi model dalam mewakili beragam gaya lokal, dan dengan demikian membuatnya tidak cocok dengan sistem huruf yang paling rumit, misalnya, Cina, yang karakternya terdiri dari berbagai komponen (sering disebut "radikal") dengan struktur yang sangat kompleks. Dalam makalah ini, kami mengusulkan metode generasi font baru dengan mempelajari gaya lokal, yaitu representasi gaya komponen-bijaksana, bukan gaya universal. Representasi gaya yang diusulkan memungkinkan kami untuk mensintesis detail lokal yang kompleks dalam desain teks. Namun, gaya belajar-bijaksana hanya dari mesin terbang referensi tidak layak dalam skenario generasi font beberapa-shot, ketika skrip target memiliki sejumlah besar komponen, misalnya, lebih dari 200 untuk Cina. Untuk mengurangi jumlah mesin terbang referensi, kami menyederhanakan gaya komponen-bijaksana dengan produk faktor komponen dan faktor gaya, terinspirasi oleh faktorisasi matriks peringkat rendah. Berkat kombinasi representasi yang kuat dan strategi faktorisasi yang ringkas, metode kami menunjukkan hasil generasi font beberapa-shot yang jauh lebih baik (dengan hanya 8 gambar glyph referensi) daripada canggih lainnya, tanpa menggunakan pengawasan lokalitas yang kuat, misalnya, lokasi setiap komponen, kerangka, atau stroke.
Anda dapat menemukan lebih banyak proyek terkait pada generasi font beberapa-shot di tautan berikut:
Implementasi Pytorch dari beberapa generasi font-shot dengan representasi gaya lokal dan faktorisasi .
Python> 3.6
Menggunakan conda direkomendasikan: https://docs.anaconda.com/anaconda/install/linux/
Pytorch> = 1.1 (Direkomendasikan: 1.1)
Untuk menginstal: https://pytorch.org/get-started/locally/
sconf
Untuk menginstal: https://github.com/khanrc/sconf
numpy, tqdm, lmdb, yaml, jsonlib, msgpack
conda install numpy tqdm lmdb ruamel.yaml jsonlib-python3 msgpack
File font yang kami gunakan sebagai font konten dapat diakses di sini.
python build_dataset.py
--lmdb_path path/to/dump/lmdb
--meta_path path/to/meta/file
--json_path path/to/save/dict
Meta kereta api ( Dikt, format JSON )
meta/train.json .Test Meta ( Dict, JSON Format )
meta/test.json . Kami merekomendasikan untuk memodifikasi cfgs/custom.yaml daripada cfgs/default.yaml , cfgs/combined.yaml , atau cfgs/factorize.yaml .
kunci
# Phase 1 training
python train.py
NAME_phase1
cfgs/custom.yaml cfgs/combined.yaml
# Phase 2 training
python train.py
NAME_phase2
cfgs/custom.yaml cfgs/factorize.yaml
--resume ./result/checkpoints/NAME_phase1/800000-NAME_phase1.pth
python evaluator.py
cfgs/factorize.yaml
--weight weight/generator.pth
--img_dir path/to/save/images
--test_meta meta/test.json
--data_path path/to/data
Proyek ini didistribusikan di bawah lisensi MIT, kecuali modules.py yang diadopsi dari https://github.com/nvlabs/funit.
LF-Font
Copyright (c) 2020-present NAVER Corp.
Permission is hereby granted, free of charge, to any person obtaining a copy
of this software and associated documentation files (the "Software"), to deal
in the Software without restriction, including without limitation the rights
to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
copies of the Software, and to permit persons to whom the Software is
furnished to do so, subject to the following conditions:
The above copyright notice and this permission notice shall be included in
all copies or substantial portions of the Software.
THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN
THE SOFTWARE.
Proyek ini didasarkan pada Clovaai/Dmfont.
@inproceedings{park2021lffont,
title={Few-shot Font Generation with Localized Style Representations and Factorization},
author={Park, Song and Chun, Sanghyuk and Cha, Junbum and Lee, Bado and Shim, Hyunjung},
year={2021},
booktitle={AAAI Conference on Artificial Intelligence},
}
@article{park2022lffont_extension,
author={Park, Song and Chun, Sanghyuk and Cha, Junbum and Lee, Bado and Shim, Hyunjung},
journal = {IEEE Transactions on Pattern Analysis & Machine Intelligence},
title = {Few-shot Font Generation with Weakly Supervised Localized Representations},
year = {5555},
volume = {},
number = {01},
issn = {1939-3539},
pages = {1-17},
keywords = {},
doi = {10.1109/TPAMI.2022.3196675},
publisher = {IEEE Computer Society},
address = {Los Alamitos, CA, USA},
month = {aug}
}