通知:統一された少数のフォント生成リポジトリ(Clovaai/少数のショットフォントジェネレーション)をリリースします。実装の使用に興味がある場合は、Unified Repositoryをご覧ください。
LF-Fontの公式Pytorch実装|論文|紙(パミ拡張機能)
ソングパーク1* 、サンギョクチュン2* 、ジャンブムチャ2 、バドリー2 、ヒョンジュンシム1
*平等な貢献
1つの統合技術学校、卵原大学
2 CLOVA AI Research、Naver Corp.
マニュアルデザインは高価でデザイナーの専門知識に敏感であるため、自動の少ないショットフォント生成は需要が高くなっています。少数のショットフォント生成の既存の方法は、いくつかの参照グリフからスタイルとコンテンツの要素を解くことを学ぶことを目的としており、主に各フォントスタイルのユニバーサルスタイルの表現に焦点を当てることを目的としています。ただし、このようなアプローチは、多様なローカルスタイルを表す際にモデルを制限するため、最も複雑な構造を持つさまざまな数のコンポーネント(しばしば「ラジカル」と呼ばれる)で構成される、最も複雑な文字システム、例えば中国語に適していません。このペーパーでは、普遍的なスタイルの代わりに、ローカライズされたスタイル、つまりコンポーネントごとのスタイル表現を学習することにより、新しいフォント生成方法を提案します。提案されたスタイル表現により、テキストデザインの複雑なローカル詳細を合成することができます。ただし、ターゲットスクリプトには、中国語で200を超える多数のコンポーネントがある場合、リファレンスグリフのみからの学習コンポーネントごとのスタイルのみが実行不可能です。参照グリフの数を減らすために、低ランクのマトリックス因数分解に触発されたコンポーネントファクターとスタイル因子の積によってコンポーネントごとのスタイルを簡素化します。強力な表現とコンパクトな因数分解戦略の組み合わせのおかげで、私たちの方法では、他の最先端の結果よりも、各コンポーネント、スケルトン、またはストロークの位置を利用せずに、他の最先端のアートよりもはるかに優れた少数のフォント生成結果(8つの参照グリフ画像のみ)が示されています。
以下のリンクで、いくつかのショットフォント生成に関するより多くの関連プロジェクトを見つけることができます。
ローカライズされたスタイルの表現と因数分解を備えた少数のフォント生成のPytorch実装。
Python> 3.6
コンドラの使用をお勧めします:https://docs.anaconda.com/anaconda/install/linux/
pytorch> = 1.1 (推奨:1.1)
インストールするには:https://pytorch.org/get-started/locally/
sconf
インストール:https://github.com/khanrc/sconf
numpy、tqdm、lmdb、yaml、jsonlib、msgpack
conda install numpy tqdm lmdb ruamel.yaml jsonlib-python3 msgpack
コンテンツフォントとして使用したフォントファイルには、ここからアクセスできます。
python build_dataset.py
--lmdb_path path/to/dump/lmdb
--meta_path path/to/meta/file
--json_path path/to/save/dict
トレーニングメタ( DICT、JSON形式)
meta/train.jsonにあります。テストメタ( dict、json形式)
meta/test.jsonにあります。cfgs/default.yaml 、 cfgs/combined.yaml 、またはcfgs/factorize.yamlではなく、CFGS/ cfgs/custom.yamlを変更することをお勧めします。
キー
# Phase 1 training
python train.py
NAME_phase1
cfgs/custom.yaml cfgs/combined.yaml
# Phase 2 training
python train.py
NAME_phase2
cfgs/custom.yaml cfgs/factorize.yaml
--resume ./result/checkpoints/NAME_phase1/800000-NAME_phase1.pth
python evaluator.py
cfgs/factorize.yaml
--weight weight/generator.pth
--img_dir path/to/save/images
--test_meta meta/test.json
--data_path path/to/data
このプロジェクトは、https://github.com/nvlabs/funitから採用されているmodules.pyを除き、MITライセンスの下で配布されます。
LF-Font
Copyright (c) 2020-present NAVER Corp.
Permission is hereby granted, free of charge, to any person obtaining a copy
of this software and associated documentation files (the "Software"), to deal
in the Software without restriction, including without limitation the rights
to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
copies of the Software, and to permit persons to whom the Software is
furnished to do so, subject to the following conditions:
The above copyright notice and this permission notice shall be included in
all copies or substantial portions of the Software.
THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN
THE SOFTWARE.
このプロジェクトは、Clovaai/DMFontに基づいています。
@inproceedings{park2021lffont,
title={Few-shot Font Generation with Localized Style Representations and Factorization},
author={Park, Song and Chun, Sanghyuk and Cha, Junbum and Lee, Bado and Shim, Hyunjung},
year={2021},
booktitle={AAAI Conference on Artificial Intelligence},
}
@article{park2022lffont_extension,
author={Park, Song and Chun, Sanghyuk and Cha, Junbum and Lee, Bado and Shim, Hyunjung},
journal = {IEEE Transactions on Pattern Analysis & Machine Intelligence},
title = {Few-shot Font Generation with Weakly Supervised Localized Representations},
year = {5555},
volume = {},
number = {01},
issn = {1939-3539},
pages = {1-17},
keywords = {},
doi = {10.1109/TPAMI.2022.3196675},
publisher = {IEEE Computer Society},
address = {Los Alamitos, CA, USA},
month = {aug}
}