إشعار: نصدر مستودع توليد الخطوط القليلة الموحدة (Clovaai/Nomousshot-font-generation). إذا كنت مهتمًا باستخدام تنفيذنا ، فيرجى زيارة المستودع الموحد.
تنفيذ Pytorch الرسمي لـ LF-FONT | ورقة | ورقة (امتداد pami)
Song Park 1* ، Sanghyuk Chun 2* ، Junbum Cha 2 ، Bado Lee 2 ، Hyunjung Shim 1
* مساهمة متساوية
مدرسة واحدة للتكنولوجيا المتكاملة ، جامعة Yonsei
2 Clova AI Research ، Naver Corp.
إن توليد خطوط قليلة التلقائي في ارتفاع الطلب لأن التصميمات اليدوية باهظة الثمن وحساسة لخبرة المصممين. تهدف الأساليب الحالية لتوليد خطوط قليلة إلى تعلم عدم تشكيل عنصر النمط والمحتوى من عدد قليل من الحروف المرجعية والتركيز بشكل رئيسي على تمثيل النمط العالمي لكل نمط خط. ومع ذلك ، فإن هذا النهج يحد من النموذج في تمثيل أنماط محلية متنوعة ، وبالتالي يجعله غير مناسب لنظام الحروف الأكثر تعقيدًا ، على سبيل المثال ، الصينية ، التي تتكون شخصياتها من عدد متفاوتة من المكونات (التي تسمى غالبًا "جذرية") مع بنية معقدة للغاية. في هذه الورقة ، نقترح طريقة توليد خطوط جديدة من خلال تعلم الأنماط الموضعية ، وهي تمثيلات النمط بالمكون ، بدلاً من الأنماط الشاملة. تمكننا تمثيلات النمط المقترحة من توليف التفاصيل المحلية المعقدة في تصميمات النص. ومع ذلك ، فإن أنماط التعلم المكون من مكونات فقط من الحروف المرجعية غير ممكنة في سيناريو توليد الخطوط القليلة ، عندما يكون لدى البرنامج النصي المستهدف عددًا كبيرًا من المكونات ، على سبيل المثال ، أكثر من 200 للصينية. لتقليل عدد الحروف الرسومية المرجعية ، نقوم بتبسيط الأنماط الحكيمة عن طريق منتج من عامل المكون وعامل النمط ، مستوحى من عوامل المصفوفة منخفضة الرفاه. بفضل مزيج من التمثيل القوي واستراتيجية معاملات مضغوطة ، تُظهر طريقتنا نتائج توليد خطوط قليلة بشكل ملحوظ (مع 8 صور مرجعية فقط) من غيرها من الأحداث ، دون استخدام الإشراف القوي للمحلية ، على سبيل المثال ، موقع كل مكون أو هيكل عظمي أو ضربات.
يمكنك العثور على المزيد من المشاريع ذات الصلة على توليد خطوط قليلة في الروابط التالية:
تنفيذ Pytorch لتوليد خطوط قليلة مع تمثيلات النمط الموضعي والعوامل .
بيثون> 3.6
يوصى باستخدام conda: https://docs.anaconda.com/anaconda/install/linux/
Pytorch> = 1.1 (موصى به: 1.1)
للتثبيت: https://pytorch.org/get-started/locally/
SCONF
للتثبيت: https://github.com/khanrc/sconf
Numpy ، TQDM ، LMDB ، YAML ، JSONLIB ، MSGPACK
conda install numpy tqdm lmdb ruamel.yaml jsonlib-python3 msgpack
يمكن الوصول إلى ملف الخط الذي استخدمناه كخط المحتوى هنا.
python build_dataset.py
--lmdb_path path/to/dump/lmdb
--meta_path path/to/meta/file
--json_path path/to/save/dict
قطار ميتا ( DICT ، تنسيق JSON )
meta/train.json .اختبار META ( DICT ، تنسيق JSON )
meta/test.json . نوصي بتعديل cfgs/custom.yaml بدلاً من cfgs/default.yaml ، cfgs/combined.yaml ، أو cfgs/factorize.yaml .
مفاتيح
# Phase 1 training
python train.py
NAME_phase1
cfgs/custom.yaml cfgs/combined.yaml
# Phase 2 training
python train.py
NAME_phase2
cfgs/custom.yaml cfgs/factorize.yaml
--resume ./result/checkpoints/NAME_phase1/800000-NAME_phase1.pth
python evaluator.py
cfgs/factorize.yaml
--weight weight/generator.pth
--img_dir path/to/save/images
--test_meta meta/test.json
--data_path path/to/data
يتم توزيع هذا المشروع بموجب ترخيص MIT ، باستثناء الوحدات النمطية التي تم تبنيها من https://github.com/nvlabs/funit.
LF-Font
Copyright (c) 2020-present NAVER Corp.
Permission is hereby granted, free of charge, to any person obtaining a copy
of this software and associated documentation files (the "Software"), to deal
in the Software without restriction, including without limitation the rights
to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
copies of the Software, and to permit persons to whom the Software is
furnished to do so, subject to the following conditions:
The above copyright notice and this permission notice shall be included in
all copies or substantial portions of the Software.
THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN
THE SOFTWARE.
يعتمد هذا المشروع على كلوفااي/DMFONT.
@inproceedings{park2021lffont,
title={Few-shot Font Generation with Localized Style Representations and Factorization},
author={Park, Song and Chun, Sanghyuk and Cha, Junbum and Lee, Bado and Shim, Hyunjung},
year={2021},
booktitle={AAAI Conference on Artificial Intelligence},
}
@article{park2022lffont_extension,
author={Park, Song and Chun, Sanghyuk and Cha, Junbum and Lee, Bado and Shim, Hyunjung},
journal = {IEEE Transactions on Pattern Analysis & Machine Intelligence},
title = {Few-shot Font Generation with Weakly Supervised Localized Representations},
year = {5555},
volume = {},
number = {01},
issn = {1939-3539},
pages = {1-17},
keywords = {},
doi = {10.1109/TPAMI.2022.3196675},
publisher = {IEEE Computer Society},
address = {Los Alamitos, CA, USA},
month = {aug}
}