إشعار: نصدر مستودع توليد الخطوط القليلة الموحدة (Clovaai/Nomousshot-font-generation). إذا كنت مهتمًا باستخدام تنفيذنا ، فيرجى زيارة المستودع الموحد.
يعد تنفيذ Pytorch من رؤوس متعددة أفضل من واحد: توليد خطوط قليلة مع خبير محلي متعددي . | ورق
Song Park 1 ، Sanghyuk Chun 2 ، 3 ، Junbum Cha 3 ، Bado Lee 3 ، Hyunjung Shim 1
مدرسة واحدة للتكنولوجيا المتكاملة ، جامعة Yonsei
2 Naver AI Lab
3 نيفر كلوفا
يجب أن تفي طريقة توليد خطوط قليلة (FFG) عن هدفين: يجب أن تحافظ الصور التي تم إنشاؤها على الهيكل العالمي الأساسي للشخصية المستهدفة وتقديم النمط المرجعي المحلي المتنوع. تهدف طرق FFG الحالية إلى فصل المحتوى والأناقة إما عن طريق استخراج نمط التمثيل العالمي أو استخراج تمثيلات نمط مكون من مكونات متعددة. ومع ذلك ، فإن الطرق السابقة إما تفشل في التقاط أنماط محلية متنوعة أو لا يمكن تعميمها على شخصية ذات مكونات غير مرئية ، على سبيل المثال ، أنظمة اللغة غير المرئية. للتخفيف من المشكلات ، نقترح طريقة جديدة FFG ، تسميت العديد من الخبراء المترجمة شبكة توليد خطوط قليلة (MX-FONT). يستخرج MX-Font ميزات نمط متعددة غير مشروطة بشكل صريح على ملصقات المكونات ، ولكن تلقائيًا من قبل خبراء متعددين لتمثيل مفاهيم محلية مختلفة ، على سبيل المثال ، الجليد الفرعي على الجانب الأيسر. نظرًا لخبراء متعددين ، يمكن لـ MX-Font التقاط مفاهيم محلية متنوعة وإظهار التعميم على اللغات غير المرئية. أثناء التدريب ، نستخدم ملصقات المكونات كإشراف ضعيف لتوجيه كل خبير لتكون متخصصة لمفاهيم محلية مختلفة. نقوم بصياغة مشكلة تعيين المكون لكل خبير مثل مشكلة مطابقة الرسم البياني ، وحلها بواسطة الخوارزمية المجرية. نحن نستخدم أيضًا فقدان الاستقلال وفقدان الخصومة على غرار المحتوى لفرض تفكيك على غرار المحتوى. في تجاربنا ، يتفوق MX-Font على أساليب FFG الحديثة في الجيل الصيني والجنسية ، على سبيل المثال ، صينية إلى كورية ، جيل.
يمكنك العثور على المزيد من المشاريع ذات الصلة على توليد خطوط قليلة في الروابط التالية:
بيثون> 3.6
يوصى باستخدام conda: https://docs.anaconda.com/anaconda/install/linux/
Pytorch> = 1.5
للتثبيت: https://pytorch.org/get-started/locally/
Sconf ، Numpy ، Scipy ، Scikit-Image ، TQDM ، Jsonlib ، fonttools
conda install numpy scipy scikit-image tqdm jsonlib-python3 fonttools
لاحظ أننا نقدم فقط ملفات الخطوط على سبيل المثال ؛ ليس ملفات الخط المستخدمة للتدريب الوزن المقدم (المولد. يتم تنزيل ملفات الخطوط المثال من هنا.
get_chars_from_ttf.py # Generating the available characters file
python get_chars_from_ttf.py --root_dir path/to/ttf/dir
- use_ddp: whether to use DataDistributedParallel, for multi-GPUs.
- port: the port for the DataDistributedParallel training.
- work_dir: the directory to save checkpoints, validation images, and the log.
- decomposition: path to the "decomposition rule" file.
- primals: path to the "primals" file.
- dset: (leave blank)
- train: (leave blank)
- data_dir : path to .ttf files for the training
- val: (leave blank)
- data_dir : path to .ttf files for the validation
- source_font : path to .ttf file used as the source font during the validation
python train.py cfgs/train.yaml
* data_dir
|-- font1
|-- char1.png
|-- char2.png
|-- char3.png
|-- font2
|-- char1.png
|-- char2.png
.
.
.
- dset: (leave blank)
- test: (leave blank)
- data_dir: path to reference images
- source_font: path to .ttf file used as the source font during the generation
- gen_chars_file: path to file of the characters to generate. Leave blank if you want to generate all the available characters in the source font.
python eval.py
cfgs/eval.yaml
--weight generator.pth
--result_dir path/to/save/images
يتم توزيع هذا المشروع بموجب ترخيص MIT ، باستثناء الوحدات النمطية التي تم تبنيها من https://github.com/nvlabs/funit.
MX-Font
Copyright (c) 2021-present NAVER Corp.
Permission is hereby granted, free of charge, to any person obtaining a copy
of this software and associated documentation files (the "Software"), to deal
in the Software without restriction, including without limitation the rights
to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
copies of the Software, and to permit persons to whom the Software is
furnished to do so, subject to the following conditions:
The above copyright notice and this permission notice shall be included in
all copies or substantial portions of the Software.
THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN
THE SOFTWARE.
يعتمد هذا المشروع على Clovaai/DMFont و Clovaai/Lffont.
@inproceedings{park2021mxfont,
title={Multiple Heads are Better than One: Few-shot Font Generation with Multiple Localized Experts},
author={Park, Song and Chun, Sanghyuk and Cha, Junbum and Lee, Bado and Shim, Hyunjung},
year={2021},
booktitle={International Conference on Computer Vision (ICCV)},
}