هذا هو تنفيذ Pytorch الرسمي لتوليف صورة Glyph الفني من خلال تعلم طلقة قليلة من مرحلة واحدة .
ورقة | المواد التكميلية
يعد التوليد التلقائي من صور Glyph الفنية مهمة صعبة تجذب العديد من الاهتمامات البحثية. الطرق السابقة إما مصممة خصيصًا لتوليف الشكل أو التركيز على نقل الملمس. في هذه الورقة ، نقترح نموذجًا جديدًا ، Agis-Net ، لنقل كل من أنماط الشكل والملمس في مرحلة واحدة فقط مع عدد قليل من العينات المنمسة. لتحقيق هذا الهدف ، نفصل أولاً عن تمثيلات المحتوى والأناقة باستخدام اثنين من التشفير ، مما يضمن توليد متعدد المحتوى ومتعدد الطراز. ثم نستخدم اثنين من عمليات فك تشفير العمل بشكل تعاوني لإنشاء صورة شكل Glyph وصورة الملمس في وقت واحد. بالإضافة إلى ذلك ، نقدم خسارة صقل الملمس المحلي لزيادة تحسين جودة القوام المتوازنة. وبهذه الطريقة ، يعد نموذجنا من مرحلة واحدة أكثر كفاءة وفعالية من الأساليب الأخرى المكدسة متعددة المراحل. نقترح أيضًا مجموعة بيانات واسعة النطاق مع صور غليفية صينية في أنماط مختلفة من الشكل والملمس ، والتي يتم تقديمها من 35 خطوطًا فنية مصممة محترفة مع 7326 حرفًا و 2460 خطوطًا فنية اصطناعية مع 639 حرفًا ، للتحقق من فعالية وتوسيع طريقتنا. تُظهر تجارب واسعة النطاق على كل من مجموعات بيانات الصور الغليفية باللغة الإنجليزية والصينية تفوق نموذجنا في توليد صور رسومية ذات جودة عالية من الأجزاء ضد الأساليب الحديثة الأخرى.

| تخطي الاتصال | التمييز المحلي |
|---|---|
![]() | ![]() |



pip install visdom
pip install dominategit clone -b master --single-branch https://github.com/hologerry/AGIS-Net
cd AGIS-Netخادم مجموعات البيانات منخفض ، يمكنك تنزيل مجموعات البيانات من PKU Disk أو Dropbox أو Mega. قم بتنزيل مجموعات البيانات باستخدام البرنامج النصي التالي وأربع مجموعات بيانات وصورة Glyph النمط المتوسط الخام.
قد يستغرق الأمر بعض الوقت ، يرجى التحلي بالصبر
bash ./datasets/download_dataset.sh DATASET_NAME
base_gray_color ENGLISTER ENGLISTER MARDIENT GLYPH DATASETER ، اقترحته MC-GAN.base_gray_texture English Artistic Glyph Image Dataset ، اقترحها MC-GAN.skeleton_gray_color الصينية الصينية تصنيع مجموعة بيانات صورة GLYPH من قبلنا.skeleton_gray_texture الصينية الفنية الفنية صورة بيانات البيانات المقترحة من قبل الولايات المتحدة.average_skeleton RAW الصيني Avgerage Font Motor (Skeleton) Glyph Image Dataset المقترحة من قبلنا.يرجى الرجوع إلى البيانات لمزيد من التفاصيل حول مجموعات البيانات الخاصة بنا وكيفية إعداد مجموعات البيانات الخاصة بك.
لتدريب نموذج ، قم بتنزيل صور التدريب (على سبيل المثال ، نقل اللغة الإنجليزية الفنية الإنجليزية)
bash ./datasets/download_dataset.sh base_gray_color
bash ./datasets/download_dataset.sh base_gray_textureتدريب نموذج:
ابدأ Visdomizer
python -m visdom.server -port PORTتم تحديد المنفذ في
train.sh
ما قبل الأملس على مجموعة بيانات صور Glyph التدرج المتدرج
bash ./scripts/train.sh base_gray_color GPU_IDGPU_ID يشير إلى وحدة معالجة الرسومات التي يجب استخدامها.
فنية على مجموعة بيانات صور Glyph الفنية
bash ./scripts/train.sh base_gray_texture GPU_ID DATA_ID FEW_SIZEيشير Data_id إلى الخط الفني الذي يتم ضبطه.
يشير FILE_SIZE إلى حجم مجموعة قليلة.
سوف يرفع خطأ في قول:
FileNodeFoundError: [Error 2] No such file or directory: 'chechpoints/base_gray_texture/base_gray_texture_DATA_ID_TIME/latest_net_G.pth
انسخ النموذج المسبق إلى المسار أعلاه
cp chechpoints/base_gray_color/base_gray_color_TIME/latest_net_ * chechpoints/base_gray_texture/base_gray_texture_DATA_ID_TIME/وابدأ القطار مرة أخرى. سوف يعمل بشكل جيد.
لاختبار نموذج ، انسخ النموذج المدرب من checkpoint إلى مجلد pretrained_models (على سبيل المثال ، نقل الرسول الرسومية الفنية الإنجليزية)
cp chechpoints/base_gray_color/base_gray_texture_DATA_ID_TIME/latest_net_ * pretrained_models/base_gray_texture_DATA_ID/اختبار نموذج
bash ./scripts/test_base_gray_texture.sh GPU_ID DATA_IDهذا الرمز مستوحى من Bicyclegan.
شكر خاص للأعمال التالية لمشاركة التعليمات البرمجية ومجموعة البيانات.
إذا وجدت أن عملنا مفيد ، فيرجى الاستشهاد بالورقة:
@article{Gao2019Artistic,
author = {Gao, Yue and Guo, Yuan and Lian, Zhouhui and Tang, Yingmin and Xiao, Jianguo},
title = {Artistic Glyph Image Synthesis via One-Stage Few-Shot Learning},
journal = {ACM Trans. Graph.},
issue_date = {November 2019},
volume = {38},
number = {6},
year = {2019},
articleno = {185},
numpages = {12},
url = {http://doi.acm.org/10.1145/3355089.3356574},
publisher = {ACM}
}
لا يُسمح إلا بمجموعة الكود ومجموعة البيانات للاستخدام الشخصي والأكاديمي.