YOLaT VectorGraphicsRecognition
1.0.0
该存储库是我们两个强大的向量图形识别模型的官方Pytorch实现。
Neurips-2021论文:识别矢量图形而没有栅格化。
TPAMI-2024论文:层次识别向量图形和新的基于图表的矢量图形数据集

如上图1所示,将矢量图形渲染到像素阵列中可能会导致大量的内存成本或信息损失。此外,此过程丢弃了原始词中的高级结构信息,这对于识别拐角和轮廓等识别任务至关重要。总而言之,我们建议您仅查看文本系列(Yolat&Yolat ++),该系列通过将向量图形的文本文档作为输入来解决栅格图形的问题。
conda create -n your_env_name python=3.8
conda activate your_env_name
sh deepgcn_env_install.sh a)下载并解压缩平面图数据集到数据集文件夹: data/FloorPlansGraph5_iter
b)运行以下脚本以准备数据集进行培训/推理。
cd utils
python svg_utils/build_graph_bbox.pya)将图数据集下载并解压缩到数据集文件夹: data/diagrams
b)运行以下脚本以准备数据集进行培训/推理。
cd utils
python svg_utils/build_graph_bbox_diagram.py cd cad_recognition
CUDA_VISIBLE_DEVICES=0 python -u train.py --batch_size 4 --data_dir data/FloorPlansGraph5_iter --phase train --lr 2.5e-4 --lr_adjust_freq 9999999999999999999999999999999999999 --in_channels 5 --n_blocks 2 --n_blocks_out 2 --arch centernet3cc_rpn_gp_iter2 --graph bezier_cc_bb_iter --data_aug true --weight_decay 1e-5 --postname run182_2 --dropout 0.0 --do_mixup 0 --bbox_sampling_step 10 cd cad_recognition
CUDA_VISIBLE_DEVICES=0 python -u train.py --batch_size 4 --data_dir data/diagrams --phase train --lr 2.5e-4 --lr_adjust_freq 9999999999999999999999999999999999999 --in_channels 5 --n_blocks 2 --n_blocks_out 2 --arch centernet3cc_rpn_gp_iter2 --graph bezier_cc_bb_iter --data_aug true --weight_decay 1e-5 --postname run182_2 --dropout 0.0 --do_mixup 0 --bbox_sampling_step 5
引入了Yolat ++,其特征是为VG设计设计的层次结构,涵盖了三个级别:原始,曲线和点。此外,YOLAT ++采用了具有职位感知的增强策略来有效地区分相似的原语。
Bibtex:
@inproceedings{jiang2021recognizing,
title={{Recognizing Vector Graphics without Rasterization}},
author={Jiang, Xinyang and Liu, Lu and Shan, Caihua and Shen, Yifei and Dong, Xuanyi and Li, Dongsheng},
booktitle={Proceedings of Advances in Neural Information Processing Systems (NIPS)},
volume={34},
number={},
pages={},
year={2021}}
@inproceedings{yolat24,
title={{Hierarchical Recognizing Vector Graphics and A New Chart-based Vector Graphics Dataset}},
author={Shuguang Dou, Xinyang Jiang, Lu Liu, Lu Ying, Caihua Shan, Yifei Shen, Xuanyi Dong, Yun Wang, Dongsheng Li, Cairong Zhao},
booktitle={IEEE Transactions on Pattern Analysis and Machine Intelligence},
volume={},
number={},
pages={},
year={2024}}
请考虑吗?如果您发现此存储库有帮助,请参阅我们的项目与您的社区分享!
基于VG的检测和图表理解的基准