YOLaT VectorGraphicsRecognition
1.0.0
該存儲庫是我們兩個強大的向量圖形識別模型的官方Pytorch實現。
Neurips-2021論文:識別矢量圖形而沒有柵格化。
TPAMI-2024論文:層次識別向量圖形和新的基於圖表的矢量圖形數據集

如上圖1所示,將矢量圖形渲染到像素陣列中可能會導致大量的內存成本或信息損失。此外,此過程丟棄了原始詞中的高級結構信息,這對於識別拐角和輪廓等識別任務至關重要。總而言之,我們建議您僅查看文本系列(Yolat&Yolat ++),該系列通過將向量圖形的文本文檔作為輸入來解決柵格圖形的問題。
conda create -n your_env_name python=3.8
conda activate your_env_name
sh deepgcn_env_install.sh a)下載並解壓縮平面圖數據集到數據集文件夾: data/FloorPlansGraph5_iter
b)運行以下腳本以準備數據集進行培訓/推理。
cd utils
python svg_utils/build_graph_bbox.pya)將圖數據集下載並解壓縮到數據集文件夾: data/diagrams
b)運行以下腳本以準備數據集進行培訓/推理。
cd utils
python svg_utils/build_graph_bbox_diagram.py cd cad_recognition
CUDA_VISIBLE_DEVICES=0 python -u train.py --batch_size 4 --data_dir data/FloorPlansGraph5_iter --phase train --lr 2.5e-4 --lr_adjust_freq 9999999999999999999999999999999999999 --in_channels 5 --n_blocks 2 --n_blocks_out 2 --arch centernet3cc_rpn_gp_iter2 --graph bezier_cc_bb_iter --data_aug true --weight_decay 1e-5 --postname run182_2 --dropout 0.0 --do_mixup 0 --bbox_sampling_step 10 cd cad_recognition
CUDA_VISIBLE_DEVICES=0 python -u train.py --batch_size 4 --data_dir data/diagrams --phase train --lr 2.5e-4 --lr_adjust_freq 9999999999999999999999999999999999999 --in_channels 5 --n_blocks 2 --n_blocks_out 2 --arch centernet3cc_rpn_gp_iter2 --graph bezier_cc_bb_iter --data_aug true --weight_decay 1e-5 --postname run182_2 --dropout 0.0 --do_mixup 0 --bbox_sampling_step 5
引入了Yolat ++,其特徵是為VG設計設計的層次結構,涵蓋了三個級別:原始,曲線和點。此外,YOLAT ++採用了具有職位感知的增強策略來有效地區分相似的原語。
Bibtex:
@inproceedings{jiang2021recognizing,
title={{Recognizing Vector Graphics without Rasterization}},
author={Jiang, Xinyang and Liu, Lu and Shan, Caihua and Shen, Yifei and Dong, Xuanyi and Li, Dongsheng},
booktitle={Proceedings of Advances in Neural Information Processing Systems (NIPS)},
volume={34},
number={},
pages={},
year={2021}}
@inproceedings{yolat24,
title={{Hierarchical Recognizing Vector Graphics and A New Chart-based Vector Graphics Dataset}},
author={Shuguang Dou, Xinyang Jiang, Lu Liu, Lu Ying, Caihua Shan, Yifei Shen, Xuanyi Dong, Yun Wang, Dongsheng Li, Cairong Zhao},
booktitle={IEEE Transactions on Pattern Analysis and Machine Intelligence},
volume={},
number={},
pages={},
year={2024}}
請考慮嗎?如果您發現此存儲庫有幫助,請參閱我們的項目與您的社區分享!
基於VG的檢測和圖表理解的基準