Multi Type TD TSR
1.0.0
在我们的论文的源代码中查看它:使用多级管道从文档图像中提取表和表结构识别的多型TD-TSR提取表





| iou | iou | iou | iou | 加权 | |
|---|---|---|---|---|---|
| 团队 | 0.6 | 0.7 | 0.8 | 0.9 | 平均的 |
| Cascadetabnet | 0.438 | 0.354 | 0.19 | 0.036 | 0.232 |
| NLPR-PAL | 0.365 | 0.305 | 0.195 | 0.035 | 0.206 |
| 多型-TD-TSR | 0.589 | 0.404 | 0.137 | 0.015 | 0.253 |
源代码是在以下库依赖项下开发的
表检测模型基于检测模型遵循本安装指南进行设置。
对于图像对齐预处理步骤,有一个脚本可用:
deskew.py要将图像对齐算法应用于一个文件夹中的所有图像,您需要执行:
python3 deskew.py
带有以下参数
--folder输入文件夹,包括文档图像--output Deskewed图像的输出文件夹对于表结构识别,我们为不同方法提供了一个简单的脚本
tsr.py要将表结构识别算法应用于一个文件夹中的所有图像,您需要执行:
python3 tsr.py
带有以下参数
--folder输入文件夹的折路路径,包括表图像--type表结构识别类型type in ["borderd", "unbordered", "partially", "partially_color_inv"]--img_output输出文件夹路径的处理图像--xml_output输出文件夹路径XML文件,包括边界框用后面的表结构识别桌子检测表
tdtsr.py要将表结构识别算法应用于一个文件夹中的所有图像,您需要执行:
python3 tdtsr.py
带有以下参数
--folder输入文件夹的折路路径,包括表图像--type表结构识别类型type in ["borderd", "unbordered", "partially", "partially_color_inv"]--tsr_img_output输出文件夹的加工表图像图像--td_img_output输出文件夹的生成桌子切口路径--xml_output输出文件夹路径的XML文件,用于表和单元格,包括边界框--config检测到表检测的配置文件--yaml检测路径yaml文件用于表检测--weights检测型号检测权重量的重量路径为了评估表结构识别算法,我们提供以下脚本:
evaluate.py要应用评估,XML格式中的表图像及其标签必须是相同的名称,并且应该位于一个文件夹中。评估可以通过:
python3 evaluate.py
使用以下参数
--dataset数据集文件夹路径,包含表图像和标签.xml格式 @misc{fischer2021multitypetdtsr,
title={Multi-Type-TD-TSR - Extracting Tables from Document Images using a Multi-stage Pipeline for Table Detection and Table Structure Recognition: from OCR to Structured Table Representations},
author={Pascal Fischer and Alen Smajic and Alexander Mehler and Giuseppe Abrami},
year={2021},
eprint={2105.11021},
archivePrefix={arXiv},
primaryClass={cs.CV}
}