Multi Type TD TSR
1.0.0
在我們的論文的源代碼中查看它:使用多級管道從文檔圖像中提取表和表結構識別的多型TD-TSR提取表





| iou | iou | iou | iou | 加權 | |
|---|---|---|---|---|---|
| 團隊 | 0.6 | 0.7 | 0.8 | 0.9 | 平均的 |
| Cascadetabnet | 0.438 | 0.354 | 0.19 | 0.036 | 0.232 |
| NLPR-PAL | 0.365 | 0.305 | 0.195 | 0.035 | 0.206 |
| 多型-TD-TSR | 0.589 | 0.404 | 0.137 | 0.015 | 0.253 |
源代碼是在以下庫依賴項下開發的
表檢測模型基於檢測模型遵循本安裝指南進行設置。
對於圖像對齊預處理步驟,有一個腳本可用:
deskew.py要將圖像對齊算法應用於一個文件夾中的所有圖像,您需要執行:
python3 deskew.py
帶有以下參數
--folder輸入文件夾,包括文檔圖像--output Deskewed圖像的輸出文件夾對於表結構識別,我們為不同方法提供了一個簡單的腳本
tsr.py要將表結構識別算法應用於一個文件夾中的所有圖像,您需要執行:
python3 tsr.py
帶有以下參數
--folder輸入文件夾的折路路徑,包括表圖像--type表結構識別類型type in ["borderd", "unbordered", "partially", "partially_color_inv"]--img_output輸出文件夾路徑的處理圖像--xml_output輸出文件夾路徑XML文件,包括邊界框用後面的表結構識別桌子檢測表
tdtsr.py要將表結構識別算法應用於一個文件夾中的所有圖像,您需要執行:
python3 tdtsr.py
帶有以下參數
--folder輸入文件夾的折路路徑,包括表圖像--type表結構識別類型type in ["borderd", "unbordered", "partially", "partially_color_inv"]--tsr_img_output輸出文件夾的加工表圖像圖像--td_img_output輸出文件夾的生成桌子切口路徑--xml_output輸出文件夾路徑的XML文件,用於表和單元格,包括邊界框--config檢測到表檢測的配置文件--yaml檢測路徑yaml文件用於表檢測--weights檢測型號檢測權重量的重量路徑為了評估表結構識別算法,我們提供以下腳本:
evaluate.py要應用評估,XML格式中的表圖像及其標籤必須是相同的名稱,並且應該位於一個文件夾中。評估可以通過:
python3 evaluate.py
使用以下參數
--dataset數據集文件夾路徑,包含表圖像和標籤.xml格式 @misc{fischer2021multitypetdtsr,
title={Multi-Type-TD-TSR - Extracting Tables from Document Images using a Multi-stage Pipeline for Table Detection and Table Structure Recognition: from OCR to Structured Table Representations},
author={Pascal Fischer and Alen Smajic and Alexander Mehler and Giuseppe Abrami},
year={2021},
eprint={2105.11021},
archivePrefix={arXiv},
primaryClass={cs.CV}
}