디지털 시대에는 테이블 데이터의 처리 및 분석이 특히 중요해졌습니다. 그러나 문서에서 통계 테이블 사진을 스캔하고 PDF 파일의 재무 보고서 데이터와 같은 많은 표 형식 데이터가 여전히 구조화되지 않은 형태로 존재합니다. 이 데이터는 직접적으로 자동으로 처리 할 수 없으므로 데이터 분석 및 문서 이해에 큰 어려움이 있습니다. 이 문제를 해결하기 위해 Baidu AI는 3 월 11 일에 오픈 소스의 새로운 대표 인식 솔루션 PP-TABLEMAGIC을 발표했으며, 이는 테이블 구조화 된 정보 추출 분야에서 큰 획기적인 획기적인 획기를 가져 왔습니다.
PP-TABLEMAGIC의 출시는 복잡한 시나리오에서 전통적인 테이블 인식 기술의 한계를 해결하는 것을 목표로합니다. 이 솔루션은 혁신적인 멀티 모델 네트워킹 아키텍처를 통해 고정밀 엔드 투 엔드 테이블 인식을 실현하고 모든 시나리오에 대한 고도로 맞춤형 모델 미세 조정을 지원합니다. 전통적인 일반 테이블 인식 모델은 종종 복잡한 테이블 형식에 직면 할 때 제대로 작동하지 않으며 다양한 응용 프로그램 시나리오의 요구를 충족시키기가 어렵습니다. 이를 위해 Baidu Paddlepaddle 팀은 "테이블 분류 + 테이블 구조 인식 + 셀 감지"의 멀티 모델 탠덤 네트워킹 방식을 채택하는 PP-TABLEMAGIC을 출시하여 테이블 인식의 정확성과 적응성을 크게 향상시킵니다.

PP-TABLEMAGIC의 핵심 장점은 혁신적인 건축 설계에 있습니다. 이 솔루션은 듀얼 스트림 아키텍처를 채택하고 테이블을 유선 테이블과 무선 테이블의 두 가지 범주로 나눈 다음 엔드 투 엔드 테이블 인식 작업을 셀 감지 및 테이블 구조 인식의 두 하위 작업으로 분해합니다. 마지막으로, 전체 HTML 테이블 예측 결과는 자체 최적화 결과 융합 알고리즘을 통해 생성됩니다. 그 중에서도 Lightweight Table Classification 모델 PP-LCNET_X1_0_Table_CLS는 PaddlePaddle 팀이 개발 한 유선 테이블과 무선 테이블을 높은 정확도로 분류 할 수 있습니다. 업계 최초의 오픈 소스 테이블 셀 탐지 모델 RT-Detr-L_Table_Cell_Det은 다양한 유형의 테이블 셀의 정확한 위치를 깨닫습니다. 새로운 대표적인 그리드 구조 인식 모델 SLANEXT는 테이블 HTML 구조 분석에서 우수합니다. SLANEXT는 이전 모델 SLANET 및 SLANET_PLUS와 비교하여 Vary-VIT-B를 시각적 인코더로 강력한 기능 표현 기능으로 사용하여 테이블 구조 인식의 정확도를 더욱 향상시킵니다.
실제 응용 분야에서 PP-TABLEMAGIC은 테이블을 직접 처리 할뿐만 아니라 맞춤형 모델 미세 조정을 통해 다양한 시나리오의 요구를 충족시킬 수 있습니다. 전통적인 엔드 투 엔드 테이블 인식 모델의 미세 조정과 비교할 때 PP-TableMagic의 멀티 모델 네트워킹 아키텍처를 사용하면 사용자가 주요 모델 만 미세 조정할 수 있으므로 "하나의 상승 및 다른 낙상"의 성능 문제를 피하고 데이터 주석의 작업량을 줄입니다. 또한 선임 개발자의 경우 PP-TABLEMAGIC의 아키텍처는 지점 수준 조정을 지원하며 특정 유형의 테이블 데이터에 대해 최적화 할 수있어 전반적인 인식 기능을 향상시킬 수 있습니다.
사용자가 빠르게 시작할 수 있도록 PP-TABLEMAGIC은 자세한 설치 안내서 및 사용 자습서를 제공합니다. 사용자는 Paddlex가 제공하는 Python API를 통해 모델을 쉽게 호출하고 테이블 인식 및 결과 내보내기를 수행 할 수 있습니다. 또한 PP-TABLEMAGIC은 고성능 추론, 서비스 기반 배포 및 종말 배포를 지원하여 다른 사용자의 요구를 충족시킬 수 있습니다. Baidu Paddlepaddle Team은 3 월 13 일 온라인 과정을 개최하여 PP-TABLEMAGIC의 기술적 세부 사항을 깊이 분석하고 산업 시나리오 실용 캠프를 열어 데이터 준비에서 모델 배포에 이르기까지 전체 개발 프로세스를 경험하게됩니다.
오픈 소스 주소 : https://github.com/paddlepaddle/paddlex/blob/3.0-rc/docs/pipeline_usage/tutorials/ocroc_pipelines/table_recognition_v2.md