
深度醫生是一個Python庫,它使用深度學習模型精心策劃了文檔提取和文檔佈局分析任務。它不能實現模型,而是使您能夠使用備受認可的對象檢測,OCR和選定的NLP任務構建管道,並為微調,評估和運行模型提供了集成的框架。對於更具體的文本處理任務,請使用許多其他出色的NLP庫之一。
深度醫生專注於應用,並為那些想解決與PDF或以各種圖像格式掃描相關的現實世界問題的人製作。
使用OCR在:擁抱:擁抱面孔空間中檢查文檔佈局分析管道的演示。
Deep Doctection提供了支持圖書館的模型包裝器,以將各種任務集成到管道中。它的核心功能不取決於任何特定的深度學習庫。目前支持以下任務的選定模型:
Deep Doctection提供了該方法,以對裁剪或調整大小和後處理結果等模型進行預處理的輸入,例如驗證重複輸出,將單詞與檢測到的佈局段或將單詞訂購為連續文本。您將獲得JSON格式的輸出,您可以自己自定義。
請查看筆記本回購中的簡介筆記本,以便簡單地開始。
檢查發行說明以獲取最新更新。
深度醫生或其支持庫提供的預培訓模型在大多數在擁抱面模型中心可用的情況下,或一旦要求就會自動下載。例如,您可以從TensorPack或Detectron2框架中找到預訓練的對象檢測模型,以進行粗線分析,表單元格檢測和表識別。
培訓是在某些特定領域準備好管道的重要組成部分,讓它成為文檔佈局分析,文檔分類或NER。 Deep Doction為基於從託管模型代碼的圖書館開發的培訓師提供培訓腳本。此外,深度醫生將代碼託管到一些已建立的數據集(如PublayNet) ,使其易於實驗。它還包含來自可可(Coco)等廣泛使用的數據格式的映射,並具有數據集框架(類似於數據集,因此在自定義數據集上的設置培訓變得非常容易。此筆記本電腦向您展示瞭如何執行此操作。
深度醫生配備了一個框架,可讓您評估管道中單個或多個模型的預測,以針對某些地面真相進行評估。再次在此處檢查如何完成。
設置管道後,您需要幾行代碼來實例化管道,在循環後,所有頁面都將通過管道處理。
import deepdoctection as dd
from IPython . core . display import HTML
from matplotlib import pyplot as plt
analyzer = dd . get_dd_analyzer () # instantiate the built-in analyzer similar to the Hugging Face space demo
df = analyzer . analyze ( path = "/path/to/your/doc.pdf" ) # setting up pipeline
df . reset_state () # Trigger some initialization
doc = iter ( df )
page = next ( doc )
image = page . viz ()
plt . figure ( figsize = ( 25 , 17 ))
plt . axis ( 'off' )
plt . imshow ( image )
HTML(page.tables[0].html)

print(page.text)

有一個廣泛的文檔,其中包含教程,設計概念和API。我們希望盡可能全面,理解。但是,我們知道,仍然有許多領域可以從清晰,語法和正確性方面進行重大改進。我們期待著提高文檔質量的所有提示和評論。

深度醫生層下面列出的概述中的所有內容都是必要的要求,必須單獨安裝。
Linux或MacOS。 (不支持Windows,但有一個Dockerfile)
Python> = 3.9
1.13 <= pytorch或2.11 <= tensorflow <2.16。 (對於較低的張量版本,代碼僅在GPU上運行)。通常,如果您想訓練或微調模型,則需要GPU。
關於深度學習框架,您必須在Tensorflow和Pytorch之間做出決定。
Tesseract OCR發動機將通過Python包裝器使用。核心發動機必須單獨安裝。
對於發行版, v.0.34.0及以下深度醫生使用Python包裝器以使Poppler將PDF文檔轉換為圖像。對於版本v.0.35.0 ,此依賴項將是可選的。
以下概述顯示了與DL框架結合使用的模型的可用性。
| 任務 | Pytorch | Torchscript | TensorFlow |
|---|---|---|---|
| 通過dentectron2/tensorpack進行佈局檢測 | ✅ | ✅(僅CPU) | ✅(僅GPU) |
| 通過檢測2/tensorpack識別表 | ✅ | ✅(僅CPU) | ✅(僅GPU) |
| 通過變壓器的表變壓器 | ✅ | ||
| 教義 | ✅ | ✅ | |
| Layoutlm(V1,V2,V3,XLM)通過變形金剛 | ✅ |
我們建議使用虛擬環境。您可以通過PIP或源安裝軟件包。
如果您想開始使用最少的設置(例如,使用默認配置運行深度醫生分析儀或嘗試“入門筆記本”),請使用
pip install deepdoctection
如果要使用TensorFlow框架,請單獨安裝TensorPack。將不會安裝DentectRon2,並且佈局模型/表識別模型將在CPU上使用Torchscript運行。
以下安裝將為您提供深度學習框架中的所有模型以及與TensorFlow/Pytorch無關的所有型號。請注意,依賴項非常複雜。不過,我們努力保持最新要求。
對於TensorFlow ,運行
pip install deepdoctection[tf]
對於Pytorch ,
首先安裝檢測2分別是通過PYPI分佈的。在此處檢查說明。然後運行
pip install deepdoctection[pt]
這將安裝深度醫生,並在深度醫生層上方列出的所有依賴項。如果要開始或要探索所有功能,請使用此設置。
如果您想對安裝有更多的控制權,並且正在尋找較少的依賴項,請僅使用基本設置安裝深度醫生。
pip install deepdoctection
這將忽略所有模型庫(圖表中的深度醫生層上方),您將負責自己安裝它們。請注意,您將無法使用此設置運行任何管道。
有關更多信息,請諮詢完整的安裝說明。
通過下載存儲庫或克隆
git clone https://github.com/deepdoctection/deepdoctection.git
要開始使用TensorFlow ,請運行:
cd deepdoctection
pip install ".[tf]"
從源安裝完整的pytorch設置還將為您安裝detectron2 :
cd deepdoctection
pip install ".[source-pt]"
從版本v.0.27.0開始,可以從Docker Hub下載預先存在的Docker圖像。
docker pull deepdoctection/deepdoctection:<release_tag>
要啟動容器,您可以使用Docker組成的文件./docker/pytorch-gpu/docker-compose.yaml 。在提供的.env文件中,指定應存儲深度醫生緩存的主機目錄。該目錄將安裝。此外,為要處理到容器中的安裝文件指定工作目錄。
docker compose up -d
將啟動容器。
我們感謝所有提供高質量代碼和預培訓模型的圖書館。沒有,就不可能開發此框架。
我們努力消除錯誤。我們還知道該代碼不是沒有問題的。我們歡迎與此倉庫相關的所有問題,並嘗試盡快解決它們。錯誤修復或增強功能將在每10到12週的新版本中部署。
...您可以通過使其更明顯地輕鬆支持該項目。留下明星或建議將有所幫助。
根據Apache 2.0許可分發。檢查許可證以獲取其他信息。