deepdoctection下載 - deepdoctection源代碼下載

deepdoctection

其他源碼

v.0.37.3

下載

深度醫生徽標

文檔AI軟件包

深度醫生是一個Python庫，它使用深度學習模型精心策劃了文檔提取和文檔佈局分析任務。它不能實現模型，而是使您能夠使用備受認可的對象檢測，OCR和選定的NLP任務構建管道，並為微調，評估和運行模型提供了集成的框架。對於更具體的文本處理任務，請使用許多其他出色的NLP庫之一。

深度醫生專注於應用，並為那些想解決與PDF或以各種圖像格式掃描相關的現實世界問題的人製作。

使用OCR在：擁抱：擁抱面孔空間中檢查文檔佈局分析管道的演示。

概述

Deep Doctection提供了支持圖書館的模型包裝器，以將各種任務集成到管道中。它的核心功能不取決於任何特定的深度學習庫。目前支持以下任務的選定模型：

文檔佈局分析，包括帶有TensorPack的TensorFlow中的表識別，或帶有detectron2的Pytorch，
OCR在Tesseract ， Doctr （可用的Tensorflow和Pytorch實現）的支持下，以及API的包裝器，用於商業解決方案，
帶有PDFLUMBER的本機PDF的文本挖掘，
使用FastText檢測語言，
用jdeskew刪除和旋轉圖像。
文檔和令牌分類與變壓器庫提供的所有佈局模型。（是的，您可以立即使用任何提供的OCR-OR PDFLUMBER工具使用任何Layoutlm模型！）。
具有表變換器的表檢測和表結構識別。
有一個用於代幣分類的小數據集，以及許多新的教程，如何使用Layoutlmv1，Layoutlmv2，LayoutXLM和Layoutlmv3訓練和評估該數據集。
分析儀的全面配置，例如選擇不同的模型，輸出解析，OCR選擇。檢查此筆記本或文檔以獲取更多信息。
文檔佈局分析和表識別現在也使用Torchscript （CPU）運行，並且基本推斷不再需要檢測。
基於Tesseract和Doctr的文檔旋轉的更多角度預測指標
通過LILT通過變壓器進行象徵性分類。我們添加了一個模型包裝器，用於使用LILT的令牌分類，並在模型目錄中添加了一些LILT模型，看起來看起來很有希望，尤其是如果您想在非英語數據上訓練模型。 Layoutlm的培訓腳本也可以用於LILT。
[ new ]有兩個可用的筆記本顯示，如何基於尚未支持的第三方庫編寫自定義預測器，以及如何使用高級配置來獲得佈局段之間的鏈接，例如字幕，表格和表格或數字。

Deep Doctection提供了該方法，以對裁剪或調整大小和後處理結果等模型進行預處理的輸入，例如驗證重複輸出，將單詞與檢測到的佈局段或將單詞訂購為連續文本。您將獲得JSON格式的輸出，您可以自己自定義。

請查看筆記本回購中的簡介筆記本，以便簡單地開始。

檢查發行說明以獲取最新更新。

型號

深度醫生或其支持庫提供的預培訓模型在大多數在擁抱面模型中心可用的情況下，或一旦要求就會自動下載。例如，您可以從TensorPack或Detectron2框架中找到預訓練的對象檢測模型，以進行粗線分析，表單元格檢測和表識別。

數據集和培訓腳本

培訓是在某些特定領域準備好管道的重要組成部分，讓它成為文檔佈局分析，文檔分類或NER。 Deep Doction為基於從託管模型代碼的圖書館開發的培訓師提供培訓腳本。此外，深度醫生將代碼託管到一些已建立的數據集（如PublayNet） ，使其易於實驗。它還包含來自可可（Coco）等廣泛使用的數據格式的映射，並具有數據集框架（類似於數據集，因此在自定義數據集上的設置培訓變得非常容易。此筆記本電腦向您展示瞭如何執行此操作。

評估

深度醫生配備了一個框架，可讓您評估管道中單個或多個模型的預測，以針對某些地面真相進行評估。再次在此處檢查如何完成。

推理

設置管道後，您需要幾行代碼來實例化管道，在循環後，所有頁面都將通過管道處理。

 import deepdoctection as dd
from IPython . core . display import HTML
from matplotlib import pyplot as plt

analyzer = dd . get_dd_analyzer ()  # instantiate the built-in analyzer similar to the Hugging Face space demo

df = analyzer . analyze ( path = "/path/to/your/doc.pdf" )  # setting up pipeline
df . reset_state ()                 # Trigger some initialization

doc = iter ( df )
page = next ( doc ) 

image = page . viz ()
plt . figure ( figsize = ( 25 , 17 ))
plt . axis ( 'off' )
plt . imshow ( image )

 HTML(page.tables[0].html)

 print(page.text)

文件

有一個廣泛的文檔，其中包含教程，設計概念和API。我們希望盡可能全面，理解。但是，我們知道，仍然有許多領域可以從清晰，語法和正確性方面進行重大改進。我們期待著提高文檔質量的所有提示和評論。

要求

深度醫生層下面列出的概述中的所有內容都是必要的要求，必須單獨安裝。

Linux或MacOS。（不支持Windows，但有一個Dockerfile）
Python> = 3.9
1.13 <= pytorch或2.11 <= tensorflow <2.16。（對於較低的張量版本，代碼僅在GPU上運行）。通常，如果您想訓練或微調模型，則需要GPU。
關於深度學習框架，您必須在Tensorflow和Pytorch之間做出決定。
Tesseract OCR發動機將通過Python包裝器使用。核心發動機必須單獨安裝。
對於發行版， v.0.34.0及以下深度醫生使用Python包裝器以使Poppler將PDF文檔轉換為圖像。對於版本v.0.35.0 ，此依賴項將是可選的。

以下概述顯示了與DL框架結合使用的模型的可用性。

任務	Pytorch	Torchscript	TensorFlow
通過dentectron2/tensorpack進行佈局檢測	✅	✅（僅CPU）	✅（僅GPU）
通過檢測2/tensorpack識別表	✅	✅（僅CPU）	✅（僅GPU）
通過變壓器的表變壓器	✅
教義	✅		✅
Layoutlm（V1，V2，V3，XLM）通過變形金剛	✅

安裝

我們建議使用虛擬環境。您可以通過PIP或源安裝軟件包。

與PIPI的PIP一起安裝

最小安裝

如果您想開始使用最少的設置（例如，使用默認配置運行深度醫生分析儀或嘗試“入門筆記本”），請使用

 pip install deepdoctection

如果要使用TensorFlow框架，請單獨安裝TensorPack。將不會安裝DentectRon2，並且佈局模型/表識別模型將在CPU上使用Torchscript運行。

完整安裝

以下安裝將為您提供深度學習框架中的所有模型以及與TensorFlow/Pytorch無關的所有型號。請注意，依賴項非常複雜。不過，我們努力保持最新要求。

對於TensorFlow ，運行

 pip install deepdoctection[tf]

對於Pytorch ，

首先安裝檢測2分別是通過PYPI分佈的。在此處檢查說明。然後運行

 pip install deepdoctection[pt]

這將安裝深度醫生，並在深度醫生層上方列出的所有依賴項。如果要開始或要探索所有功能，請使用此設置。

如果您想對安裝有更多的控制權，並且正在尋找較少的依賴項，請僅使用基本設置安裝深度醫生。

 pip install deepdoctection

這將忽略所有模型庫（圖表中的深度醫生層上方），您將負責自己安裝它們。請注意，您將無法使用此設置運行任何管道。

有關更多信息，請諮詢完整的安裝說明。

從源安裝

通過下載存儲庫或克隆

 git clone https://github.com/deepdoctection/deepdoctection.git

要開始使用TensorFlow ，請運行：

 cd deepdoctection
pip install ".[tf]"

從源安裝完整的pytorch設置還將為您安裝detectron2 ：

 cd deepdoctection
pip install ".[source-pt]"

從Docker Hub運行Docker容器

從版本v.0.27.0開始，可以從Docker Hub下載預先存在的Docker圖像。

 docker pull deepdoctection/deepdoctection:<release_tag>

要啟動容器，您可以使用Docker組成的文件./docker/pytorch-gpu/docker-compose.yaml 。在提供的.env文件中，指定應存儲深度醫生緩存的主機目錄。該目錄將安裝。此外，為要處理到容器中的安裝文件指定工作目錄。

 docker compose up -d

將啟動容器。

學分

我們感謝所有提供高質量代碼和預培訓模型的圖書館。沒有，就不可能開發此框架。

問題

我們努力消除錯誤。我們還知道該代碼不是沒有問題的。我們歡迎與此倉庫相關的所有問題，並嘗試盡快解決它們。錯誤修復或增強功能將在每10到12週的新版本中部署。

如果您喜歡深層醫生...

...您可以通過使其更明顯地輕鬆支持該項目。留下明星或建議將有所幫助。

執照

根據Apache 2.0許可分發。檢查許可證以獲取其他信息。

展開

附加信息

版本 v.0.37.3
類型其他源碼
更新時間 2025-04-17
大小 15.52MB
來自於 Github

相關應用

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

爲您推薦

chat.petals.dev

其他源碼

1.0.0
GPT Prompt Templates

其他源碼

1.0.0
GPTyped

其他源碼

GPTyped 1.0.5
Google Dorks

其他源碼

1.0
shepherd

其他源碼

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

其他源碼

v1.1.0-rc-3
Google Dorks

其他源碼

1.0
shepherd

其他源碼

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

其他源碼

v1.1.0-rc-3

相關資訊全部