deepdoctection下载 - deepdoctection源代码下载

deepdoctection

其他源码

v.0.37.3

下载

深度医生徽标

文档AI软件包

深度医生是一个Python库，它使用深度学习模型精心策划了文档提取和文档布局分析任务。它不能实现模型，而是使您能够使用备受认可的对象检测，OCR和选定的NLP任务构建管道，并为微调，评估和运行模型提供了集成的框架。对于更具体的文本处理任务，请使用许多其他出色的NLP库之一。

深度医生专注于应用，并为那些想解决与PDF或以各种图像格式扫描相关的现实世界问题的人制作。

使用OCR在：拥抱：拥抱面孔空间中检查文档布局分析管道的演示。

概述

Deep Doctection提供了支持图书馆的模型包装器，以将各种任务集成到管道中。它的核心功能不取决于任何特定的深度学习库。目前支持以下任务的选定模型：

文档布局分析，包括带有TensorPack的TensorFlow中的表识别，或带有detectron2的Pytorch，
OCR在Tesseract ， Doctr （可用的Tensorflow和Pytorch实现）的支持下，以及API的包装器，用于商业解决方案，
带有PDFLUMBER的本机PDF的文本挖掘，
使用FastText检测语言，
用jdeskew删除和旋转图像。
文档和令牌分类与变压器库提供的所有布局模型。（是的，您可以立即使用任何提供的OCR-OR PDFLUMBER工具使用任何Layoutlm模型！）。
具有表变换器的表检测和表结构识别。
有一个用于代币分类的小数据集，以及许多新的教程，如何使用Layoutlmv1，Layoutlmv2，LayoutXLM和Layoutlmv3训练和评估该数据集。
分析仪的全面配置，例如选择不同的模型，输出解析，OCR选择。检查此笔记本或文档以获取更多信息。
文档布局分析和表识别现在也使用Torchscript （CPU）运行，并且基本推断不再需要检测。
基于Tesseract和Doctr的文档旋转的更多角度预测指标
通过LILT通过变压器进行象征性分类。我们添加了一个模型包装器，用于使用LILT的令牌分类，并在模型目录中添加了一些LILT模型，看起来看起来很有希望，尤其是如果您想在非英语数据上训练模型。 Layoutlm的培训脚本也可以用于LILT。
[ new ]有两个可用的笔记本显示，如何基于尚未支持的第三方库编写自定义预测器，以及如何使用高级配置来获得布局段之间的链接，例如字幕，表格和表格或数字。

Deep Doctection提供了该方法，以对裁剪或调整大小和后处理结果等模型进行预处理的输入，例如验证重复输出，将单词与检测到的布局段或将单词订购为连续文本。您将获得JSON格式的输出，您可以自己自定义。

请查看笔记本回购中的简介笔记本，以便简单地开始。

检查发行说明以获取最新更新。

型号

深度医生或其支持库提供的预培训模型在大多数在拥抱面模型中心可用的情况下，或一旦要求就会自动下载。例如，您可以从TensorPack或Detectron2框架中找到预训练的对象检测模型，以进行粗线分析，表单元格检测和表识别。

数据集和培训脚本

培训是在某些特定领域准备好管道的重要组成部分，让它成为文档布局分析，文档分类或NER。 Deep Doction为基于从托管模型代码的图书馆开发的培训师提供培训脚本。此外，深度医生将代码托管到一些已建立的数据集（如PublayNet） ，使其易于实验。它还包含来自可可（Coco）等广泛使用的数据格式的映射，并具有数据集框架（类似于数据集，因此在自定义数据集上的设置培训变得非常容易。此笔记本电脑向您展示了如何执行此操作。

评估

深度医生配备了一个框架，可让您评估管道中单个或多个模型的预测，以针对某些地面真相进行评估。再次在此处检查如何完成。

推理

设置管道后，您需要几行代码来实例化管道，在循环后，所有页面都将通过管道处理。

 import deepdoctection as dd
from IPython . core . display import HTML
from matplotlib import pyplot as plt

analyzer = dd . get_dd_analyzer ()  # instantiate the built-in analyzer similar to the Hugging Face space demo

df = analyzer . analyze ( path = "/path/to/your/doc.pdf" )  # setting up pipeline
df . reset_state ()                 # Trigger some initialization

doc = iter ( df )
page = next ( doc ) 

image = page . viz ()
plt . figure ( figsize = ( 25 , 17 ))
plt . axis ( 'off' )
plt . imshow ( image )

 HTML(page.tables[0].html)

 print(page.text)

文档

有一个广泛的文档，其中包含教程，设计概念和API。我们希望尽可能全面，理解。但是，我们知道，仍然有许多领域可以从清晰，语法和正确性方面进行重大改进。我们期待着提高文档质量的所有提示和评论。

要求

深度医生层下面列出的概述中的所有内容都是必要的要求，必须单独安装。

Linux或MacOS。（不支持Windows，但有一个Dockerfile）
Python> = 3.9
1.13 <= pytorch或2.11 <= tensorflow <2.16。（对于较低的张量版本，代码仅在GPU上运行）。通常，如果您想训练或微调模型，则需要GPU。
关于深度学习框架，您必须在Tensorflow和Pytorch之间做出决定。
Tesseract OCR发动机将通过Python包装器使用。核心发动机必须单独安装。
对于发行版， v.0.34.0及以下深度医生使用Python包装器以使Poppler将PDF文档转换为图像。对于版本v.0.35.0 ，此依赖项将是可选的。

以下概述显示了与DL框架结合使用的模型的可用性。

任务	Pytorch	Torchscript	张量
通过dentectron2/tensorpack进行布局检测	✅	✅（仅CPU）	✅（仅GPU）
通过检测2/tensorpack识别表	✅	✅（仅CPU）	✅（仅GPU）
通过变压器的表变压器	✅
教义	✅		✅
Layoutlm（V1，V2，V3，XLM）通过变形金刚	✅

安装

我们建议使用虚拟环境。您可以通过PIP或源安装软件包。

与PIPI的PIP一起安装

最小安装

如果您想开始使用最少的设置（例如，使用默认配置运行深度医生分析仪或尝试“入门笔记本”），请使用

 pip install deepdoctection

如果要使用TensorFlow框架，请单独安装TensorPack。将不会安装DentectRon2，并且布局模型/表识别模型将在CPU上使用Torchscript运行。

完整安装

以下安装将为您提供深度学习框架中的所有模型以及与TensorFlow/Pytorch无关的所有型号。请注意，依赖项非常复杂。不过，我们努力保持最新要求。

对于TensorFlow ，运行

 pip install deepdoctection[tf]

对于Pytorch ，

首先安装检测2分别是通过PYPI分布的。在此处检查说明。然后运行

 pip install deepdoctection[pt]

这将安装深度医生，并在深度医生层上方列出的所有依赖项。如果要开始或要探索所有功能，请使用此设置。

如果您想对安装有更多的控制权，并且正在寻找较少的依赖项，请仅使用基本设置安装深度医生。

 pip install deepdoctection

这将忽略所有模型库（图表中的深度医生层上方），您将负责自己安装它们。请注意，您将无法使用此设置运行任何管道。

有关更多信息，请咨询完整的安装说明。

从源安装

通过下载存储库或克隆

 git clone https://github.com/deepdoctection/deepdoctection.git

要开始使用TensorFlow ，请运行：

 cd deepdoctection
pip install ".[tf]"

从源安装完整的pytorch设置还将为您安装detectron2 ：

 cd deepdoctection
pip install ".[source-pt]"

从Docker Hub运行Docker容器

从版本v.0.27.0开始，可以从Docker Hub下载预先存在的Docker图像。

 docker pull deepdoctection/deepdoctection:<release_tag>

要启动容器，您可以使用Docker组成的文件./docker/pytorch-gpu/docker-compose.yaml 。在提供的.env文件中，指定应存储深度医生缓存的主机目录。该目录将安装。此外，为要处理到容器中的安装文件指定工作目录。

 docker compose up -d

将启动容器。

学分

我们感谢所有提供高质量代码和预培训模型的图书馆。没有，就不可能开发此框架。

问题

我们努力消除错误。我们还知道该代码不是没有问题的。我们欢迎与此仓库相关的所有问题，并尝试尽快解决它们。错误修复或增强功能将在每10到12周的新版本中部署。

如果您喜欢深层医生...

...您可以通过使其更明显地轻松支持该项目。留下明星或建议将有所帮助。

执照

根据Apache 2.0许可分发。检查许可证以获取其他信息。

展开

附加信息

版本 v.0.37.3
类型其他源码
更新时间 2025-04-17
大小 15.52MB
来自于 Github

deepdoctection

文档AI软件包

概述

型号

数据集和培训脚本

评估

推理

文档

要求

安装

与PIPI的PIP一起安装

最小安装

完整安装

从源安装

从Docker Hub运行Docker容器

学分

问题

如果您喜欢深层医生...

执照

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express