
深度医生是一个Python库,它使用深度学习模型精心策划了文档提取和文档布局分析任务。它不能实现模型,而是使您能够使用备受认可的对象检测,OCR和选定的NLP任务构建管道,并为微调,评估和运行模型提供了集成的框架。对于更具体的文本处理任务,请使用许多其他出色的NLP库之一。
深度医生专注于应用,并为那些想解决与PDF或以各种图像格式扫描相关的现实世界问题的人制作。
使用OCR在:拥抱:拥抱面孔空间中检查文档布局分析管道的演示。
Deep Doctection提供了支持图书馆的模型包装器,以将各种任务集成到管道中。它的核心功能不取决于任何特定的深度学习库。目前支持以下任务的选定模型:
Deep Doctection提供了该方法,以对裁剪或调整大小和后处理结果等模型进行预处理的输入,例如验证重复输出,将单词与检测到的布局段或将单词订购为连续文本。您将获得JSON格式的输出,您可以自己自定义。
请查看笔记本回购中的简介笔记本,以便简单地开始。
检查发行说明以获取最新更新。
深度医生或其支持库提供的预培训模型在大多数在拥抱面模型中心可用的情况下,或一旦要求就会自动下载。例如,您可以从TensorPack或Detectron2框架中找到预训练的对象检测模型,以进行粗线分析,表单元格检测和表识别。
培训是在某些特定领域准备好管道的重要组成部分,让它成为文档布局分析,文档分类或NER。 Deep Doction为基于从托管模型代码的图书馆开发的培训师提供培训脚本。此外,深度医生将代码托管到一些已建立的数据集(如PublayNet) ,使其易于实验。它还包含来自可可(Coco)等广泛使用的数据格式的映射,并具有数据集框架(类似于数据集,因此在自定义数据集上的设置培训变得非常容易。此笔记本电脑向您展示了如何执行此操作。
深度医生配备了一个框架,可让您评估管道中单个或多个模型的预测,以针对某些地面真相进行评估。再次在此处检查如何完成。
设置管道后,您需要几行代码来实例化管道,在循环后,所有页面都将通过管道处理。
import deepdoctection as dd
from IPython . core . display import HTML
from matplotlib import pyplot as plt
analyzer = dd . get_dd_analyzer () # instantiate the built-in analyzer similar to the Hugging Face space demo
df = analyzer . analyze ( path = "/path/to/your/doc.pdf" ) # setting up pipeline
df . reset_state () # Trigger some initialization
doc = iter ( df )
page = next ( doc )
image = page . viz ()
plt . figure ( figsize = ( 25 , 17 ))
plt . axis ( 'off' )
plt . imshow ( image )
HTML(page.tables[0].html)

print(page.text)

有一个广泛的文档,其中包含教程,设计概念和API。我们希望尽可能全面,理解。但是,我们知道,仍然有许多领域可以从清晰,语法和正确性方面进行重大改进。我们期待着提高文档质量的所有提示和评论。

深度医生层下面列出的概述中的所有内容都是必要的要求,必须单独安装。
Linux或MacOS。 (不支持Windows,但有一个Dockerfile)
Python> = 3.9
1.13 <= pytorch或2.11 <= tensorflow <2.16。 (对于较低的张量版本,代码仅在GPU上运行)。通常,如果您想训练或微调模型,则需要GPU。
关于深度学习框架,您必须在Tensorflow和Pytorch之间做出决定。
Tesseract OCR发动机将通过Python包装器使用。核心发动机必须单独安装。
对于发行版, v.0.34.0及以下深度医生使用Python包装器以使Poppler将PDF文档转换为图像。对于版本v.0.35.0 ,此依赖项将是可选的。
以下概述显示了与DL框架结合使用的模型的可用性。
| 任务 | Pytorch | Torchscript | 张量 |
|---|---|---|---|
| 通过dentectron2/tensorpack进行布局检测 | ✅ | ✅(仅CPU) | ✅(仅GPU) |
| 通过检测2/tensorpack识别表 | ✅ | ✅(仅CPU) | ✅(仅GPU) |
| 通过变压器的表变压器 | ✅ | ||
| 教义 | ✅ | ✅ | |
| Layoutlm(V1,V2,V3,XLM)通过变形金刚 | ✅ |
我们建议使用虚拟环境。您可以通过PIP或源安装软件包。
如果您想开始使用最少的设置(例如,使用默认配置运行深度医生分析仪或尝试“入门笔记本”),请使用
pip install deepdoctection
如果要使用TensorFlow框架,请单独安装TensorPack。将不会安装DentectRon2,并且布局模型/表识别模型将在CPU上使用Torchscript运行。
以下安装将为您提供深度学习框架中的所有模型以及与TensorFlow/Pytorch无关的所有型号。请注意,依赖项非常复杂。不过,我们努力保持最新要求。
对于TensorFlow ,运行
pip install deepdoctection[tf]
对于Pytorch ,
首先安装检测2分别是通过PYPI分布的。在此处检查说明。然后运行
pip install deepdoctection[pt]
这将安装深度医生,并在深度医生层上方列出的所有依赖项。如果要开始或要探索所有功能,请使用此设置。
如果您想对安装有更多的控制权,并且正在寻找较少的依赖项,请仅使用基本设置安装深度医生。
pip install deepdoctection
这将忽略所有模型库(图表中的深度医生层上方),您将负责自己安装它们。请注意,您将无法使用此设置运行任何管道。
有关更多信息,请咨询完整的安装说明。
通过下载存储库或克隆
git clone https://github.com/deepdoctection/deepdoctection.git
要开始使用TensorFlow ,请运行:
cd deepdoctection
pip install ".[tf]"
从源安装完整的pytorch设置还将为您安装detectron2 :
cd deepdoctection
pip install ".[source-pt]"
从版本v.0.27.0开始,可以从Docker Hub下载预先存在的Docker图像。
docker pull deepdoctection/deepdoctection:<release_tag>
要启动容器,您可以使用Docker组成的文件./docker/pytorch-gpu/docker-compose.yaml 。在提供的.env文件中,指定应存储深度医生缓存的主机目录。该目录将安装。此外,为要处理到容器中的安装文件指定工作目录。
docker compose up -d
将启动容器。
我们感谢所有提供高质量代码和预培训模型的图书馆。没有,就不可能开发此框架。
我们努力消除错误。我们还知道该代码不是没有问题的。我们欢迎与此仓库相关的所有问题,并尝试尽快解决它们。错误修复或增强功能将在每10到12周的新版本中部署。
...您可以通过使其更明显地轻松支持该项目。留下明星或建议将有所帮助。
根据Apache 2.0许可分发。检查许可证以获取其他信息。