Descargar markdrop - Descargar el código fuente de markdrop

markdrop

Código Fuente de IA

1.0.0

Descargar

Markdrop

Un paquete Python para convertir PDF (o URL de PDF) para marcar mientras se extrae imágenes y tablas. MarkDrop facilita la convertir documentos PDF en formato de Markdown mientras preserva imágenes y tablas.

Características

La conversión de PDF a Markdown con la preservación de formato utilizando Docling
Extracción automática de imágenes con preservación de calidad utilizando ID XRef
Detección de tabla utilizando el transformador de tabla de Microsoft
Soporte de URL PDF para las tres funcionalidades anteriores
Descripciones descriptivas textuales para cualquier archivo o carpeta de imagen
Reconocimiento de caracteres ópticos (OCR) para imágenes con texto integrado
Soporte mejorado para formatos de salida estructurados (p. Ej., JSON, YAML)
Soporte para PDF de varios idiomas

Instalación

pip install markdrop

https://pypi.org/project/markdrop

Comienzo rápido

 from markdrop import extract_images , make_markdown , extract_tables_from_pdf

source_pdf = 'url/or/path/to/pdf/file'    # Replace with your local PDF file path or a URL
output_dir = 'data/output'                # Replace it with desired output directory's path

make_markdown ( source_pdf , output_dir )
extract_images ( source_pdf , output_dir , verbose = True )
extract_tables_from_pdf ( source_pdf , output_dir = output_dir )

 from markdrop import setup_keys

### API Key Setup
### If using 'openai' or 'gemini' as llm_client in the generate_descriptions function, you need to set up the API keys first.

setup_keys ()

 from markdrop import generate_descriptions

### Image Descriptions Generation

prompt = "Give textual highly detailed descriptions from this image ONLY, nothing else." # Replace it with your desired prompt
input_path = 'path/to/img_file/or/dir'    # Replace it with the path to the images dir or image file
output_dir = 'data/output'                # Replace it with the desired output directory's path
llm_clients = [ 'gemini' , 'llama-vision' ]        # Replace it with the desired models from ['qwen', 'gemini', 'openai', 'llama-vision', 'molmo', 'pixtral'] only

generate_descriptions ( input_path = input_path , output_dir = output_dir , prompt = prompt , llm_client = llm_clients )

Referencia de API

make_markdown (fuente, output_dir, verbose = false)

Convierte un PDF o su URL en formato de Markdown.

Parámetros:

source (STR): ruta a entrada pdf o URL
output_dir (str): ruta del directorio de salida
verbose (BOOL): Habilite el registro detallado

Extract_images (fuente, output_dir, verbose = false)

Extrae imágenes de PDF o su URL mientras mantiene la calidad.

Parámetros:

source (STR): ruta a entrada pdf o URL
output_dir (str): ruta del directorio de salida
verbose (BOOL): Habilite el registro detallado

Extract_tables_from_pdf (pdf_path, ** kwargs)

Detecta y extrae imágenes de tablas.

Parámetros:

pdf_path (STR): ruta a entrada PDF o URL
start_page (int, opcional): número de página inicial
end_page (int, opcional): número de página final
threshold (flotante, opcional): umbral de confianza de detección
output_dir (str): ruta del directorio de salida

Generate_Descriptions (input_path, output_dir, solicit, llm_client)

Genera la descripción de la (s) imagen (s) basada en la solicitud dada y llm_client en un CSV

llm clients admitidos son ['Qwen', 'Géminis', 'OpenAi', 'Llama-Vision', 'Molmo', 'Pixtral']

Parámetros:

input_path (str): ruta a entrada PDF o URL
output_dir (str): ruta del directorio de salida
prompt (STR): solicitado que se enviará al modelo junto con la imagen
llm_client (Lista): Lista que contiene un modelo mínimo de los clientes LLM

analze_pdf_images (fuente, output_dir, verbose = false):

Analizar diferentes tipos de referencias de imágenes en un PDF del archivo local o URL

Parámetros:

source (STR): ruta local o URL local a PDF
output_dir (str): directorio para archivos temporales
verbose (BOOL): Imprima información detallada

Que contribuye

¡Agradecemos las contribuciones! Consulte nuestras pautas de contribución para más detalles.

Configuración de desarrollo

Clon el repositorio:

git clone https://github.com/shoryasethia/markdrop.git  
cd markdrop

Crear un entorno virtual:

python -m venv venv  
source venv/bin/activate  # On Windows: venvScriptsactivate

Instalación de dependencias de desarrollo:

pip install -r requirements.txt

Estructura de proyectos

markdrop/  
├── LICENSE  
├── README.md  
├── CONTRIBUTING.md  
├── CHANGELOG.md  
├── requirements.txt  
├── setup.py  
└── markdrop/ 
    ├── models/
    |   ├── .env
    |   ├── img_descriptions.py
    |   ├── logger.py
    |   ├── model_loader.py
    |   ├── responder.py
    |   └── setup_keys.py
    ├── __init__.py  
    ├── main.py  
    ├── utils.py  
    ├── helper.py
    └── ignore_warnings.py