markdrop Download - markdrop исходный код скачать

markdrop

AI Исходный код

1.0.0

Скачать

Markdrop

Пакет Python для преобразования PDF (или PDF -URL -адресов) в размещение при извлечении изображений и таблиц. Markdrop позволяет легко конвертировать документы PDF в формат разметки при сохранении изображений и таблиц.

Функции

PDF в преобразование уценки с форматированием сохранения с использованием док
Автоматическое извлечение изображения с качественным сохранением с использованием XREF ID
Обнаружение таблицы с использованием трансформатора таблицы Microsoft
Поддержка URL -адреса PDF для трех функциональных возможностей
Текстовые описательные описания для любого файла или папки изображения
Оптическое распознавание символов (OCR) для изображений со встроенным текстом
Усиленная поддержка структурированных выходных форматов (например, JSON, YAML)
Поддержка многоязычных PDF

Установка

pip install markdrop

https://pypi.org/project/markdrop

Быстрый старт

 from markdrop import extract_images , make_markdown , extract_tables_from_pdf

source_pdf = 'url/or/path/to/pdf/file'    # Replace with your local PDF file path or a URL
output_dir = 'data/output'                # Replace it with desired output directory's path

make_markdown ( source_pdf , output_dir )
extract_images ( source_pdf , output_dir , verbose = True )
extract_tables_from_pdf ( source_pdf , output_dir = output_dir )

 from markdrop import setup_keys

### API Key Setup
### If using 'openai' or 'gemini' as llm_client in the generate_descriptions function, you need to set up the API keys first.

setup_keys ()

 from markdrop import generate_descriptions

### Image Descriptions Generation

prompt = "Give textual highly detailed descriptions from this image ONLY, nothing else." # Replace it with your desired prompt
input_path = 'path/to/img_file/or/dir'    # Replace it with the path to the images dir or image file
output_dir = 'data/output'                # Replace it with the desired output directory's path
llm_clients = [ 'gemini' , 'llama-vision' ]        # Replace it with the desired models from ['qwen', 'gemini', 'openai', 'llama-vision', 'molmo', 'pixtral'] only

generate_descriptions ( input_path = input_path , output_dir = output_dir , prompt = prompt , llm_client = llm_clients )

Ссылка на API

make_markdown (source, output_dir, verbose = false)

Преобразует PDF или его URL в формат разметки.

Параметры:

source (Str): Путь к вводу PDF или URL
output_dir (str): путь выходного каталога
verbose (bool): включить подробную регистрацию

extract_images (source, output_dir, verbose = false)

Извлекает изображения из PDF или его URL при сохранении качества.

Параметры:

source (Str): Путь к вводу PDF или URL
output_dir (str): путь выходного каталога
verbose (bool): включить подробную регистрацию

extract_tables_from_pdf (pdf_path, ** kwargs)

Обнаружает и извлекает изображения таблиц.

Параметры:

pdf_path (str): путь к вводу PDF или URL
start_page (int, необязательно): номер начальной страницы
end_page (int, необязательно): номер конца страницы
threshold (поплавок, необязательно): порог уверенности обнаружения
output_dir (str): путь выходного каталога

Generate_descriptions (input_path, output_dir, rasfor, llm_client)

Генерирует описание изображений (ы) на основе заданного приглашения и llm_client в CSV

Поддерживаемые llm clients являются [Qwen ',' Gemini ',' openai ',' llama-vision ',' molmo ',' pixtral ']

Параметры:

input_path (str): путь к вводу PDF или URL
output_dir (str): путь выходного каталога
prompt (Str): подсказка для отправки на модель вместе с изображением
llm_client (список): список, содержащий минимум одну модель от клиентов LLM

Analyze_pdf_images (source, output_dir, verbose = false):

Анализ различных типов ссылок на изображение в PDF из локального файла или URL

Параметры:

source (STR): локальный PDF -путь или URL -адрес PDF
output_dir (str): каталог для временных файлов
verbose (Bool): печатайте подробную информацию

Внося

Мы приветствуем вклад! Пожалуйста, смотрите наши рекомендации для получения подробной информации.

Настройка разработки

Клонировать репозиторий:

git clone https://github.com/shoryasethia/markdrop.git  
cd markdrop

Создайте виртуальную среду:

python -m venv venv  
source venv/bin/activate  # On Windows: venvScriptsactivate

Установить зависимости разработки:

pip install -r requirements.txt

Структура проекта

markdrop/  
├── LICENSE  
├── README.md  
├── CONTRIBUTING.md  
├── CHANGELOG.md  
├── requirements.txt  
├── setup.py  
└── markdrop/ 
    ├── models/
    |   ├── .env
    |   ├── img_descriptions.py
    |   ├── logger.py
    |   ├── model_loader.py
    |   ├── responder.py
    |   └── setup_keys.py
    ├── __init__.py  
    ├── main.py  
    ├── utils.py  
    ├── helper.py
    └── ignore_warnings.py