pdf_extractor
1.0.0
Это приложение Streamlit, предназначенное для извлечения данных из PDF -файлов. Он использует технологию Langchain для эффективного извлечения данных и предоставляет удобный интерфейс для загрузки PDF-файлов, извлечения информации и преобразования извлеченных данных в форматы CSV и JSON.
streamlit , pandas .streamlit run main.pyЧтобы начать, убедитесь, что Python установлен и выполняйте эти шаги:
Установите необходимые зависимости, выполнив команду:
pip install -r requirements.txtЗапустите приложение Streamlit, выполнив:
streamlit run main.pyПриложение использует технологию Langchain для эффективного извлечения и обработки данных.
Проект состоит из следующих основных файлов:
main.py : содержит код приложения Streamlit.functions.py : включает функции, специально разработанные для извлечения данных из файлов PDF.