pdf_extractor
1.0.0
Esta es una aplicación de transmisión diseñada para extraer datos de archivos PDF. Utiliza la tecnología Langchain para una extracción de datos eficiente y proporciona una interfaz fácil de usar para cargar archivos PDF, extraer información y convertir los datos extraídos en formatos CSV y JSON.
streamlit , pandas .streamlit run main.pyPara comenzar, asegúrese de que Python esté instalado y siga estos pasos:
Instale las dependencias necesarias ejecutando el comando:
pip install -r requirements.txtEjecute la aplicación Streamlit ejecutando:
streamlit run main.pyLa aplicación aprovecha la tecnología Langchain para extracción y procesamiento de datos eficientes.
El proyecto consta de los siguientes archivos principales:
main.py : contiene el código de aplicación de transmisión.functions.py : incluye funciones diseñadas específicamente para la extracción de datos de los archivos PDF.