pdf_extractor
1.0.0
Il s'agit d'une application rationalisée conçue pour extraire des données à partir de fichiers PDF. Il utilise la technologie Langchain pour une extraction efficace de données et fournit une interface conviviale pour télécharger des fichiers PDF, extraire des informations et convertir les données extraites en formats CSV et JSON.
streamlit , pandas .streamlit run main.pyPour commencer, assurez-vous que Python est installé et suivez ces étapes:
Installez les dépendances nécessaires en exécutant la commande:
pip install -r requirements.txtExécutez l'application Streamlit en exécutant:
streamlit run main.pyL'application exploite la technologie Langchain pour une extraction et un traitement efficaces des données.
Le projet se compose des fichiers principaux suivants:
main.py : contient le code d'application Streamlit.functions.py : inclut des fonctions spécialement conçues pour l'extraction de données à partir des fichiers PDF.