pdf_extractor
1.0.0
Dies ist eine streamlit -Anwendung, die zum Extrahieren von Daten aus PDF -Dateien entwickelt wurde. Es wird Langchain-Technologie für die effiziente Datenextraktion verwendet und bietet eine benutzerfreundliche Schnittstelle zum Hochladen von PDF-Dateien, extrahierte Informationen und konvertierte die extrahierten Daten in CSV- und JSON-Formate.
streamlit , pandas .streamlit run main.py aus.Stellen Sie, dass Python installiert ist, und befolgen Sie diese Schritte:
Installieren Sie die erforderlichen Abhängigkeiten, indem Sie den Befehl ausführen:
pip install -r requirements.txtFühren Sie die Stromlit -Anwendung durch Ausführung aus:
streamlit run main.pyDie Anwendung nutzt die Langchain -Technologie für die effiziente Datenextraktion und -verarbeitung.
Das Projekt besteht aus den folgenden Hauptdateien:
main.py : Enthält den Streamlit -Anwendungscode.functions.py : Enthält Funktionen, die speziell für die Datenextraktion aus PDF -Dateien entwickelt wurden.