pdf_extractor
1.0.0
这是一个精简应用程序,旨在从PDF文件中提取数据。它利用Langchain技术进行有效的数据提取,并提供一个用户友好的接口来上传PDF文件,提取信息并将提取的数据转换为CSV和JSON格式。
streamlit , pandas 。streamlit run main.py简化应用程序。要开始,请确保安装Python并按照以下步骤操作:
通过运行命令来安装必要的依赖项:
pip install -r requirements.txt通过执行来运行简化应用程序:
streamlit run main.py该应用程序利用Langchain技术进行有效的数据提取和处理。
该项目由以下主要文件组成:
main.py :包含简化的应用程序代码。functions.py :包括专门为从PDF文件提取数据的功能。