pdf_extractor
1.0.0
이것은 PDF 파일에서 데이터를 추출하도록 설계된 유선 응용 프로그램입니다. 효율적인 데이터 추출을 위해 Langchain 기술을 사용하고 사용자 친화적 인 인터페이스를 제공하여 PDF 파일을 업로드하고 정보를 추출하며 추출 된 데이터를 CSV 및 JSON 형식으로 변환합니다.
streamlit , pandas .streamlit run main.py 사용하여 Streamlit 응용 프로그램을 실행하십시오.시작하려면 Python이 설치되어 있는지 확인하고 다음을 수행하십시오.
명령을 실행하여 필요한 종속성을 설치하십시오.
pip install -r requirements.txt실행하여 간단한 응용 프로그램을 실행하십시오.
streamlit run main.py응용 프로그램은 효율적인 데이터 추출 및 처리를 위해 Langchain 기술을 활용합니다.
프로젝트는 다음 주요 파일로 구성됩니다.
main.py : 간소화 응용 프로그램 코드가 포함되어 있습니다.functions.py : PDF 파일의 데이터 추출을 위해 특별히 설계된 기능을 포함합니다.