pdf_extractor
1.0.0
นี่คือแอปพลิเคชัน Streamlit ที่ออกแบบมาสำหรับการแยกข้อมูลจากไฟล์ PDF มันใช้เทคโนโลยี Langchain สำหรับการสกัดข้อมูลที่มีประสิทธิภาพและให้อินเทอร์เฟซที่ใช้งานง่ายเพื่ออัปโหลดไฟล์ PDF แยกข้อมูลและแปลงข้อมูลที่แยกออกเป็นรูปแบบ CSV และ JSON
streamlit , pandasstreamlit run main.pyในการเริ่มต้นใช้งานตรวจสอบให้แน่ใจว่ามีการติดตั้ง Python และทำตามขั้นตอนเหล่านี้:
ติดตั้งการพึ่งพาที่จำเป็นโดยเรียกใช้คำสั่ง:
pip install -r requirements.txtเรียกใช้แอปพลิเคชัน Streamlit โดยดำเนินการ:
streamlit run main.pyแอปพลิเคชันใช้ประโยชน์จากเทคโนโลยี Langchain สำหรับการสกัดและประมวลผลข้อมูลที่มีประสิทธิภาพ
โครงการประกอบด้วยไฟล์หลักต่อไปนี้:
main.py : มีรหัสแอปพลิเคชัน Streamlitfunctions.py : รวมฟังก์ชั่นที่ออกแบบมาโดยเฉพาะสำหรับการแยกข้อมูลจากไฟล์ PDF