pdf_extractor
1.0.0
Ini adalah aplikasi streamlit yang dirancang untuk mengekstraksi data dari file PDF. Ini menggunakan teknologi Langchain untuk ekstraksi data yang efisien dan menyediakan antarmuka yang ramah pengguna untuk mengunggah file PDF, mengekstrak informasi, dan mengubah data yang diekstraksi menjadi format CSV dan JSON.
streamlit , pandas .streamlit run main.pyUntuk memulai, pastikan bahwa Python diinstal dan ikuti langkah -langkah ini:
Instal dependensi yang diperlukan dengan menjalankan perintah:
pip install -r requirements.txtJalankan aplikasi streamlit dengan mengeksekusi:
streamlit run main.pyAplikasi ini memanfaatkan teknologi langchain untuk ekstraksi dan pemrosesan data yang efisien.
Proyek ini terdiri dari file utama berikut:
main.py : Berisi kode aplikasi streamlit.functions.py : Termasuk fungsi yang dirancang khusus untuk ekstraksi data dari file PDF.