Proyek ini memanfaatkan agen AI untuk ekstraksi dan pemrosesan data otomatis. Sistem ini memungkinkan pengguna untuk mengunggah file CSV atau terhubung ke lembar Google, kemudian berinteraksi dengan data menggunakan kueri bahasa alami. Agen menghasilkan kode Python berdasarkan kueri, menjalankan kode untuk memanipulasi data, dan menyajikan hasil dalam berbagai format seperti tabel, plot, atau string, atau menggosok data yang berguna untuk file Anda.
Untuk menjalankan proyek ini, Anda membutuhkan Python 3.7 atau lebih baru. Proyek ini menggunakan beberapa pustaka pihak ketiga yang dapat diinstal melalui PIP.
git clone https://github.com/UjjawalGusain/CheatSheet-Langchain-Project.git
cd Langchain-Web-Agent python3 -m venv venv
source venv/bin/activate # On Windows, use `venvScriptsactivate`
pip install -r requirements.txtSiapkan Google Sheets API:
Jalankan aplikasi:
streamlit run dashboard.pySetelah menjalankan perintah ini, aplikasi akan dimulai, dan Anda dapat mengaksesnya melalui browser Anda.
Proyek ini menggunakan beberapa API untuk menangani operasi yang berbeda, termasuk pengikis data dan interaksi dengan model. API terintegrasi adalah:
API GROQ:
Model: llama-3.1-70b-versatile
TUJUAN: API GROQ digunakan untuk berinteraksi dengan model bahasa besar untuk menghasilkan respons, menjalankan operasi pada dataset, dan menangani pertanyaan kompleks. Model LLAMA-3.1-70B-Versatile digunakan untuk pemahaman dan pembangkitan bahasa alami yang efisien, membantu memproses permintaan dan menghasilkan hasil yang dapat ditindaklanjuti.
Penggunaan:
API dipanggil untuk memproses kueri yang terkait dengan data, termasuk operasi seperti ekstraksi, penyaringan, dan menghasilkan ringkasan. Respons dari model membantu dalam membentuk operasi yang diterapkan pada dataset.
Prompt yang digunakan untuk model disusun dalam format tertentu untuk memastikan respons yang diinginkan dan menghindari kesalahan selama eksekusi.
API Scraper:
Tujuan: API Scraper digunakan untuk mengumpulkan data tambahan dari sumber eksternal dan menambahkan data ini ke dataset.
Penggunaan:
Pilih sumber data dari bilah samping: baik unggah CSV atau hubungkan Google Sheets.
Masukkan kueri:
Lihat Hasil:
Pemformatan dan kompleksitas yang cepat: Tantangan yang signifikan adalah memastikan bahwa petunjuk yang diteruskan ke model diformat dengan benar dan ditangani oleh sistem. Model yang diperlukan untuk menghasilkan respons yang akurat berdasarkan struktur dan kompleksitas kueri. Penting juga untuk mempertahankan kejelasan dan konsistensi dalam cara informasi diekstraksi dan disajikan kepada pengguna, terutama dengan kueri yang kompleks.
Mengelola risiko keamanan dengan LLMS: Memanfaatkan model bahasa besar (LLM) memperkenalkan risiko keamanan potensial, terutama mengenai privasi data dan penanganan informasi sensitif. Memastikan bahwa tidak ada data rahasia atau pribadi yang secara tidak sengaja terpapar saat berinteraksi dengan model adalah aspek penting dari proses pengembangan. Kami harus menerapkan perlindungan untuk meminimalkan risiko ini saat menggunakan LLM untuk menghasilkan kode dan memproses data.