Tentang
Repositori ini berisi aplikasi chatbot yang dibangun menggunakan StreamLit, Langchain, dan Chromadb, yang dirancang untuk memberikan informasi penting tentang COVID-19 berdasarkan konten file PDF. Chatbot menggunakan pendekatan pengambilan-agung-generasi (RAG), di mana informasi yang relevan diambil dari database vektor dan kemudian diproses oleh model bahasa untuk menghasilkan jawaban akhir.
Daftar isi
- Fitur
- Arsitektur
- Instalasi
- Penggunaan
- Penyebaran
- Kontribusi
- Futurework
Fitur
- Konsumsi PDF: Chatbot dapat menelan file PDF yang berisi informasi terkait COVID-19 dan membuat database vektor menggunakan ChromadB.
- PERTANYAAN PERTANYAAN: Pengguna dapat mengajukan pertanyaan terkait dengan COVID-19, dan chatbot akan mengambil informasi yang relevan dari database vektor dan menghasilkan respons menggunakan model bahasa.
- Antarmuka StreamLit: Chatbot memiliki antarmuka yang ramah pengguna yang dibangun dengan StreamLit, yang memungkinkan pengguna untuk berinteraksi dengan aplikasi melalui antarmuka berbasis web.
Arsitektur
Chatbot mengikuti pendekatan pengambilan-agung-generasi (RAG), yang menggabungkan teknik pengambilan dan pembuatan untuk memberikan jawaban yang akurat dan relevan. Arsitekturnya terdiri dari komponen berikut:
- Document Loader: Memuat file PDF dari folder buku dan membagi menjadi potongan teks yang lebih kecil.
- Database Vektor: Potongan teks dikonversi menjadi embeddings vektor menggunakan embeddings openai dan disimpan dalam database vektor chromadb.
- Pencarian Kesamaan: Ketika seorang pengguna mengajukan pertanyaan, potongan teks yang relevan diambil dari database vektor berdasarkan kesamaannya dengan pertanyaan.
- Model Bahasa: Potongan teks yang diambil diteruskan ke model bahasa (GPT-3.5-turbo) bersama dengan pertanyaan pengguna. Model ini menghasilkan jawaban akhir berdasarkan konteks yang disediakan.
- Antarmuka StreamLit: Antarmuka pengguna dibangun menggunakan StreamLit, memungkinkan pengguna untuk berinteraksi dengan chatbot melalui antarmuka berbasis web.
Instalasi
- Klon Repositri:
git clone https://github.com/saral7293/COVID-19-CHATBOT-Retrieval-Augmented-Generation-
- Arahkan ke Direktori Proyek:
cd COVID-19-CHATBOT-Retrieval-Augmented-Generation
- Instal dependensi yang diperlukan:
pip install -r requirements.txt
- Atur tombol API OpenAI Anda sebagai variabel lingkungan:
export OPENAI_API_KEY=your_openai_api_key
Penggunaan
Untuk menjalankan chatbot secara lokal menggunakan streamlit, jalankan perintah berikut:
Ini akan memulai aplikasi streamlit, dan Anda dapat berinteraksi dengan chatbot melalui antarmuka web.
Penyebaran
Chatbot ini telah digunakan pada instance EC2 dalam VM.
Kontribusi
Kontribusi dipersilakan! Jika Anda menemukan masalah atau ingin menambahkan fitur baru, silakan buka masalah atau kirimkan permintaan tarik.
Futurework
Sempurnakan chatbot dan terapkan teknik kain lanjutan.