Aplikasi Obrolan MultipDF adalah aplikasi Python yang memungkinkan Anda untuk mengobrol dengan beberapa dokumen PDF. Anda dapat mengajukan pertanyaan tentang PDF menggunakan bahasa alami, dan aplikasi akan memberikan tanggapan yang relevan berdasarkan konten dokumen. Aplikasi ini menggunakan model bahasa untuk menghasilkan jawaban yang akurat untuk pertanyaan Anda. Harap dicatat bahwa aplikasi hanya akan menanggapi pertanyaan yang terkait dengan PDF yang dimuat.

Pemuatan PDF: Aplikasi membaca beberapa dokumen PDF dan mengekstrak konten teks mereka.
Teks Chunking: Teks yang diekstraksi dibagi menjadi potongan -potongan kecil yang dapat diproses secara efektif.
Model Bahasa: Aplikasi menggunakan model bahasa untuk menghasilkan representasi vektor (embeddings) dari potongan teks.
Pencocokan Kesamaan: Ketika Anda mengajukan pertanyaan, aplikasi membandingkannya dengan potongan teks dan mengidentifikasi yang paling serupa secara semantik.
Generasi respons: Potongan yang dipilih diteruskan ke model bahasa, yang menghasilkan respons berdasarkan konten yang relevan dari PDF.
Untuk menginstal aplikasi obrolan multipdf, ikuti langkah -langkah ini:
- pip install -r requirements.txt- OPENAI_API_KEY=your_secrit_api_key