RAG based Intelligent Conversational AI Agent for Knowledge Extraction Using LangChain Gemini LLM - Agen AI Conversational Conversational Berbasis Rag untuk Ekstraksi Pengetahuan Menggunakan Langchain

RAG based Intelligent Conversational AI Agent for Knowledge Extraction Using LangChain Gemini LLM

Kode sumber lainnya

1.0.0

Unduh

Agen AI percakapan Cerdas Berbasis Rag untuk Ekstraksi Pengetahuan Menggunakan Langchain Gemini LLM

Di atas Google Colab berisi kode terperinci

Retrieval-Agusted Generation (RAG) adalah kerangka kerja yang menggabungkan pengambilan informasi dengan AI generatif. Ini memungkinkan model untuk mengambil informasi yang relevan dari sumber atau basis data eksternal dan menggunakan data itu untuk menghasilkan respons yang lebih akurat dan relevan secara kontekstual. Dengan memanfaatkan pengambilan dan generasi, RAG meningkatkan akurasi dan keandalan model AI, terutama dalam memberikan informasi terkini atau menangani pertanyaan kompleks.

Alur kerja

Proyek ini menyediakan asisten percakapan berbasis AI yang memanfaatkan generasi Pengambilan-Pengambilan (RAG) untuk mengekstraksi pengetahuan dari dokumen PDF. Sistem ini menggabungkan embeddings teks, pencarian vektor, dan LLM untuk memberikan jawaban atas pertanyaan pengguna. Di bawah ini adalah alur kerja langkah demi langkah terperinci tentang bagaimana aplikasi beroperasi:

1. Mengunggah dokumen PDF

Pengguna mengunggah file PDF melalui jalur yang menyebutkan di notebook. File yang diunggah diproses untuk mengekstrak teks menggunakan pdfplumber , pustaka Python untuk mengekstraksi teks dari PDFS.

2. Ekstraksi teks

Notebook menggunakan perpustakaan pdfplumber untuk mengekstrak teks mentah dari PDF yang diunggah. Setiap halaman dokumen diuraikan, dan teks yang dihasilkan disiapkan untuk pemrosesan lebih lanjut.

3. Teks chunking

Teks yang diekstraksi dibagi menjadi potongan -potongan yang lebih kecil menggunakan RecursiveCharacterTextSplitter . Ini memastikan konten dapat dikelola untuk embeddings dan pengambilan, biasanya dengan ukuran chunk 500 karakter dan tumpang tindih 50 karakter.

4. Generasi Embeddings

Teks yang dipotong dikonversi menjadi embeddings numerik menggunakan SpacyEmbeddings . Embeddings ini mewakili makna semantik dari potongan -potongan, memungkinkan pencarian yang efisien.

Gambar embeddings

5. Toko Vektor dengan Chroma

Database vektor dibuat menggunakan pustaka Chroma , di mana embeddings disimpan. Basis data vektor memungkinkan pengambilan informasi yang relevan dengan cepat dan efisien berdasarkan kueri pengguna.

6. Rantai Pengambilan Percakapan

ConversationalRetrievalChain didirikan menggunakan LangChain , menggabungkan embeddings yang disimpan di Chroma dengan buffer memori percakapan untuk melacak riwayat dan konteks obrolan.

7. Interaksi LLM

Notebook ini mengintegrasikan ChatGoogleGenerativeAI (Google Gemini LLM) untuk menghasilkan respons yang relevan dan cerdas terhadap pertanyaan pengguna berdasarkan potongan teks yang diambil dari toko vektor.

8. Kueri Pengguna dan Respons AI

Pengguna dapat memasukkan pertanyaan mereka tentang dokumen PDF yang diunggah, dan sistem merespons dengan mengambil potongan yang paling relevan dari toko vektor dan menghasilkan jawaban menggunakan LLM. Sejarah percakapan dilestarikan untuk konteks.

9. Tampilan riwayat percakapan

Fitur bagian yang dapat diperluas di mana pengguna dapat melihat riwayat percakapan. Transparansi ini memungkinkan pengguna untuk meninjau kembali kueri dan tanggapan masa lalu, menumbuhkan pemahaman yang lebih baik tentang konteks dan aliran interaksi.

Aliran kain dalam prosesnya

Diagram Aliran Rag

Pentingnya

Pengambilan Pengetahuan yang Efisien : Dengan memanfaatkan kekuatan Rag, sistem menggabungkan pengambilan dan generasi untuk menjawab pertanyaan spesifik secara akurat berdasarkan konten dokumen PDF yang diunggah.
Skalabilitas dan fleksibilitas : Dengan teks chunking dan embeddings, aplikasi ini dapat menangani dokumen besar sambil memastikan pengambilan informasi yang cepat dan tepat.
AI Conversational : Memori sejarah percakapan membuat sistem lebih interaktif, karena melacak pertanyaan dan jawaban sebelumnya, mempertahankan konteks selama percakapan yang panjang.
Integrasi Alat AI Modern : Proyek ini menunjukkan penggunaan alat canggih seperti Chroma untuk penyimpanan vektor, LangChain untuk manajemen percakapan, dan Google Gemini LLM untuk menghasilkan jawaban seperti manusia.

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-05-31
ukuran 4.64MB
Berasal dari Github

Aplikasi Terkait

TensorRT LLM

2024-11-10
OMS Agent for Linux

2024-11-06
Enhanced Blockchain Based Decentralized Public Auditing for Cloud Storage

2024-11-04
amazon ssm agent

2024-11-03
Retrieval based Voice Conversion WebUI

2024-11-01
Agen Rahasia HD

2022-08-02

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua