RAG based Intelligent Conversational AI Agent for Knowledge Extraction Using LangChain Gemini LLM Descarga - Agente inteligente de IA conversacional inteligente basado en trapo para extracción de cono

RAG based Intelligent Conversational AI Agent for Knowledge Extraction Using LangChain Gemini LLM

Otro código fuente

1.0.0

Descargar

Agente de IA conversacional inteligente basado en trapo para extracción de conocimiento utilizando Langchain Gemini LLM

En el anterior, Google Colab contiene código detallado

La generación de recuperación aumentada (RAG) es un marco que combina la recuperación de información con IA generativa. Permite que los modelos recuperen información relevante de fuentes o bases de datos externas y usen esos datos para generar respuestas más precisas y contextualmente relevantes. Al aprovechar tanto la recuperación como la generación, RAG mejora la precisión y confiabilidad de los modelos de IA, particularmente en proporcionar información actualizada o manejar preguntas complejas.

Flujo de trabajo

Este proyecto proporciona un asistente de conversación basado en IA que aprovecha la generación de recuperación acuática (RAG) para extraer conocimiento de los documentos PDF. El sistema combina insertos de texto, búsqueda vectorial y un LLM para proporcionar respuestas a las preguntas del usuario. A continuación se muestra un flujo de trabajo detallado paso a paso de cómo funciona la aplicación:

1. Subiendo el documento PDF

Los usuarios cargan un archivo PDF a través de la ruta que menciona en el cuaderno. El archivo cargado se procesa para extraer el texto usando pdfplumber , una biblioteca de Python para extraer texto de PDFS.

2. Extracción de texto

El cuaderno utiliza la biblioteca pdfplumber para extraer texto sin procesar del PDF cargado. Cada página del documento se analiza y el texto resultante se prepara para su posterior procesamiento.

3. Coloque de texto

El texto extraído se divide en trozos más pequeños utilizando RecursiveCharacterTextSplitter . Esto asegura que el contenido sea manejable para incrustaciones y recuperación, generalmente con un tamaño de fragmento de 500 caracteres y una superposición de 50 caracteres.

4. Generación de incrustaciones

El texto fragmentado se convierte en embebidos numéricos utilizando SpacyEmbeddings . Estas incrustaciones representan el significado semántico de los trozos, lo que permite una búsqueda eficiente.

Imagen de incrustaciones

5. tienda vectorial con croma

Se crea una base de datos vectorial utilizando la biblioteca Chroma , donde se almacenan los incrustaciones. La base de datos de Vector permite una recuperación rápida y eficiente de la información relevante basada en consultas de usuarios.

6. cadena de recuperación de conversación

La ConversationalRetrievalChain se establece utilizando LangChain , combinando los incrustaciones almacenados en Chroma con un búfer de memoria conversacional para rastrear el historial y el contexto del chat.

7. Interacción LLM

El cuaderno integra el ChatGoogleGenerativeAI (Gemini LLM de Google) para generar respuestas relevantes e inteligentes a las preguntas del usuario basadas en los fragmentos de texto recuperados de la tienda Vector.

8. Consulta de usuario y respuesta de IA

Los usuarios pueden ingresar sus preguntas sobre el documento PDF cargado, y el sistema responde recuperando los fragmentos más relevantes de la tienda Vector y generando una respuesta utilizando el LLM. El historial de conversación se conserva para el contexto.

9. Muestra de historial de conversación

Las características de una sección expandible donde los usuarios pueden ver el historial de conversación. Esta transparencia permite a los usuarios revisar consultas y respuestas pasadas, fomentando una mejor comprensión del contexto y el flujo de la interacción.

Flujo de trapo en el proceso

diagrama de flujo de trapo

Importancia

Recuperación de conocimiento eficiente : al aprovechar el poder del RAG, el sistema combina recuperación y generación para responder preguntas específicas con precisión en función del contenido de los documentos PDF cargados.
Escalabilidad y flexibilidad : con la fragmentación de texto e incrustaciones, la aplicación puede manejar documentos grandes al tiempo que garantiza la recuperación de información rápida y precisa.
AI conversacional : la memoria del historial de conversación hace que el sistema sea más interactivo, ya que realiza un seguimiento de las preguntas y respuestas anteriores, manteniendo el contexto durante largas conversaciones.
Integración de herramientas de IA modernas : este proyecto demuestra el uso de herramientas avanzadas como Chroma para el almacenamiento vectorial, LangChain para la gestión de la conversación y Gemini LLM de Google para generar respuestas humanas.

Expandir

Información adicional

Versión 1.0.0
Tipo Otro código fuente
Fecha de actualización 2025-05-31
tamaño 4.64MB
Proviene de Github

Aplicaciones relacionadas

TensorRT LLM

2024-11-10
OMS Agent for Linux

2024-11-06
Enhanced Blockchain Based Decentralized Public Auditing for Cloud Storage

2024-11-04
amazon ssm agent

2024-11-03
Retrieval based Voice Conversion WebUI

2024-11-01
Agente secreto HD

2022-08-02

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo