RAG based Intelligent Conversational AI Agent for Knowledge Extraction Using LangChain Gemini LLM Télécharger - Agent de conversation intelligent basé sur le chiffon pour l'extraction des connaiss

RAG based Intelligent Conversational AI Agent for Knowledge Extraction Using LangChain Gemini LLM

Autre code source

1.0.0

Télécharger

Agent d'intelligence de conversation intelligente basée sur des chiffons pour l'extraction des connaissances à l'aide de Langchain Gemini LLM

Dans ce qui précède, Google Colab contient du code détaillé

La génération (RAG) (RAG) de la récupération est un cadre qui combine la recherche d'informations avec une IA générative. Il permet aux modèles de récupérer des informations pertinentes à partir de sources ou de bases de données externes et d'utiliser ces données pour générer des réponses plus précises et contextuellement pertinentes. En tirant parti de la récupération et de la génération, RAG améliore la précision et la fiabilité des modèles d'IA, en particulier en fournissant des informations à jour ou en manipulant des questions complexes.

Flux de travail

Ce projet fournit un assistant conversationnel basé sur l'IA qui exploite la génération (RAG) de la récupération (RAG) pour extraire les connaissances des documents PDF. Le système combine des incorporations de texte, une recherche de vecteur et un LLM pour fournir des réponses aux questions des utilisateurs. Vous trouverez ci-dessous un flux de travail détaillé étape par étape du fonctionnement de l'application:

1. Téléchargement du document PDF

Les utilisateurs téléchargent un fichier PDF via le chemin mentionnant sur le carnet. Le fichier téléchargé est traité pour extraire le texte à l'aide de pdfplumber , une bibliothèque Python pour extraire du texte de PDFS.

2. Extraction de texte

Le cahier utilise la bibliothèque pdfplumber pour extraire du texte brut du PDF téléchargé. Chaque page du document est analysée et le texte résultant est préparé pour un traitement ultérieur.

3. Chunking texte

Le texte extrait est divisé en morceaux plus petits à l'aide de RecursiveCharacterTextSplitter . Cela garantit que le contenu est gérable pour les intégres et la récupération, généralement avec une taille de 500 caractères et un chevauchement de 50 caractères.

4. Génération d'intégration

Le texte en morceaux est converti en intégres numériques à l'aide SpacyEmbeddings . Ces intégres représentent la signification sémantique des morceaux, permettant une recherche efficace.

Image des intégres

5. Magasin vectoriel avec chroma

Une base de données vectorielle est créée à l'aide de la bibliothèque Chroma , où les intérêts sont stockés. La base de données vectorielle permet une récupération rapide et efficace des informations pertinentes en fonction des requêtes utilisateur.

6. Chaîne de récupération conversationnelle

La ConversationalRetrievalChain est établie à l'aide LangChain , combinant les intégres stockés dans le chroma avec un tampon de mémoire conversationnel pour suivre l'historique et le contexte du chat.

7. Interaction LLM

Le cahier intègre le ChatGoogleGenerativeAI (Google's Gemini LLM) pour générer des réponses pertinentes et intelligentes aux questions de l'utilisateur en fonction des morceaux de texte récupérés du magasin vectoriel.

8. Requête utilisateur et réponse IA

Les utilisateurs peuvent saisir leurs questions sur le document PDF téléchargé, et le système répond en récupérant les morceaux les plus pertinents du magasin vectoriel et en générant une réponse à l'aide du LLM. L'histoire de la conversation est préservée pour le contexte.

9. Affichage de l'histoire de la conversation

Les fonctionnalités une section extensible où les utilisateurs peuvent afficher l'historique de la conversation. Cette transparence permet aux utilisateurs de revoir les requêtes et les réponses passées, favorisant une meilleure compréhension du contexte et du flux de l'interaction.

Flux de chiffon dans le processus

diagramme de flux de chiffon

Importance

Récupération efficace des connaissances : en tirant parti de la puissance du chiffon, le système combine la récupération et la génération pour répondre à des questions spécifiques avec précision en fonction du contenu des documents PDF téléchargés.
Évolutivité et flexibilité : avec la chasse au texte et les intégres, l'application peut gérer de grands documents tout en garantissant une récupération rapide et précise des informations.
AI conversationnel : la mémoire de l'historique de conversation rend le système plus interactif, car il maintient une trace des questions et réponses précédentes, en maintenant le contexte sur de longues conversations.
Intégration des outils d'IA modernes : ce projet démontre l'utilisation d'outils avancés comme Chroma pour le stockage vectoriel, LangChain pour la gestion de la conversation et Gemini LLM de Google pour générer des réponses humaines.

Développer

Informations supplémentaires

Version 1.0.0
Type Autre code source
Date de mise à jour 2025-05-31
taille 4.64MB
Provenant de Github

Applications connexes

TensorRT LLM

2024-11-10
OMS Agent for Linux

2024-11-06
Enhanced Blockchain Based Decentralized Public Auditing for Cloud Storage

2024-11-04
amazon ssm agent

2024-11-03
Retrieval based Voice Conversion WebUI

2024-11-01
Agent secret HD

2022-08-02

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout