E Commerce_ChatBot Download - E Commerce_ChatBot Code source Télécharger

Chatbot de commerce électronique utilisant Rag with Llama et Langchain

Introduction

Ce projet est un chatbot de commerce électronique construit à l'aide d'une approche de génération (RAG) (RAG) de récupération . RAG combine la puissance de la recherche d'informations et des modèles de langage génératif, permettant au chatbot de fournir des réponses précises et consacrées au contexte basées sur des informations liées au produit approfondies stockées dans une base de données vectorielle. Nous avons utilisé Langchain comme cadre pour gérer les composants du chatbot et orchestrer efficacement le flux de génération de récupération.

Modèle et intégres

Le chatbot utilise LLAMA3.1-8b , un modèle grand langage connu pour sa capacité à comprendre le contexte nuancé et à générer des réponses cohérentes. Pour améliorer les performances de récupération, le projet exploite les intégres générés par le modèle de phrase de phrase / All-MPNET-Base-V2 de HuggingFace. Ces intérêts codent la signification sémantique, permettant au chatbot de récupérer rapidement les données de produit pertinentes en fonction des requêtes utilisateur. Les intérêts sont stockés et gérés dans Astradb , qui sert de base de données vectorielle haute performance.

Rag avec l'histoire du chat

Pour fournir des réponses cohérentes et consacrées au contexte, le chatbot utilise une approche de chiffon compatible l'histoire. En incorporant l'historique du chat dans chaque interaction, le modèle peut comprendre les références aux messages précédents et maintenir la continuité à travers plusieurs tours. Les fonctionnalités de gestion de l'historique de Langchain rendent ce processus sans couture en permettant à la gestion avec état de l'historique de chat pour chaque session d'utilisateur.

Apporach de gestion de l'ensemble de données

L' ensemble de données utilisé dans ce projet comprend des revues de produits provenant de Flipkart , une plate-forme de commerce électronique. L'ensemble de données comprend des titres de produits, des notes et des avis détaillés, offrant une vue complète des commentaires des clients sur divers produits. L'objectif principal de cet ensemble de données est d'alimenter les capacités de récupération du chatbot, ce qui lui permet de référencer les sentiments, les fonctionnalités et les expériences des clients du monde réel. Chaque revue est stockée comme un objet de document dans Langchain , contenant la revue comme contenu et le nom du produit sous forme de métadonnées. L' ensemble de données est ingéré dans Astradb en tant que magasin vectoriel, permettant des recherches de similitude qui correspondent aux requêtes des utilisateurs avec des critiques pertinentes, améliorant les recommandations et les réponses du chatbot.

Frontend et interaction

Le frontend est une interface Web réactive créée à l'aide de HTML , CSS et JavaScript , conçue pour fournir une expérience de chat intuitive. Les utilisateurs peuvent interagir avec le chatbot pour se renseigner sur les détails du produit et recevoir des recommandations personnalisées. L'interface est stylée avec CSS , avec un fond de gradient moderne et une boîte de chat structurée où les messages utilisateur et les réponses BOT sont affichés en temps réel.

Gérer les longs temps de réponse avec redis et céleri

Compte tenu de la grande taille du modèle, la génération de réponses avec LLAMA 3.1-8b peut parfois dépasser la limite de délai d'expiration du serveur par défaut d'une minute . Pour gérer cela, nous avons implémenté Redis en tant que courtier de messages et céleri pour la gestion des tâches d'arrière-plan. Lorsqu'un utilisateur soumet une requête, le chatbot déclenche une tâche de céleri qui traite la réponse de manière asynchrone , permettant au frontend de sonder périodiquement pour l'état de réponse. Cette méthode empêche efficacement les erreurs de délai d'expiration du serveur tout en garantissant que les utilisateurs reçoivent des réponses sans interruptions.

Déploiement sur AWS EC2

Le chatbot est déployé sur AWS EC2 , fournissant un environnement évolutif et robuste pour exécuter le modèle, gérer les interactions utilisateur et gérer les récupérations à partir de la base de données.

Pile technologique utilisée

Langue : Python
Cadre : Langchain
Backend : flacon
Modèle : Llama 3.1-8b (Olllama), TRANSformateurs de phrases en étreintes
Base de données : Astradb (stockage vectoriel pour intégrer)
File d'attente de messages : redis
Gestion des tâches : céleri
Frontend : HTML, CSS, JavaScript

Infrastructure

Déploiement : AWS EC2
Contrôle de version : github

Ensemble de données

L'ensemble de données de ce projet est tiré de Kaggle. Voici le lien de l'ensemble de données. L'ensemble de données utilisé dans ce projet contient 450 avis de produits sur différentes marques d'écouteurs, Erabuds et autres collectés auprès de Flipkart, y compris les caractéristiques clés suivantes:

ID de produit : un identifiant unique pour chaque produit.
Titre du produit : le nom ou le titre du produit, ce qui aide à comprendre le contexte du produit pour les recommandations.
Note : Une note numérique (sur 5) donnée par les utilisateurs, indiquant la qualité du produit.
Résumé : Un court résumé ou un titre de l'examen.
Revue : un examen détaillé des utilisateurs, fournissant des informations sur l'expérience de l'utilisateur avec le produit.

Ces titres de produits, notes, résumés et textes de révision sont exploités pour créer des intérêts et améliorer la pertinence des réponses du chatbot dans la compréhension des demandes des clients sur les produits. Vous pouvez également télécharger l'ensemble de données à partir d'ici

Détails de l'ensemble de données

 Nom de l'ensemble de données: flipkart_dataset
Nombre de colonnes: 5
Nombre d'enregistrements: 450

Installation

Le code est écrit dans Python 3.10.15. Si vous n'avez pas installé Python, vous pouvez le trouver ici. Si vous utilisez une version inférieure de Python, vous pouvez mettre à niveau à l'aide du package PIP, en vous assurant de la dernière version de PIP.

Courir localement

Étape 1: Clone le référentiel à votre machine locale:

git clone https://github.com/jatin-12-2002/E-Commerce_ChatBot

Étape 2: Accédez au répertoire du projet:

 cd E-Commerce_ChatBot

Étape 3: Créez un environnement conda après avoir ouvert le référentiel

conda create -p env python=3.10 -y

 source activate ./env

Étape 4: Installez les exigences

pip install -r requirements.txt

Étape 5: Configurer les variables d'environnement:

Créez un fichier .env dans le répertoire du projet.
Définissez les variables d'environnement nécessaires telles que les chaînes de connexion de la base de données, les clés d'API, etc.
Votre fichier .env devrait avoir ces variables:

ASTRA_DB_API_ENDPOINT= " "
ASTRA_DB_APPLICATION_TOKEN= " "
ASTRA_DB_KEYSPACE= " "
HF_TOKEN= " "

Mon fichier .env est là

Étape 6: Téléchargez l'API Olllama.

curl -fsSL https://ollama.com/install.sh | sh

Étape 7: Accédez à un nouveau terminal et après avoir activé l'environnement. Démarrez le serveur Ollama.

ollama serve

Étape 8: Téléchargez le modèle LLAMA3.1-8B .

ollama pull llama3.1:8b

Étape 9: Installer Redis

sudo apt-get update

sudo apt-get install redis-server

Étape 10: Démarrez le serveur Redis (généralement effectué sur le port 6379 par défaut).

sudo service redis-server start

Étape 11: Vérifiez si Redis est en cours d'exécution. Il doit retourner Pong si tout fonctionne bien.

redis-cli ping

Étape 12: Démarrez le céleri. Dans une nouvelle fenêtre de terminal, activez l'environnement puis exécutez:

celery -A app.celery worker --loglevel=info

Étape 13: Exécutez l'application FLASK. Dans un autre terminal, démarrez votre application Flask avec Gunicorn

gunicorn -w 2 -b 0.0.0.0:8000 app:app

Étape 14 - Application de prédiction

http://localhost:8000/

Sorties de réponses du chatbot

Déploiement AWS

Étape 1: poussez l'ensemble de votre code vers GitHub.

Étape 2: Connectez-vous à votre lien de compte AWS.

Étape 3: Lancez votre instance EC2.

Étape 4: Configurez votre instance EC2.

Use t2.large or greater size instances only as it is a GenerativeAI using LLMs project.

Étape 5: Commande pour configurer l'instance EC2.

Informations: la mise à jour Sudo Apt-Get et la mise à jour Sudo APT sont utilisées pour mettre à jour l'indice de package sur un système basé à Debian comme Ubuntu, mais ils sont légèrement différents en termes d'outils qu'ils utilisent et de leur fonctionnalité:

Étape 6: Connectez votre instance EC2 et commencez à taper les commandes suivantes

Étape 6.1: Cette commande utilise APT-GET, l'outil de gestion des packages traditionnelle.

sudo apt-get update

Étape 6.2: Cette commande utilise APT, une interface de ligne de commande plus récente et plus conviviale pour le système de gestion des packages APT.

sudo apt update -y

Étape 6.3: Installez Nginx, Git et d'autres outils

sudo apt install git nginx -y

Étape 6.3: Installez les outils requis.

sudo apt install git curl unzip tar make sudo vim wget -y

Étape 6.4: Référentiel de clone Git.

git clone https://github.com/jatin-12-2002/E-Commerce_ChatBot

Étape 6.5: Accédez au répertoire du projet:

 cd E-Commerce_ChatBot

Étape 6.6: Créez un fichier .env là-bas.

touch .env

Étape 6.6: Ouvrez le fichier dans l'éditeur vi.

vi .env

Étape 6.7: Appuyez sur Insérer et mentionner la variable .env puis appuyez sur ESC pour enregistrer et écrire: WQ pour la sortie.

ASTRA_DB_API_ENDPOINT= " "
ASTRA_DB_APPLICATION_TOKEN= " "
ASTRA_DB_KEYSPACE= " "
HF_TOKEN= " "

Étape 6.8: ### pour vérifier les valeurs des variables .env.

cat .env

Étape 6.9: Pour l'installation de Python et PIP, voici une commande

sudo apt install python3-pip

Étape 6.10: Installez les exigences.txt. L'indicateur de packages de système de rupture dans PIP permet de remplacer l'erreur d'environnement gérée par l'extérieur et d'installer des packages Python à l'échelle du système.

pip3 install -r  requirements.txt

pip3 install -r  requirements.txt --break-system-packages

L'indicateur de packages de système de rupture dans PIP permet de remplacer l'erreur d'environnement gérée par l'extérieur et d'installer des packages Python à l'échelle du système. pip install package_name --break-system-packages

Étape 6.11: Testez l'application avec Gunicorn. Vérifiez que l'application fonctionne en visitant http: // your-ec2-public-ip: 8000

gunicorn -w 2 -b 0.0.0.0:8000 app:app

Étape 6.12: Configurez Nginx comme proxy inverse. Configurez Nginx pour transmettre les demandes à Gunicorn. Ouvrez le fichier de configuration Nginx:

sudo nano /etc/nginx/sites-available/default

Étape 6.13: Mettez à jour la configuration Nginx comme suit:

server {
    listen 80 ;
    server_name your-ec2-public-ip ;

    location / {
        proxy_pass http://127.0.0.1:8000 ;
        proxy_set_header Host $host ;
        proxy_set_header X-Real-IP $remote_addr ;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for ;
        proxy_set_header X-Forwarded-Proto $scheme ;
    }
}

Enregistrer et fermer le fichier

Étape 6.14: puis redémarrez Nginx:

sudo systemctl restart nginx

Étape 6.15: Configurez Gunicorn comme service d'arrière-plan. Pour que Gunicorn fonctionne en tant que service, configurez un fichier de service SystemD. Créer un nouveau fichier de service:

sudo nano /etc/systemd/system/gunicorn.service

Étape 6.16: Mettez à jour la configuration comme suit:

[Unit]
Description=Gunicorn instance to serve my project
After=network.target

[Service]
User=ubuntu
Group=www-data
WorkingDirectory=/home/ubuntu/E-Commerce_ChatBot_Project
ExecStart=/usr/bin/gunicorn --workers 4 --bind 127.0.0.1:8000 app:app

[Install]
WantedBy=multi-user.target

Enregistrer et fermer le fichier

Étape 6.17: Démarrez et activez le service:

sudo systemctl start gunicorn

sudo systemctl enable gunicorn

Étape 7: Configurez votre règle entrante:

Entrez dans la sécurité
Cliquez sur le groupe de sécurité
Configurez votre règle entrante avec certaines valeurs
Port 5000 0.0.0.0/0 pour n'importe où Trafic TCP / IP Protocole
Port 8000 0.0.0.0/0 pour n'importe où Trafic TCP / IP Protocole
Port 11434 0.0.0.0/0 pour le trafic n'importe où TCP / IP Protocole

Étape 8: Enregistrez-le et exécutez maintenant votre application.

gunicorn -w 2 -b 0.0.0.0:8000 app:app

Étape 9 - Exécutez le port public de l'instance EC2

Public_Address:8080

Si vous rencontrez une erreur comme le code: 400 lors de l'exécution de "https: {public_address}: 5000", alors exécutez-le avec 'http' au lieu de 'https'.

Vérifiez que votre application est accessible via http: // your-ec2-public-ip. Nginx transmettra les demandes à Gunicorn, qui dessert l'application FLASK.

Cette configuration rend votre application prête pour la production en utilisant Nginx et Gunicorn pour la stabilité, les performances et l'évolutivité. Vous pouvez continuer à évoluer en augmentant les travailleurs de Gunicorn ou en ajoutant l'équilibrage de la charge si le trafic augmente.

Conclusion

Ce chatbot de commerce électronique offre une expérience d'achat interactive intelligente grâce à une approche de chiffon qui combine la récupération et la génération, offrant des recommandations de produits pertinentes basées sur des avis sur les clients.
Le modèle grand langage de LLAMA 3.1 et les incorporations d'étreinte permettent de permettre des réponses nuancées, améliorant l'engagement des utilisateurs avec des conversations de rendez-vous contextuellement.
Une gestion efficace de la réponse avec Redis et le céleri répond aux exigences d'une application très performante, garantissant des expériences utilisateur stables et réactives même avec de grands LLM .
Un déploiement AWS EC2 entièrement évolutif permet une intégration transparente dans les plates-formes de commerce électronique, offrant une infrastructure robuste pour des environnements à fort trafic.
Ce projet présente une application puissante de modèles de gros langues , repoussant les limites des capacités de chatbot dans le domaine du commerce électronique.

Développer