E Commerce_ChatBot Descargar - E Commerce_ChatBot Código fuente Descargar Descargar

Chatbot de comercio electrónico usando trapo con Llama y Langchain

Introducción

Este proyecto es un chatbot de comercio electrónico construido utilizando un enfoque de generación de recuperación (RAG) . RAG combina el poder de la recuperación de información y los modelos de lenguaje generativo, lo que permite que el chatbot proporcione respuestas precisas y conscientes del contexto basadas en información extensa relacionada con el producto almacenada en una base de datos vectorial. Utilizamos Langchain como marco para administrar los componentes del chatbot y orquestar el flujo de generación de recuperación de manera eficiente.

Modelo e incrustaciones

El chatbot emplea a Llama3.1-8b , un modelo de lenguaje grande conocido por su capacidad para comprender el contexto matizado y generar respuestas coherentes. Para mejorar el rendimiento de la recuperación, el proyecto aprovecha los incrustaciones generados por el modelo de transformadores de oraciones de Huggingface/All-MPNET-Base-V2 . Estas incrustaciones codifican el significado semántico, lo que permite al chatbot recuperar los datos relevantes del producto rápidamente en función de las consultas de los usuarios. Las integridades se almacenan y se administran en Astradb , que sirve como una base de datos de vectores de alto rendimiento.

Trapo con historia de chat

Para proporcionar respuestas coherentes y conscientes del contexto, el chatbot utiliza un enfoque de trapo consciente de la historia. Al incorporar el historial de chat en cada interacción, el modelo puede comprender las referencias a mensajes anteriores y mantener la continuidad en múltiples vueltas. Las características de gestión del historial de Langchain hacen que este proceso sea perfecto al permitir la gestión estestina del historial de chat para cada sesión de usuario.

Manejo del conjunto de datos Apporach

El conjunto de datos utilizado en este proyecto comprende revisiones de productos procedentes de Flipkart , una plataforma de comercio electrónico. El conjunto de datos incluye títulos de productos, calificaciones y revisiones detalladas, que ofrecen una visión integral de los comentarios de los clientes en varios productos. El propósito principal de este conjunto de datos es alimentar las capacidades de recuperación del chatbot, lo que le permite hacer referencia a sentimientos, características y experiencias del cliente del mundo real. Cada revisión se almacena como un objeto de documento dentro de Langchain , que contiene la revisión como contenido y el nombre del producto como metadatos. El conjunto de datos se ingiere en ASTRADB como una tienda vectorial, lo que permite búsquedas de similitud que coinciden con las consultas de los usuarios con revisiones relevantes, mejorando las recomendaciones y respuestas del chatbot.

Frontend e interacción

The Frontend es una interfaz web receptiva creada utilizando HTML , CSS y JavaScript , diseñada para proporcionar una experiencia de chat intuitiva. Los usuarios pueden interactuar con el chatbot para consultar sobre los detalles del producto y recibir recomendaciones personalizadas. La interfaz está diseñada con CSS , con un fondo de gradiente moderno y un cuadro de chat estructurado donde los mensajes de usuario y las respuestas de BOT se muestran en tiempo real.

Manejo de largos tiempos de respuesta con redis y apio

Dado el gran tamaño del modelo, generar respuestas con LLAMA 3.1-8B ocasionalmente puede exceder el límite predeterminado de tiempo de espera del servidor de 1 minuto . Para administrar esto, implementamos Redis como corredor de mensajes y apio para la gestión de tareas de fondo. Cuando un usuario envía una consulta, el chatbot desencadena una tarea de apio que procesa la respuesta de forma asincrónica , lo que permite que el frontend encueste periódicamente el estado de respuesta. Este método evita efectivamente los errores de tiempo de espera del servidor al tiempo que garantiza que los usuarios reciban respuestas sin interrupciones.

Despliegue en AWS EC2

El chatbot se implementa en AWS EC2 , proporcionando un entorno escalable y robusto para ejecutar el modelo, manejar las interacciones del usuario y administrar las recuperaciones de la base de datos.

Pila tecnológica utilizada

Idioma : Python
Marco : Langchain
Backend : Flask
Modelo : Llama 3.1-8b (Ollama), Huggingface Transformers de oraciones
Base de datos : Astradb (almacenamiento de vector para incrustaciones)
Cola de mensajes : Redis
Gestión de tareas : apio
Frontend : HTML, CSS, JavaScript

Infraestructura

Implementación : AWS EC2
Control de versión : Github

Conjunto de datos

El conjunto de datos para este proyecto se toma de Kaggle. Aquí está el enlace del conjunto de datos. El conjunto de datos utilizado en este proyecto contiene 450 revisiones de productos sobre diferentes marcas de auriculares, erabuds y otros recopilados de Flipkart, incluidas las siguientes características clave:

ID de producto : un identificador único para cada producto.
Título del producto : el nombre o el título del producto, que ayuda a comprender el contexto del producto para recomendaciones.
Calificación : una calificación numérica (de 5) dada por los usuarios, lo que indica la calidad del producto.
Resumen : un breve resumen o titular de la revisión.
Revisión : una revisión detallada del usuario, que proporciona información sobre la experiencia del usuario con el producto.

Estos títulos de productos, calificaciones, resúmenes y textos de revisión se aprovechan para crear integridades y mejorar la relevancia de las respuestas de chatbot en la comprensión de las consultas de los clientes sobre los productos. Además, puede descargar el conjunto de datos desde aquí

Detalles del conjunto de datos

 Nombre del conjunto de datos: flipkart_dataset
Número de columnas: 5
Número de registros: 450

Instalación

El código está escrito en Python 3.10.15. Si no tiene Python instalado, puede encontrarlo aquí. Si está utilizando una versión inferior de Python, puede actualizar con el paquete PIP, asegurando que tenga la última versión de PIP.

Ejecutar localmente

Paso 1: Clone el repositorio a su máquina local:

git clone https://github.com/jatin-12-2002/E-Commerce_ChatBot

Paso 2: Navegue al directorio del proyecto:

 cd E-Commerce_ChatBot

Paso 3: cree un entorno de condena después de abrir el repositorio

conda create -p env python=3.10 -y

 source activate ./env

Paso 4: Instale los requisitos

pip install -r requirements.txt

Paso 5: Configurar variables de entorno:

Cree un archivo .env en el directorio del proyecto.
Defina las variables de entorno necesarias, como cadenas de conexión de bases de datos, claves API, etc.
Su archivo .env debe tener estas variables:

ASTRA_DB_API_ENDPOINT= " "
ASTRA_DB_APPLICATION_TOKEN= " "
ASTRA_DB_KEYSPACE= " "
HF_TOKEN= " "

Mi archivo .env está aquí

Paso 6: Descargue la API Ollama.

curl -fsSL https://ollama.com/install.sh | sh

Paso 7: Vaya a un nuevo terminal y después de activar el entorno. Inicie el servidor Ollama.

ollama serve

Paso 8: Descargue el modelo Llama3.1-8b .

ollama pull llama3.1:8b

Paso 9: Instalar redis

sudo apt-get update

sudo apt-get install redis-server

Paso 10: inicie el servidor Redis (generalmente hecho en el puerto 6379 de forma predeterminada).

sudo service redis-server start

Paso 11: Compruebe si Redis se está ejecutando. Debería devolver pong si todo funciona bien.

redis-cli ping

Paso 12: Comience al trabajador de apio. En una nueva ventana de terminal, active el entorno y luego ejecute:

celery -A app.celery worker --loglevel=info

Paso 13: Ejecute la aplicación Flask. En otra terminal, comience su aplicación Flask con Gunicorn

gunicorn -w 2 -b 0.0.0.0:8000 app:app

Paso 14 - Aplicación de predicción

http://localhost:8000/

Respuestas de chatbot salidas

imagen imagen imagen

Despliegue de AWS

Paso 1: presione todo su código a GitHub.

Paso 2: Inicie sesión en el enlace de su cuenta de AWS.

Paso 3: Inicie su instancia de EC2.

Paso 4: Configure su instancia de EC2.

Use t2.large or greater size instances only as it is a GenerativeAI using LLMs project.

Paso 5: Comando para configurar la instancia de EC2.

Información: la actualización de sudo apt-get y la actualización de sudo apt se utilizan para actualizar el índice de paquetes en un sistema basado en Debian como Ubuntu, pero son ligeramente diferentes en términos de las herramientas que usan y su funcionalidad:

Paso 6: conecte su instancia de EC2 y comience a escribir los siguientes comandos

Paso 6.1: Este comando usa apt-get, la herramienta de administración de paquetes tradicional.

sudo apt-get update

Paso 6.2: Este comando utiliza APT, una interfaz de línea de comandos más nueva y fácil de usar para el sistema de administración de paquetes APT.

sudo apt update -y

Paso 6.3: Instale Nginx, GIT y otras herramientas

sudo apt install git nginx -y

Paso 6.3: Instale las herramientas requeridas.

sudo apt install git curl unzip tar make sudo vim wget -y

Paso 6.4: Repositorio de Clone Git.

git clone https://github.com/jatin-12-2002/E-Commerce_ChatBot

Paso 6.5: Navegue al directorio del proyecto:

 cd E-Commerce_ChatBot

Paso 6.6: Cree un archivo .env allí.

touch .env

Paso 6.6: Abra el archivo en el editor VI.

vi .env

Paso 6.7: Presione Insertar y mencionar .NV Variable y luego presione ESC para guardar y escribir: WQ para salir.

ASTRA_DB_API_ENDPOINT= " "
ASTRA_DB_APPLICATION_TOKEN= " "
ASTRA_DB_KEYSPACE= " "
HF_TOKEN= " "

Paso 6.8: ### para verificar los valores de las variables .env.

cat .env

Paso 6.9: para instalar Python y Pip aquí hay un comando

sudo apt install python3-pip

Paso 6.10: Instale los requisitos.txt. El indicador-Break-System-Packages en PIP permite anular el error de envío gestionado externamente e instalar los paquetes de Python en todo el sistema.

pip3 install -r  requirements.txt

pip3 install -r  requirements.txt --break-system-packages

El indicador-Break-System-Packages en PIP permite anular el error de envío gestionado externamente e instalar los paquetes de Python en todo el sistema. PIP Instale paquete_name --break-System-Packages

Paso 6.11: Pruebe la aplicación con Gunicorn. Verificar que la aplicación funcione visitando http: // su-EC2-Public-IP: 8000

gunicorn -w 2 -b 0.0.0.0:8000 app:app

Paso 6.12: Configure Nginx como un proxy inverso. Configure Nginx para reenviar las solicitudes a Gunicorn. Abra el archivo de configuración de Nginx:

sudo nano /etc/nginx/sites-available/default

Paso 6.13: actualice la configuración de Nginx de la siguiente manera:

server {
    listen 80 ;
    server_name your-ec2-public-ip ;

    location / {
        proxy_pass http://127.0.0.1:8000 ;
        proxy_set_header Host $host ;
        proxy_set_header X-Real-IP $remote_addr ;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for ;
        proxy_set_header X-Forwarded-Proto $scheme ;
    }
}

Guarde y cierre el archivo

Paso 6.14: luego reinicie Nginx:

sudo systemctl restart nginx

Paso 6.15: Configure Gunicorn como un servicio de fondo. Para mantener a Gunicorn en funcionamiento como servicio, configure un archivo de servicio Systemd. Cree un nuevo archivo de servicio:

sudo nano /etc/systemd/system/gunicorn.service

Paso 6.16: actualice la configuración de la siguiente manera:

[Unit]
Description=Gunicorn instance to serve my project
After=network.target

[Service]
User=ubuntu
Group=www-data
WorkingDirectory=/home/ubuntu/E-Commerce_ChatBot_Project
ExecStart=/usr/bin/gunicorn --workers 4 --bind 127.0.0.1:8000 app:app

[Install]
WantedBy=multi-user.target

Guarde y cierre el archivo

Paso 6.17: iniciar y habilitar el servicio:

sudo systemctl start gunicorn

sudo systemctl enable gunicorn

Paso 7: Configure su regla de entrada:

Entra en la seguridad
Haga clic en el grupo de seguridad
Configure su regla de entrada con ciertos valores
Puerto 5000 0.0.0.0/0 para el protocolo TCP/IP de tráfico en cualquier lugar
Puerto 8000 0.0.0.0/0 para el protocolo TCP/IP de tráfico en cualquier lugar
Puerto 11434 0.0.0.0/0 para cualquier lugar de tráfico TCP/IP Protocolo

Paso 8: guárdelo y ahora ejecute su aplicación.

gunicorn -w 2 -b 0.0.0.0:8000 app:app

Paso 9 - Ejecute el puerto público de la instancia de EC2

Public_Address:8080

Si encuentra algún error como el código: 400 mientras ejecuta "https: {public_address}: 5000", simplemente ejecutarlo con 'http' en lugar de 'https'.

Verifique que su aplicación sea accesible a través de http: // su-EC2-Public-IP. Nginx reenviará las solicitudes a Gunicorn, que sirve a la aplicación Flask.

Esta configuración hace que la producción de su aplicación esté preparada utilizando NGINX y Gunicorn para la estabilidad, el rendimiento y la escalabilidad. Puede continuar escalando aumentando a los trabajadores de Gunicorn o agregando equilibrio de carga si el tráfico crece.

Conclusión

Este chatbot de comercio electrónico proporciona una experiencia de compra inteligente e interactiva a través de un enfoque de RAG que combina la recuperación y la generación, ofreciendo recomendaciones de productos relevantes basadas en revisiones reales de los clientes.
El modelo de lenguaje grande de Llama 3.1 y las incrustaciones de Huggingface permiten respuestas matizadas, mejorando la participación del usuario con conversaciones contextualmente conscientes.
El manejo de respuesta eficiente con Redis y Celery aborda las demandas de una aplicación de alto rendimiento, asegurando experiencias de usuario estables y receptivas incluso con grandes LLM .
Una implementación de AWS EC2 totalmente escalable permite una integración perfecta en plataformas de comercio electrónico, que ofrece una infraestructura robusta para entornos de alto tráfico.
Este proyecto muestra una poderosa aplicación de modelos de idiomas grandes , empujando los límites de las capacidades de chatbot en el dominio de comercio electrónico.

Expandir