E Commerce_ChatBot Download - E Commerce_ChatBot Download do Código Fonte

Chatbot de comércio eletrônico usando rag com llama e langchain

Introdução

Este projeto é um chatbot de comércio eletrônico criado usando uma abordagem de geração de recuperação (RAG) . O RAG combina o poder dos modelos de recuperação de informações e de linguagem generativa, permitindo que o chatbot forneça respostas precisas e com consciência de contexto com base em extensas informações relacionadas ao produto armazenadas em um banco de dados vetorial. Usamos o Langchain como estrutura para gerenciar os componentes do chatbot e orquestrar o fluxo de geração de recuperação com eficiência.

Modelo e incorporação

O chatbot emprega a LLAMA3.1-8B , um grande modelo de idioma conhecido por sua capacidade de entender o contexto diferenciado e gerar respostas coerentes. Para melhorar o desempenho da recuperação, o projeto aproveita as incorporações geradas pelo modelo de transformadores de sentença do Huggingface/All-MPNET-BASE-V2 . Essas incorporações codificam significado semântico, permitindo que o chatbot recupere os dados relevantes do produto rapidamente com base nas consultas do usuário. As incorporações são armazenadas e gerenciadas no AstRADB , que serve como um banco de dados vetorial de alto desempenho.

Trapo com história de bate -papo

Para fornecer respostas coerentes e com reconhecimento de contexto, o chatbot usa uma abordagem de pano consciente da história. Ao incorporar o histórico de bate -papo em cada interação, o modelo pode entender as referências a mensagens anteriores e manter a continuidade em várias voltas. Os recursos de gerenciamento de histórico de Langchain tornam esse processo perfeito, permitindo o gerenciamento estabelecido do histórico de bate -papo para cada sessão do usuário.

Manuseio de dados APORPORATH

O conjunto de dados usado neste projeto compreende revisões de produtos provenientes da Flipkart , uma plataforma de comércio eletrônico. O conjunto de dados inclui títulos de produtos, classificações e críticas detalhadas, oferecendo uma visão abrangente do feedback do cliente em vários produtos. O objetivo principal desse conjunto de dados é alimentar os recursos de recuperação do chatbot, permitindo que ele faça referência a sentimentos, recursos e experiências de clientes do mundo real. Cada revisão é armazenada como um objeto de documento em Langchain , contendo a revisão como conteúdo e o nome do produto como metadados. O conjunto de dados é ingerido no AstRADB como um loja de vetores, permitindo pesquisas de similaridade que correspondam às consultas do usuário com revisões relevantes, aprimorando as recomendações e respostas do chatbot.

Front -end e interação

O front -end é uma interface da Web responsiva criada usando HTML , CSS e JavaScript , projetado para fornecer uma experiência intuitiva de bate -papo. Os usuários podem interagir com o chatbot para perguntar sobre os detalhes do produto e receber recomendações personalizadas. A interface é estilizada com o CSS , com um fundo de gradiente moderno e uma caixa de bate-papo estruturada, onde as mensagens do usuário e as respostas de bot são exibidas em tempo real.

Lidando com longos tempos de resposta com redis e aipo

Dado o tamanho grande do modelo, gerar respostas com o LLAMA 3.1-8B pode ocasionalmente exceder o limite de tempo limite do servidor de 1 minuto padrão. Para gerenciar isso, implementamos o Redis como corretor de mensagens e aipo para gerenciamento de tarefas em segundo plano. Quando um usuário envia uma consulta, o chatbot desencadeia uma tarefa de aipo que processa a resposta de forma assíncrona , permitindo que a frontend pesquise periodicamente para o status de resposta. Esse método evita efetivamente os erros de tempo limite do servidor, garantindo que os usuários recebam respostas sem interrupções.

Implantação no AWS EC2

O chatbot é implantado no AWS EC2 , fornecendo um ambiente escalável e robusto para executar o modelo, lidar com interações do usuário e gerenciar recuperações do banco de dados.

Pilha de tecnologia usada

Idioma : Python
Estrutura : Langchain
Back -end : Flask
Modelo : LLAMA 3.1-8B (Ollama), Huggingface Sentença-Transformadores
Banco de dados : AstRadB (armazenamento vetorial para incorporação)
Fila de mensagens : Redis
Gerenciamento de tarefas : aipo
Frontend : HTML, CSS, JavaScript

Infraestrutura

Implantação : AWS EC2
Controle de versão : github

Conjunto de dados

O conjunto de dados para este projeto é retirado de Kaggle. Aqui está o link do conjunto de dados. O conjunto de dados usado neste projeto contém 450 análises de produtos sobre diferentes marcas de fones de ouvido, Erabuds e outros coletados da Flipkart, incluindo os seguintes recursos principais:

ID do produto : um identificador exclusivo para cada produto.
Título do produto : o nome ou o título do produto, que ajuda a entender o contexto do produto para recomendações.
Classificação : uma classificação numérica (de 5) dada pelos usuários, indicando a qualidade do produto.
Resumo : Um breve resumo ou manchete da revisão.
Revisão : Uma revisão detalhada do usuário, fornecendo informações sobre a experiência do usuário com o produto.

Esses títulos, classificações, resumos e textos de revisão de produtos são aproveitados para criar incorporação e melhorar a relevância das respostas do chatbot na compreensão das perguntas dos clientes sobre produtos. Além disso, você pode baixar o conjunto de dados daqui

Detalhes do conjunto de dados

 Nome do conjunto de dados: flipkart_dataset
Número de colunas: 5
Número de registros: 450

Instalação

O código é escrito no Python 3.10.15. Se você não tem o Python instalado, pode encontrá -lo aqui. Se você estiver usando uma versão inferior do Python, poderá atualizar usando o pacote PIP, garantindo que você tenha a versão mais recente do PIP.

Execute localmente

Etapa 1: Clone o repositório da sua máquina local:

git clone https://github.com/jatin-12-2002/E-Commerce_ChatBot

Etapa 2: Navegue até o diretório do projeto:

 cd E-Commerce_ChatBot

Etapa 3: Crie um ambiente de conda depois de abrir o repositório

conda create -p env python=3.10 -y

 source activate ./env

Etapa 4: instale os requisitos

pip install -r requirements.txt

Etapa 5: Configure variáveis de ambiente:

Crie um arquivo .env no diretório do projeto.
Defina as variáveis de ambiente necessárias, como cadeias de conexão de banco de dados, teclas de API, etc.
Seu arquivo .env deve ter estas variáveis:

ASTRA_DB_API_ENDPOINT= " "
ASTRA_DB_APPLICATION_TOKEN= " "
ASTRA_DB_KEYSPACE= " "
HF_TOKEN= " "

Meu arquivo .env está aqui

Etapa 6: Baixe a API Ollama.

curl -fsSL https://ollama.com/install.sh | sh

Etapa 7: vá para um novo terminal e depois de ativar o ambiente. Inicie o servidor ollama.

ollama serve

Etapa 8: Baixe o modelo LLAMA3.1-8B .

ollama pull llama3.1:8b

Etapa 9: Instale Redis

sudo apt-get update

sudo apt-get install redis-server

Etapa 10: Inicie o servidor Redis (geralmente feito na porta 6379 por padrão).

sudo service redis-server start

Etapa 11: verifique se o Redis está em execução. Deve retornar Pong se tudo estiver funcionando bem.

redis-cli ping

Etapa 12: Inicie o trabalhador do aipo. Em uma nova janela do terminal, ative o ambiente e execute:

celery -A app.celery worker --loglevel=info

Etapa 13: Execute o aplicativo de frasco. Em outro terminal, inicie seu aplicativo de frasco com Gunicorn

gunicorn -w 2 -b 0.0.0.0:8000 app:app

Etapa 14 - Aplicação de Previsão

http://localhost:8000/

Saídas de respostas do chatbot

imagem imagem imagem

Implantação da AWS

Etapa 1: empurre todo o seu código para o Github.

Etapa 2: Faça login no link da sua conta do AWS.

Etapa 3: inicie sua instância do EC2.

Etapa 4: configure sua instância EC2.

Use t2.large or greater size instances only as it is a GenerativeAI using LLMs project.

Etapa 5: comando para configurar a instância do EC2.

Informações: Atualização do sudo apt-get e a atualização do sudo apt são usadas para atualizar o índice de pacotes em um sistema baseado no Debian como o Ubuntu, mas eles são um pouco diferentes em termos das ferramentas que usam e sua funcionalidade:

Etapa 6: conecte sua instância do EC2 e comece a digitar os seguintes comandos

Etapa 6.1: Este comando usa Apt-Get, a ferramenta de gerenciamento de pacotes tradicional.

sudo apt-get update

Etapa 6.2: Este comando usa APT, uma interface de linha de comando mais nova e mais amigável para o sistema de gerenciamento de pacotes APT.

sudo apt update -y

Etapa 6.3: Instale o nginx, git e outras ferramentas

sudo apt install git nginx -y

Etapa 6.3: Instale as ferramentas necessárias.

sudo apt install git curl unzip tar make sudo vim wget -y

Etapa 6.4: Clone Git Repository.

git clone https://github.com/jatin-12-2002/E-Commerce_ChatBot

Etapa 6.5: Navegue até o diretório do projeto:

 cd E-Commerce_ChatBot

Etapa 6.6: Crie um arquivo .env lá.

touch .env

Etapa 6.6: Abra o arquivo no VI Editor.

vi .env

Etapa 6.7: Pressione Inserir e mencionar a variável .Env Pressione ESC para salvar e escrever: WQ para saída.

ASTRA_DB_API_ENDPOINT= " "
ASTRA_DB_APPLICATION_TOKEN= " "
ASTRA_DB_KEYSPACE= " "
HF_TOKEN= " "

Etapa 6.8: ### Para verificar os valores das variáveis .env.

cat .env

Etapa 6.9: Para instalar Python e Pip, aqui está um comando

sudo apt install python3-pip

Etapa 6.10: Instale os requisitos.txt. O sinalizador de pacote de system-sistema no PIP permite substituir o erro de ambiente manual externamente gerenciado e instalar os pacotes Python em todo o sistema.

pip3 install -r  requirements.txt

pip3 install -r  requirements.txt --break-system-packages

O sinalizador de pacote de system-sistema no PIP permite substituir o erro de ambiente manual externamente gerenciado e instalar os pacotes Python em todo o sistema. PIP Package_Name --break-System-Packages

Etapa 6.11: Teste o aplicativo com Gunicorn. Verifique se o aplicativo está funcionando visitando http: // your-ec2-public-ip: 8000

gunicorn -w 2 -b 0.0.0.0:8000 app:app

Etapa 6.12: Configure o nginx como um proxy reverso. Configure o Nginx para encaminhar solicitações para o Gunicorn. Abra o arquivo de configuração do nginx:

sudo nano /etc/nginx/sites-available/default

Etapa 6.13: Atualize a configuração do NGINX da seguinte forma:

server {
    listen 80 ;
    server_name your-ec2-public-ip ;

    location / {
        proxy_pass http://127.0.0.1:8000 ;
        proxy_set_header Host $host ;
        proxy_set_header X-Real-IP $remote_addr ;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for ;
        proxy_set_header X-Forwarded-Proto $scheme ;
    }
}

Salvar e fechar o arquivo

Etapa 6.14: depois reinicie o nginx:

sudo systemctl restart nginx

Etapa 6.15: Configure o Gunicorn como um serviço de segundo plano. Para manter o Gunicorn funcionando como um serviço, configure um arquivo de serviço Systemd. Crie um novo arquivo de serviço:

sudo nano /etc/systemd/system/gunicorn.service

Etapa 6.16: Atualize a configuração da seguinte forma:

[Unit]
Description=Gunicorn instance to serve my project
After=network.target

[Service]
User=ubuntu
Group=www-data
WorkingDirectory=/home/ubuntu/E-Commerce_ChatBot_Project
ExecStart=/usr/bin/gunicorn --workers 4 --bind 127.0.0.1:8000 app:app

[Install]
WantedBy=multi-user.target

Salvar e fechar o arquivo

Etapa 6.17: Inicie e habilite o serviço:

sudo systemctl start gunicorn

sudo systemctl enable gunicorn

Etapa 7: Configure sua regra de entrada:

Vá dentro da segurança
Clique no grupo de segurança
Configure sua regra de entrada com certos valores
Porta 5000 0,0.0.0/0 para qualquer lugar de tráfego TCP/IP Protocolo
Porta 8000 0.0.0.0/0 para qualquer lugar de tráfego TCP/IP Protocolo
Porta 11434 0,0.0.0/0 para qualquer lugar de tráfego TCP/IP Protocolo

Etapa 8: salve -o e agora execute seu aplicativo.

gunicorn -w 2 -b 0.0.0.0:8000 app:app

Etapa 9 - Execute a instância do porto público do EC2

Public_Address:8080

Se você encontrar algum erro como código: 400 enquanto estiver executando "https: {public_address}: 5000", basta executá -lo com 'http' em vez de 'https'.

Verifique se o seu aplicativo é acessível por http: // your-ec2-public-ip. O NGINX encaminhará solicitações para o Gunicorn, que serve o aplicativo Flask.

Essa configuração faz o seu aplicativo pronto para a produção usando o NGINX e o Gunicorn para estabilidade, desempenho e escalabilidade. Você pode continuar a dimensionar aumentando os trabalhadores de punas ou adicionando balanceamento de carga se o tráfego crescer.

Conclusão

Este chatbot de comércio eletrônico fornece uma experiência de compra inteligente e interativa por meio de uma abordagem de RAG que combina recuperação e geração, oferecendo recomendações relevantes de produtos com base em análises reais de clientes.
O modelo de grande idioma do LLAMA 3.1 e as incorporações HuggingFace permitem respostas diferenciadas, aprimorando o envolvimento do usuário com conversas contextualmente conscientes.
O manuseio eficiente de respostas com Redis e aipo atende às demandas de um aplicativo de alto desempenho, garantindo experiências estáveis e responsivas ao usuário, mesmo com grandes LLMs .
Uma implantação totalmente escalável do AWS EC2 permite integração perfeita em plataformas de comércio eletrônico, oferecendo infraestrutura robusta para ambientes de alto tráfego.
Este projeto mostra uma aplicação poderosa de grandes modelos de linguagem , ultrapassando os limites dos recursos de chatbot no domínio do comércio eletrônico.

Expandir

E Commerce_ChatBot

Chatbot de comércio eletrônico usando rag com llama e langchain

Introdução

Modelo e incorporação

Trapo com história de bate -papo

Manuseio de dados APORPORATH

Front -end e interação

Lidando com longos tempos de resposta com redis e aipo

Implantação no AWS EC2

Pilha de tecnologia usada

Infraestrutura

Conjunto de dados

Esses títulos, classificações, resumos e textos de revisão de produtos são aproveitados para criar incorporação e melhorar a relevância das respostas do chatbot na compreensão das perguntas dos clientes sobre produtos. Além disso, você pode baixar o conjunto de dados daqui

Detalhes do conjunto de dados

Instalação

Execute localmente

Etapa 1: Clone o repositório da sua máquina local:

Etapa 2: Navegue até o diretório do projeto:

Etapa 3: Crie um ambiente de conda depois de abrir o repositório

Etapa 4: instale os requisitos

Etapa 5: Configure variáveis ​​de ambiente:

Etapa 6: Baixe a API Ollama.

Etapa 7: vá para um novo terminal e depois de ativar o ambiente. Inicie o servidor ollama.

Etapa 8: Baixe o modelo LLAMA3.1-8B .

Etapa 9: Instale Redis

Etapa 10: Inicie o servidor Redis (geralmente feito na porta 6379 por padrão).

Etapa 11: verifique se o Redis está em execução. Deve retornar Pong se tudo estiver funcionando bem.

Etapa 12: Inicie o trabalhador do aipo. Em uma nova janela do terminal, ative o ambiente e execute:

Etapa 13: Execute o aplicativo de frasco. Em outro terminal, inicie seu aplicativo de frasco com Gunicorn

Etapa 14 - Aplicação de Previsão

Saídas de respostas do chatbot

Implantação da AWS

Etapa 1: empurre todo o seu código para o Github.

Etapa 2: Faça login no link da sua conta do AWS.

Etapa 3: inicie sua instância do EC2.

Etapa 4: configure sua instância EC2.

Etapa 5: comando para configurar a instância do EC2.

Informações: Atualização do sudo apt-get e a atualização do sudo apt são usadas para atualizar o índice de pacotes em um sistema baseado no Debian como o Ubuntu, mas eles são um pouco diferentes em termos das ferramentas que usam e sua funcionalidade:

Etapa 6: conecte sua instância do EC2 e comece a digitar os seguintes comandos

Etapa 6.1: Este comando usa Apt-Get, a ferramenta de gerenciamento de pacotes tradicional.

Etapa 6.2: Este comando usa APT, uma interface de linha de comando mais nova e mais amigável para o sistema de gerenciamento de pacotes APT.

Etapa 6.3: Instale o nginx, git e outras ferramentas

Etapa 6.3: Instale as ferramentas necessárias.

Etapa 6.4: Clone Git Repository.

Etapa 6.5: Navegue até o diretório do projeto:

Etapa 6.6: Crie um arquivo .env lá.

Etapa 6.6: Abra o arquivo no VI Editor.

Etapa 6.7: Pressione Inserir e mencionar a variável .Env Pressione ESC para salvar e escrever: WQ para saída.

Etapa 6.8: ### Para verificar os valores das variáveis ​​.env.

Etapa 6.9: Para instalar Python e Pip, aqui está um comando

Etapa 6.10: Instale os requisitos.txt. O sinalizador de pacote de system-sistema no PIP permite substituir o erro de ambiente manual externamente gerenciado e instalar os pacotes Python em todo o sistema.

O sinalizador de pacote de system-sistema no PIP permite substituir o erro de ambiente manual externamente gerenciado e instalar os pacotes Python em todo o sistema. PIP Package_Name --break-System-Packages

Etapa 6.11: Teste o aplicativo com Gunicorn. Verifique se o aplicativo está funcionando visitando http: // your-ec2-public-ip: 8000

Etapa 6.12: Configure o nginx como um proxy reverso. Configure o Nginx para encaminhar solicitações para o Gunicorn. Abra o arquivo de configuração do nginx:

Etapa 6.13: Atualize a configuração do NGINX da seguinte forma:

Salvar e fechar o arquivo

Etapa 6.14: depois reinicie o nginx:

Etapa 6.15: Configure o Gunicorn como um serviço de segundo plano. Para manter o Gunicorn funcionando como um serviço, configure um arquivo de serviço Systemd. Crie um novo arquivo de serviço:

Etapa 6.16: Atualize a configuração da seguinte forma:

Salvar e fechar o arquivo

Etapa 6.17: Inicie e habilite o serviço:

Etapa 7: Configure sua regra de entrada:

Etapa 8: salve -o e agora execute seu aplicativo.

Etapa 9 - Execute a instância do porto público do EC2

Se você encontrar algum erro como código: 400 enquanto estiver executando "https: {public_address}: 5000", basta executá -lo com 'http' em vez de 'https'.

Verifique se o seu aplicativo é acessível por http: // your-ec2-public-ip. O NGINX encaminhará solicitações para o Gunicorn, que serve o aplicativo Flask.

Essa configuração faz o seu aplicativo pronto para a produção usando o NGINX e o Gunicorn para estabilidade, desempenho e escalabilidade. Você pode continuar a dimensionar aumentando os trabalhadores de punas ou adicionando balanceamento de carga se o tráfego crescer.

Conclusão

Etapa 5: Configure variáveis de ambiente:

Etapa 6.8: ### Para verificar os valores das variáveis .env.