E Commerce_ChatBotダウンロード-E E Commerce_ChatBotソースコードダウンロード

ラグを使用したeコマースチャットボットとlangchain

導入

このプロジェクトは、検索された世代（RAG）アプローチを使用して構築されたeコマースチャットボットです。 RAGは、情報検索と生成言語モデルの力を組み合わせて、ベクトルデータベースに保存されている広範な製品関連情報に基づいて、チャットボットが正確でコンテキスト認識される応答を提供できるようにします。 Langchainをフレームワークとして使用して、チャットボットのコンポーネントを管理し、検索生成フローを効率的に調整しました。

モデルと埋め込み

チャットボットは、微妙なコンテキストを理解し、コヒーレントな応答を生成する能力で知られている大規模な言語モデルであるllama3.1-8bを採用しています。検索のパフォーマンスを向上させるために、プロジェクトは、Huggingfaceの文の変換器/All-MPNet-Base-V2モデルによって生成された埋め込みを活用します。これらの埋め込みはセマンティックの意味をエンコードし、チャットボットがユーザークエリに基づいて関連する製品データを迅速に取得できるようにします。埋め込みは、高性能ベクトルデータベースとして機能するAstradBで保存および管理されています。

チャットの履歴とぼろきれ

Chatbotは、一貫性のあるコンテキスト対応の応答を提供するために、履歴認識のRAGアプローチを使用します。各インタラクションにチャット履歴を組み込むことにより、モデルは以前のメッセージへの参照を理解し、複数回転にわたって連続性を維持できます。 Langchainの履歴管理機能は、各ユーザーセッションのチャット履歴のステートフルな管理を可能にすることにより、このプロセスをシームレスにします。

データセット処理apporach

このプロジェクトで使用されているデータセットは、eコマースプラットフォームであるFlipkartから供給された製品レビューで構成されています。データセットには、製品タイトル、評価、詳細なレビューが含まれており、さまざまな製品にわたる顧客フィードバックの包括的なビューを提供します。このデータセットの主な目的は、チャットボットの検索機能を強化し、実際の製品感情、機能、および顧客体験を参照できるようにすることです。各レビューは、レビューをコンテンツとして、製品名をメタデータとして含むLangchain内のドキュメントオブジェクトとして保存されます。データセットはベクトルストアとしてAstradBに摂取され、ユーザークエリと関連するレビューと一致する類似性検索を可能にし、チャットボットの推奨事項と応答を強化します。

フロントエンドと相互作用

フロントエンドは、 HTML 、 CSS 、およびJavaScriptを使用して作成されたレスポンシブWebインターフェイスであり、直感的なチャットエクスペリエンスを提供するように設計されています。ユーザーはチャットボットと対話して、製品の詳細について問い合わせ、パーソナライズされた推奨事項を受け取ることができます。インターフェイスはCSSでスタイリングされており、最新のグラデーションの背景と、ユーザーメッセージとボット応答がリアルタイムで表示される構造化されたチャットボックスを備えています。

RedisとCeleryで長い応答時間を処理します

モデルの大きなサイズを考えると、 Llama 3.1-8Bで応答を生成すると、デフォルトの1分間のサーバータイムアウト制限を超えることがあります。これを管理するために、 Redisをメッセージブローカーとして実装し、背景タスク管理のためにセロリを実装しました。ユーザーがクエリを送信すると、チャットボットは応答を非同期に処理するセロリタスクをトリガーし、フロントエンドが応答ステータスを定期的に投票できるようにします。この方法は、ユーザーが中断せずに応答を受け取るようにしながら、サーバーのタイムアウトエラーを効果的に防止します。

AWS EC2の展開

チャットボットはAWS EC2に展開されており、モデルを実行し、ユーザーのインタラクションの処理、データベースからの検索の管理を促進できるスケーラブルで堅牢な環境を提供します。

使用される技術スタック

言語：Python
フレームワーク：Langchain
バックエンド：フラスコ
モデル：llama 3.1-8b（ollama）、Huggingface cente-transformers
データベース：astradb（埋め込み用のベクトルストレージ）
メッセージキュー：Redis
タスク管理：セロリ
FrontEnd ：HTML、CSS、JavaScript

インフラストラクチャー

展開：AWS EC2
バージョンコントロール：Github

データセット

このプロジェクトのデータセットはKaggleから取得されます。これがデータセットリンクです。このプロジェクトで使用されているデータセットには、次の重要な機能を含む、Flipkartから収集されたさまざまなブランドのヘッドフォン、Erabudsなどに関する450の製品レビューが含まれています。

製品ID ：各製品の一意の識別子。
製品タイトル：製品の名前またはタイトル。これは、推奨事項の製品コンテキストを理解するのに役立ちます。
評価：ユーザーから与えられた数値評価（5）。製品の品質を示しています。
概要：レビューの短い要約または見出し。
レビュー：詳細なユーザーレビュー。製品に関するユーザーのエクスペリエンスに関する洞察を提供します。

これらの製品タイトル、評価、要約、レビューテキストは、埋め込みを作成し、製品に関する顧客の問い合わせを理解する上でチャットボットの応答の関連性を向上させるために活用されています。また、こちらからデータセットをダウンロードすることもできます

データセットの詳細

データセット名：flipkart_dataset
列数：5
レコード数：450

インストール

コードはPython 3.10.15で記述されています。 Pythonをインストールしていない場合は、ここで見つけることができます。 Pythonの低いバージョンを使用している場合は、PIPパッケージを使用してアップグレードして、PIPの最新バージョンを確保できます。

ローカルで実行します

ステップ1：リポジトリをローカルマシンにクローンします。

git clone https://github.com/jatin-12-2002/E-Commerce_ChatBot

ステップ2：プロジェクトディレクトリに移動します：

 cd E-Commerce_ChatBot

ステップ3：リポジトリを開いた後、コンドラ環境を作成する

conda create -p env python=3.10 -y

 source activate ./env

ステップ4：要件をインストールします

pip install -r requirements.txt

ステップ5：環境変数の設定：

プロジェクトディレクトリに.ENVファイルを作成します。
データベース接続文字列、APIキーなどの必要な環境変数を定義します。
.envファイルには、これらの変数が必要なはずです。

ASTRA_DB_API_ENDPOINT= " "
ASTRA_DB_APPLICATION_TOKEN= " "
ASTRA_DB_KEYSPACE= " "
HF_TOKEN= " "

私の.envファイルはこちらです

ステップ6：Ollama APIをダウンロードします。

curl -fsSL https://ollama.com/install.sh | sh

ステップ7：新しい端末に移動し、環境をアクティブにした後。 Ollamaサーバーを開始します。

ollama serve

ステップ8： LLAMA3.1-8Bモデルをダウンロードします。

ollama pull llama3.1:8b

ステップ9：Redisをインストールします

sudo apt-get update

sudo apt-get install redis-server

ステップ10：Redisサーバーを起動します（通常はデフォルトでポート6379で実行されます）。

sudo service redis-server start

ステップ11：Redisが実行されているかどうかを確認します。すべてが正常に機能している場合は、ポンを返すはずです。

redis-cli ping

ステップ12：セロリワーカーを開始します。新しいターミナルウィンドウで、環境をアクティブにしてから実行します。

celery -A app.celery worker --loglevel=info

ステップ13：フラスコアプリケーションを実行します。別の端末で、Gunicornでフラスコのアプリケーションを開始します

gunicorn -w 2 -b 0.0.0.0:8000 app:app

ステップ14-予測アプリケーション

http://localhost:8000/

チャットボット応答出力

AWS展開

ステップ1：コード全体をgithubに押します。

ステップ2：AWSアカウントリンクにログインします。

ステップ3：EC2インスタンスを起動します。

ステップ4：EC2インスタンスを構成します。

Use t2.large or greater size instances only as it is a GenerativeAI using LLMs project.

ステップ5：EC2インスタンスを構成するためのコマンド。

情報：Sudo Apt-GetアップデートとSudo Aptアップデートは、UbuntuのようなDebianベースのシステムでパッケージインデックスを更新するために使用されますが、使用するツールと機能性の点でわずかに異なります。

ステップ6：EC2インスタンスを接続し、次のコマンドの入力を開始します

ステップ6.1：このコマンドは、従来のパッケージ管理ツールであるApt-Getを使用します。

sudo apt-get update

ステップ6.2：このコマンドでは、APTパッケージ管理システムの新しい、よりユーザーフレンドリーなコマンドラインインターフェイスを使用します。

sudo apt update -y

ステップ6.3：NGINX、GIT、その他のツールをインストールします

sudo apt install git nginx -y

ステップ6.3：必要なツールをインストールします。

sudo apt install git curl unzip tar make sudo vim wget -y

ステップ6.4：クローンGitリポジトリ。

git clone https://github.com/jatin-12-2002/E-Commerce_ChatBot

ステップ6.5：プロジェクトディレクトリに移動します。

 cd E-Commerce_ChatBot

ステップ6.6：そこに.envファイルを作成します。

touch .env

ステップ6.6：VIエディターでファイルを開きます。

vi .env

ステップ6.7：挿入を押して.ENV変数を参照してから、ESCを押して保存して書き込みます：wq for Exit。

ASTRA_DB_API_ENDPOINT= " "
ASTRA_DB_APPLICATION_TOKEN= " "
ASTRA_DB_KEYSPACE= " "
HF_TOKEN= " "

ステップ6.8：### .env変数の値をチェックするため。

cat .env

ステップ6.9：PythonとPipをインストールするためのコマンドがあります

sudo apt install python3-pip

ステップ6.10：要件をインストールします。txt。 PIPの-Break-System-Packagesフラグを使用すると、外部で管理された環境エラーをオーバーライドし、Pythonパッケージをシステム全体にインストールできます。

pip3 install -r  requirements.txt

または

pip3 install -r  requirements.txt --break-system-packages

PIPの-Break-System-Packagesフラグにより、外部から管理された環境エラーをオーバーライドし、Pythonパッケージをシステム全体にインストールできます。 PIPインストールpackage_name - break-system-packages

ステップ6.11：Gunicornでアプリケーションをテストします。 http：// your-ec2-public-ip：8000にアクセスして、アプリが機能していることを確認します

gunicorn -w 2 -b 0.0.0.0:8000 app:app

ステップ6.12：Nginxを逆プロキシとして構成します。 Nginxをセットアップして、Gunicornにリクエストを転送します。 nginx構成ファイルを開きます：

sudo nano /etc/nginx/sites-available/default

ステップ6.13：NGINX構成を次のように更新します。

server {
    listen 80 ;
    server_name your-ec2-public-ip ;

    location / {
        proxy_pass http://127.0.0.1:8000 ;
        proxy_set_header Host $host ;
        proxy_set_header X-Real-IP $remote_addr ;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for ;
        proxy_set_header X-Forwarded-Proto $scheme ;
    }
}

ファイルを保存して閉じます

ステップ6.14：次にnginxを再起動します：

sudo systemctl restart nginx

ステップ6.15：グリニコーンをバックグラウンドサービスとしてセットアップします。 Gunicornをサービスとして実行し続けるには、SystemDサービスファイルを設定します。新しいサービスファイルを作成します。

sudo nano /etc/systemd/system/gunicorn.service

ステップ6.16：次のように構成を更新します。

[Unit]
Description=Gunicorn instance to serve my project
After=network.target

[Service]
User=ubuntu
Group=www-data
WorkingDirectory=/home/ubuntu/E-Commerce_ChatBot_Project
ExecStart=/usr/bin/gunicorn --workers 4 --bind 127.0.0.1:8000 app:app

[Install]
WantedBy=multi-user.target

ファイルを保存して閉じます

ステップ6.17：サービスを開始して有効にします。

sudo systemctl start gunicorn

sudo systemctl enable gunicorn

ステップ7：インバウンドルールを構成します：

セキュリティの中に入ります
セキュリティグループをクリックします
特定の値でインバウンドルールを構成します
ポート5000 0.0.0.0/0どこでもトラフィックTCP/IPプロトコルの場合
どこでもトラフィックTCP/IPプロトコルのポート8000 0.0.0.0/0
ポート11434 0.0.0.0/0どこでもトラフィックTCP/IPプロトコルの場合

ステップ8：保存して、アプリケーションを実行します。

gunicorn -w 2 -b 0.0.0.0:8000 app:app

ステップ9-EC2インスタンスのパブリックポートを実行する

Public_Address:8080

「https：{public_address}：5000 "を実行中にコードのようなエラーが発生した場合、「https」ではなく「http」で実行するだけです。

http：// your-ec2-public-ipからアプリにアクセスできることを確認してください。 Nginxは、Flaskアプリを提供するGunicornにリクエストを転送します。

このセットアップにより、NginxとGunicornを使用して安定性、パフォーマンス、スケーラビリティを使用することで、アプリが制作可能になります。グニコーン労働者を増やしたり、交通量が増えた場合に負荷分散を追加することで、引き続きスケーリングを行うことができます。

結論

このeコマースチャットボットは、検索と生成を組み合わせたぼろきれのアプローチを通じて、インテリジェントでインタラクティブなショッピングエクスペリエンスを提供し、実際の顧客レビューに基づいて関連する製品の推奨事項を提供します。
llama 3.1の大規模な言語モデルとハギングフェイスの埋め込みは、微妙な応答を可能にし、文脈的に認識した会話とのユーザーエンゲージメントを強化します。
Redis and Celryを使用した効率的な対応処理は、高性能アプリケーションの要求に対処し、大規模なLLMSでも安定した応答性の高いユーザーエクスペリエンスを確保します。
完全にスケーラブルなAWS EC2展開により、 eコマースプラットフォームへのシームレスな統合が可能になり、高トラフィック環境向けの堅牢なインフラストラクチャが提供されます。
このプロジェクトでは、大規模な言語モデルの強力なアプリケーションを紹介し、eコマースドメインのチャットボット機能の境界を押し広げます。

拡大する

E Commerce_ChatBot

ラグを使用したeコマースチャットボットとlangchain

導入

モデルと埋め込み

チャットの履歴とぼろきれ

データセット処理apporach

フロントエンドと相互作用

RedisとCeleryで長い応答時間を処理します

AWS EC2の展開

使用される技術スタック

インフラストラクチャー

データセット

データセットの詳細

インストール

ローカルで実行します

ステップ1：リポジトリをローカルマシンにクローンします。

ステップ2：プロジェクトディレクトリに移動します：

ステップ3：リポジトリを開いた後、コンドラ環境を作成する

ステップ4：要件をインストールします

ステップ5：環境変数の設定：

ステップ6：Ollama APIをダウンロードします。

ステップ7：新しい端末に移動し、環境をアクティブにした後。 Ollamaサーバーを開始します。

ステップ8： LLAMA3.1-8Bモデルをダウンロードします。

ステップ9：Redisをインストールします

ステップ10：Redisサーバーを起動します（通常はデフォルトでポート6379で実行されます）。

ステップ11：Redisが実行されているかどうかを確認します。すべてが正常に機能している場合は、ポンを返すはずです。

ステップ12：セロリワーカーを開始します。新しいターミナルウィンドウで、環境をアクティブにしてから実行します。

ステップ13：フラスコアプリケーションを実行します。別の端末で、Gunicornでフラスコのアプリケーションを開始します

ステップ14-予測アプリケーション

チャットボット応答出力

AWS展開

ステップ1：コード全体をgithubに押します。

ステップ2：AWSアカウントリンクにログインします。

ステップ3：EC2インスタンスを起動します。

ステップ4：EC2インスタンスを構成します。

ステップ5：EC2インスタンスを構成するためのコマンド。

情報：Sudo Apt-GetアップデートとSudo Aptアップデートは、UbuntuのようなDebianベースのシステムでパッケージインデックスを更新するために使用されますが、使用するツールと機能性の点でわずかに異なります。

ステップ6：EC2インスタンスを接続し、次のコマンドの入力を開始します

ステップ6.1：このコマンドは、従来のパッケージ管理ツールであるApt-Getを使用します。

ステップ6.2：このコマンドでは、APTパッケージ管理システムの新しい、よりユーザーフレンドリーなコマンドラインインターフェイスを使用します。

ステップ6.3：NGINX、GIT、その他のツールをインストールします

ステップ6.3：必要なツールをインストールします。

ステップ6.4：クローンGitリポジトリ。

ステップ6.5：プロジェクトディレクトリに移動します。

ステップ6.6：そこに.envファイルを作成します。

ステップ6.6：VIエディターでファイルを開きます。

ステップ6.7：挿入を押して.ENV変数を参照してから、ESCを押して保存して書き込みます：wq for Exit。

ステップ6.8：### .env変数の値をチェックするため。

ステップ6.9：PythonとPipをインストールするためのコマンドがあります

ステップ6.10：要件をインストールします。txt。 PIPの-Break-System-Packagesフラグを使用すると、外部で管理された環境エラーをオーバーライドし、Pythonパッケージをシステム全体にインストールできます。

PIPの-Break-System-Packagesフラグにより​​、外部から管理された環境エラーをオーバーライドし、Pythonパッケージをシステム全体にインストールできます。 PIPインストールpackage_name - break-system-packages

ステップ6.11：Gunicornでアプリケーションをテストします。 http：// your-ec2-public-ip：8000にアクセスして、アプリが機能していることを確認します

ステップ6.12：Nginxを逆プロキシとして構成します。 Nginxをセットアップして、Gunicornにリクエストを転送します。 nginx構成ファイルを開きます：

ステップ6.13：NGINX構成を次のように更新します。

ファイルを保存して閉じます

ステップ6.14：次にnginxを再起動します：

ステップ6.15：グリニコーンをバックグラウンドサービスとしてセットアップします。 Gunicornをサービスとして実行し続けるには、SystemDサービスファイルを設定します。新しいサービスファイルを作成します。

ステップ6.16：次のように構成を更新します。

ファイルを保存して閉じます

ステップ6.17：サービスを開始して有効にします。

ステップ7：インバウンドルールを構成します：

ステップ8：保存して、アプリケーションを実行します。

ステップ9-EC2インスタンスのパブリックポートを実行する

「https：{public_address}：5000 "を実行中にコードのようなエラーが発生した場合、「https」ではなく「http」で実行するだけです。

http：// your-ec2-public-ipからアプリにアクセスできることを確認してください。 Nginxは、Flaskアプリを提供するGunicornにリクエストを転送します。

結論

PIPの-Break-System-Packagesフラグにより、外部から管理された環境エラーをオーバーライドし、Pythonパッケージをシステム全体にインストールできます。 PIPインストールpackage_name - break-system-packages