オリストは、主に市場を通じてeコマースセグメントで動作するブラジルのスタートアップです。それは国内によく広がっています。このプロジェクトは、包括的なオリストデータに関する詳細な分析です。元のオリストデータセットには、ブラジルの複数の市場で作られた2016年から2018年までの100,000の注文の情報があります。その機能により、注文ステータス、価格、支払い、貨物パフォーマンスから顧客の場所、製品の属性、最終的に顧客が書いたレビューまで、複数の次元から注文を表示できます。データセットのスキーマは次のとおりです。

記述分析から予測および予測分析に至るまで、データセットで複数の分析タスクが実行されます。
さまざまな分析タスクを以下にリストし、説明します。-
元のデータは、結合と操作によって複数のデータセットを導出するために使用されます。データ操作とcombinig jupyterノートには、ステップバイステップのプロセスと説明が含まれています。
ノートブックの予備データ分析には、詳細な分析が含まれています。このノートブックは、トレンド、パターン、または障害を見つけるために、オリジナルと組み合わせのデータセットを視覚化および要約します。この分析は、THデータセットの全体的な見方を提供します。
元のデータセットから作成されたトランザクションデータセットを使用して、頻繁なパターンアルゴリズム-FP成長ツリーを使用して、アソシエーションルールマイニングが実行されます。モデルは、10%の信頼性しきい値で頻繁なアイテムセットを返します。 Association Rule Mining Notebookには、このタスクの詳細な説明が含まれています。
この分析の目的は、オリスト生態系で最も人気のある製品、人気のある製品カテゴリ、カテゴリの人気製品を見つけることです。さらに、 - 説明のlenght、写真の数などの配信時間と製品の特性は、データの相関を見つけるために人気と比較されます。製品分析ノートブックには、詳細なコードが含まれています。
センチメント分析は、顧客が提供するレビューで実施されます。ノートブックには、センチメント分析のための監視された監視されていない方法が含まれていると、センチメント分析をレビューします。監視された手法は、センチメント分析のラベルとして提供される評価を使用しますが、監視されていないテクニックレキシコンアフィン、テキストブロブは分析を実行します。
貨物値は、各注文に関連付けられた送料です。貨物価値予測ノートブックには、売り手と顧客間の距離、製品の寸法と重量を考慮して、注文の出荷価値を予測するための詳細なモデルの構築手順が含まれています。さらに、モデルはWebサービスとしてAzuremlにも構築および展開されます。 WebAppは、Dash Plotlyを使用して作成され、貨物値の予測のためにモデルを照会します。
Webアプリケーションは、Dash Plotlyに組み込まれたHerokuに展開されます。このアプリケーションは、AzureMLプラットフォーム上に構築された貨物値予測モデルのフロントエンドを提供します。 Webアプリケーションには、次のファイル構造があります。
__ app.py
__ layout.py
__ requirements.txt
__ Procfile
__ Resources
|__ API_key
|__ URL
|__ ship.png
以下のスキーマは、Azuremlに基づいて構築されたWebサービスのものです。
app.pyファイルにはサーバーインスタンスが含まれており、レイアウト。pyファイルにはレンダリングするレイアウトが含まれています。 requistry.txtファイルには、Webアプリケーションの依存関係が含まれています
pip freeze > requirements.txt
Procfileは、APPサーバーのインスタンスを仮想マシンに起動するために使用されます。 Procfileの内容はです
web: gunicorn app:server
ファイルの準備ができたら、リポジトリをHeroku Masterに押します
heroku create new_app
git add .
git commit -m "intial push"
git push heroku master
heroku ps:scale web=1
展開されたWebアプリケーションには、このリンクを介してHerokuでアクセスできます。 https://olist-freight-app.herokuapp.com/
注: - AzureのWebサービスは現在、稼働していません。 Azureで同様のWebサービスを作成し、それに応じてAPI_KEYファイルとURLファイルを変更します。
オリストデータセットは、複数の面で分析されました。各分析により、ノートブックで報告されている新しい情報と洞察が明らかになりました。任意のクエリについては、[email protected]および[email protected]にお問い合わせください