Olist est une startup brésilienne qui opère dans le segment du commerce électronique, principalement par le marché. Il est bien réparti dans le pays. Ce projet est une analyse détaillée sur les données OLIST complètes. L'ensemble de données OLIST original a des informations sur 100 000 commandes de 2016 à 2018 faites sur plusieurs marchés au Brésil. Ses fonctionnalités permettent de visualiser une commande à partir de plusieurs dimensions: à partir de l'état de la commande, du prix, du paiement et des performances de fret à l'emplacement du client, aux attributs du produit et enfin à des avis écrits par les clients. Le schéma de l'ensemble de données est comme ci-dessous: -

Plusieurs tâches d'analyse sont effectuées sur l'ensemble de données, allant de l'analyse descriptive à la prévision et à l'analyse prédictive.
Les différentes tâches d'analyse sont répertoriées et expliquées ci-dessous: -
Les données d'origine sont utilisées pour dériver plusieurs ensembles de données par les jointures et les manipulations. La manipulation de données et le carnet de jupyter Combinig contient le processus et les explications étape par étape.
L'analyse des données préliminaires du cahier contient l'analyse détaillée. Ce carnet visualise et résume les ensembles de données originaux et combinés, pour trouver des tendances, des modèles ou des défauts. Cette analyse donne une vision holistique de l'ensemble de données.
En utilisant l'ensemble de données transactionnel créé à partir de l'ensemble de données d'origine, l'exploitation des règles d'association est effectuée à l'aide d'algorithmes de motifs fréquents - FP Growth Trees. Le modèle renvoie des ensembles d'articles fréquents avec un seuil de confiance de 10%. Le carnet d'exploration de règles d'association contient l'explication détaillée de cette tâche.
L'objectif de cette analyse est de trouver les produits les plus populaires, les catégories de produits populaires et les produits populaires par catégorie dans l'écosystème OLIST. De plus, les délais de livraison et les caractéristiques des produits tels que - Description Lenght, Nombre de photos, etc., sont comparés à la popularité pour trouver des corrélations dans les données. Le carnet d'analyse de produit contient le code détaillé.
L'analyse des sentiments est effectuée sur les revues offertes par les clients. Le cahier contient des méthodes supervisées et non supervisées pour l'analyse des sentiments, examine l'analyse des sentiments. La technique supervisée utilise la notation fournie comme étiquette pour l'analyse des sentiments, tandis que la technique non supervisée Lexicons - Afinn, TextBlob pour effectuer l'analyse.
La valeur de fret est la valeur d'expédition associée à chaque commande. Le carnet de prédiction de valeur de fret contient des étapes détaillées de création de modèles pour prédire la valeur d'expédition d'une commande, compte tenu de la distance entre le vendeur et le client, les dimensions et le poids du produit. De plus, le modèle est également construit et déployé sur Azureml en tant que service Web. A WebApp est créé à l'aide de Dash Plotly, pour interroger le modèle pour les prévisions de valeur de fret.
L'application Web est déployée sur Heroku, construite dans Dash Plotly. L'application fournit un frontal au modèle de prédicteur de valeur de fret construit sur la plate-forme Azureml. L'application Web a la structure de fichiers suivante.
__ app.py
__ layout.py
__ requirements.txt
__ Procfile
__ Resources
|__ API_key
|__ URL
|__ ship.png
Le schéma ci-dessous est du service Web construit sur Azureml.
Le fichier app.py contient l'instance de serveur et le fichier Layout.py contient la mise en page à rendre. Le fichier exigence.txt contient les dépendances de l'application Web
pip freeze > requirements.txt
Le ProCFile est utilisé pour lancer une instance du serveur d'applications sur la machine virtuelle. Le contenu du Procfile est
web: gunicorn app:server
Une fois les fichiers prêts, poussez le repo vers Heroku Master
heroku create new_app
git add .
git commit -m "intial push"
git push heroku master
heroku ps:scale web=1
L'application Web, déployée est accessible sur Heroku via ce lien. https://olist-freight-app.herokuapp.com/
Remarque: - Le service Web sur Azure n'est pas actuellement, opérationnel. Veuillez créer un service Web similaire sur Azure et modifier les fichiers API_KEY et URL en conséquence.
L'ensemble de données OLIST a été analysé sur plusieurs fronts. Chaque analyse a révélé de nouvelles informations et informations comme indiqué dans le cahier. Pour toute question, contactez - [email protected] et [email protected]