Olist ist ein brasilianisches Startup, das im E-Commerce-Segment hauptsächlich über den Markt tätig ist. Es ist im Land gut verbreitet. Dieses Projekt ist eine detaillierte Analyse der umfassenden Olist -Daten. Der ursprüngliche Olist -Datensatz enthält Informationen zu 100.000 Bestellungen von 2016 bis 2018 auf mehreren Marktplätzen in Brasilien. Die Funktionen ermöglichen das Anzeigen einer Bestellung aus mehreren Dimensionen: Aus Bestellungsstatus, Preis, Zahlung und Frachtleistung bis hin zu Kundenstandort, Produktattributen und schließlich von Kunden bewerteten Bewertungen. Das Schema des Datensatzes ist wie unten:-

Auf dem Datensatz werden mehrere Analyseaufgaben durchgeführt, die von der deskriptiven Analyse bis zur Prognose und der prädiktiven Analyse reichen.
Die verschiedenen Analyseaufgaben werden unten aufgeführt und erläutert:-
Die Originaldaten werden verwendet, um mehrere Datensätze durch Verbindungen und Manipulationen abzuleiten. Das Datenmanipulation und das Combinig -Jupyter -Notizbuch enthält den Schritt -für -Schritt -Prozess und die Erklärungen.
Die vorläufige Datenanalyse Notebook enthält die detaillierte Analyse. Dieses Notebook visualisiert und fasst das Original und die kombinierten Datensätze zusammen, um Trends, Muster oder Fehler zu finden. Diese Analyse gibt eine ganzheitliche Ansicht des Datensatzes.
Unter Verwendung des aus dem ursprünglichen Datensatz erstellten Transaktionsdatensatz wird die Assoziationsregel -Mining unter Verwendung häufiger Musteralgorithmen - FP -Wachstumsbäume - durchgeführt. Das Modell gibt häufige Artikelsätze mit einer Vertrauensschwelle von 10%zurück. Das Association Rul Mining Notebook enthält die detaillierte Erklärung für diese Aufgabe.
Das Ziel dieser Analyse ist es, die beliebtesten Produkte, die beliebten Produktkategorien und die kategorienweise beliebte Produkte im olistischen Ökosystem zu finden. Darüber hinaus werden die Lieferzeiten und Produktmerkmale wie - Beschreibung Lenght, Anzahl der Fotos usw. mit Popularität verglichen, um Korrelationen in den Daten zu finden. Das Produktanalysebuch enthält den detaillierten Code.
Die Stimmungsanalyse wird zu den von den Kunden angebotenen Bewertungen durchgeführt. Das Notizbuch enthält überwachte und unbeaufsichtigte Methoden zur Stimmungsanalyse, Überprüfung der Stimmungsanalyse. Die überwachte Technik verwendet das als Etikett für die Stimmungsanalyse bereitgestellte Bewertung, während die unbeaufsichtigte Technik-Lexikone- AFINN, textblob zur Durchführung der Analyse.
Der Frachtwert ist der Versandwert, der jeder Bestellung zugeordnet ist. Das Notizbuch zur Vorhersage des Frachtwerts enthält detaillierte Schritte zur Erstellung von Modellbildung, um den Versandwert für eine Bestellung vorzulegen, angesichts der Entfernung zwischen Verkäufer und Kunde, den Abmessungen und dem Gewicht des Produkts. Darüber hinaus wird das Modell auch in Azureml als Webdienst erstellt und bereitgestellt. Ein WebApp wird mithilfe von Dash Plotly erstellt, um das Modell für Frachtwertvorhersagen abzufragen.
Die Webanwendung wird auf Heroku eingesetzt, das in Dash Plotly integriert ist. Die Anwendung bietet ein Frontend für das auf der Azureml -Plattform basierende Value -Prädiktormodell. Die Webanwendung hat die folgende Dateistruktur.
__ app.py
__ layout.py
__ requirements.txt
__ Procfile
__ Resources
|__ API_key
|__ URL
|__ ship.png
Das folgende Schema ist des Webdienstes, der auf Azureml basiert.
Die App.py -Datei enthält die Serverinstanz und die Datei layout.py enthält das zu rendere Layout. Die Datei der Anforderungen.txt enthält die Abhängigkeiten der Webanwendung
pip freeze > requirements.txt
Mit dem Procfile wird eine Instanz des App -Servers auf die virtuelle Maschine gestartet. Der Inhalt der Procfile ist
web: gunicorn app:server
Sobald die Dateien fertig sind, drücken Sie das Repo zum Heroku -Meister
heroku create new_app
git add .
git commit -m "intial push"
git push heroku master
heroku ps:scale web=1
Auf die vom Bereitstellungsanwendungen bereitgestellte Webanwendung kann über diesen Link auf Heroku zugegriffen werden. https://olist-freighight-app.herokuapp.com/
Hinweis:- Der Webdienst auf Azure ist derzeit nicht in Betrieb. Erstellen Sie bitte einen ähnlichen Webdienst auf Azure und ändern Sie die Dateien api_key und URL entsprechend.
Der Olist -Datensatz wurde an mehreren Fronten analysiert. Jede Analyse enthüllte neue Informationen und Erkenntnisse, wie im Notebook berichtet. Für Fragen wenden Sie sich an - [email protected] und [email protected]