Olist é uma startup brasileira que opera no segmento de comércio eletrônico, principalmente através do mercado. Está bem espalhado dentro do país. Este projeto é uma análise detalhada sobre os dados abrangentes da OLIST. O conjunto de dados OLIST original possui informações de 100 mil pedidos de 2016 a 2018, fabricados em vários mercados no Brasil. Seus recursos permitem visualizar um pedido de várias dimensões: do status do pedido, preço, pagamento e desempenho de frete até a localização do cliente, atributos do produto e, finalmente, revisões escritas pelos clientes. O esquema do conjunto de dados é como abaixo:-

Várias tarefas de análise são realizadas no conjunto de dados, desde análises descritivas até previsão e análise preditiva.
As várias tarefas de análise são listadas e explicadas abaixo:-
Os dados originais são usados para derivar vários conjuntos de dados por junções e manipulações. A manipulação de dados e o notebook Jupyter Combinig Jupyter contém o processo e explicações passo a passo.
A análise de dados preliminares do Notebook contém a análise detalhada. Este notebook visualiza e resume os conjuntos de dados originais e combinados, para encontrar tendências, padrões ou falhas. Esta análise fornece uma visão holística do conjunto de dados.
Usando o conjunto de dados transacional criado a partir do conjunto de dados original, a mineração de regras de associação é realizada usando algoritmos de padrões frequentes - árvores de crescimento de FP. O modelo retorna conjuntos de itens frequentes com um limite de confiança de 10%. O notebook de mineração de regras da associação contém a explicação detalhada para esta tarefa.
O objetivo desta análise é encontrar os produtos mais populares, categorias de produtos populares e produtos populares de categoria no ecossistema Olist. Além disso, os tempos de entrega e as características do produto, como - Descrição Lenght, número de fotos etc., são comparadas à popularidade para encontrar correlações nos dados. O notebook de análise de produtos contém o código detalhado.
A análise de sentimentos é realizada nas revisões oferecidas pelos clientes. O notebook contém métodos supervisionados e não supervisionados para análise de sentimentos, analisa a análise de sentimentos. A técnica supervisionada usa a classificação fornecida como rótulo para análise de sentimentos, enquanto a técnica não supervisionada léxicons- afinn, textblob para executar a análise.
O valor do frete é o valor de envio associado a cada pedido. O notebook de previsão do valor do frete contém etapas detalhadas de construção de modelos para prever o valor de envio de um pedido, dada a distância entre vendedor e cliente, as dimensões e o peso do produto. Além disso, o modelo também é construído e implantado no AzureML como um serviço da web. Um WebApp é criado usando plotagem DASH, para consultar o modelo para previsões de valor de frete.
O aplicativo da web é implantado no Heroku, construído em plotagem. O aplicativo fornece um modelo front -end para o modelo preditor de valor de frete criado na plataforma AzureML. O aplicativo da web possui a seguinte estrutura de arquivo.
__ app.py
__ layout.py
__ requirements.txt
__ Procfile
__ Resources
|__ API_key
|__ URL
|__ ship.png
O esquema abaixo é do serviço da web criado no AzureML.
O arquivo app.py contém a instância do servidor e o arquivo layout.py contém o layout a ser renderizado. O arquivo requisitos.txt contém as dependências do aplicativo da web
pip freeze > requirements.txt
O procfile é usado para iniciar uma instância do servidor de aplicativos na máquina virtual. O conteúdo do procfile são
web: gunicorn app:server
Depois que os arquivos estiverem prontos, empurre o repositório para o Heroku Master
heroku create new_app
git add .
git commit -m "intial push"
git push heroku master
heroku ps:scale web=1
O aplicativo da web, implantado pode ser acessado no Heroku através deste link. https://olist-freight-app.herokuapp.com/
Nota:- O serviço da web no Azure não está atualmente em funcionamento. Por favor, crie um serviço da Web semelhante no Azure e altere os arquivos API_KEY e URL de acordo.
O conjunto de dados OLIST foi analisado em várias frentes. Cada análise revelou novas informações e idéias, conforme relatado no caderno. Para qualquer dúvida, entre em contato com - [email protected] e [email protected]