Olist es una startup brasileña que opera en el segmento de comercio electrónico, principalmente a través del mercado. Está bien extendido dentro del país. Este proyecto es un análisis detallado sobre los datos integrales de Olist. El conjunto de datos Olist original tiene información de 100k pedidos de 2016 a 2018 realizados en múltiples mercados de Brasil. Sus características permiten ver un pedido desde múltiples dimensiones: desde el estado del pedido, el precio, el pago y el rendimiento de la carga hasta la ubicación del cliente, los atributos del producto y finalmente las revisiones escritas por los clientes. El esquema del conjunto de datos es el siguiente:-

Se realizan múltiples tareas de análisis en el conjunto de datos, que van desde el análisis descriptivo hasta el pronóstico y el análisis predictivo.
Las diversas tareas de análisis se enumeran y se explican a continuación:-
Los datos originales se utilizan para obtener múltiples conjuntos de datos mediante uniones y manipulaciones. La manipulación de datos y el cuaderno combinig Jupyter contienen el proceso paso a paso y las explicaciones.
El análisis de datos preliminar del cuaderno contiene el análisis detallado. Este cuaderno visualiza y resume los conjuntos de datos originales y combinados, para encontrar tendencias, patrones o fallas. Este análisis ofrece una visión holística del conjunto de datos.
Utilizando el conjunto de datos transaccional creado a partir del conjunto de datos original, la minería de reglas de asociación se realiza utilizando algoritmos de patrones frecuentes: árboles de crecimiento FP. El modelo devuelve conjuntos de elementos frecuentes con un umbral de confianza del 10%. El cuaderno minero de la regla de asociación contiene la explicación detallada de esta tarea.
El objetivo de este análisis es encontrar los productos más populares, las categorías de productos populares y los productos populares sabios en el ecosistema Olist. Además, los tiempos de entrega y las características del producto, como la descripción, la longitud, el número de fotos, etc., se comparan con la popularidad para encontrar correlaciones en los datos. El cuaderno de análisis de productos contiene el código detallado.
El análisis de sentimientos se lleva a cabo en las revisiones ofrecidas por los clientes. El cuaderno contiene métodos supervisados y no supervisados para el análisis de sentimientos, revisa el análisis de sentimientos. La técnica supervisada utiliza la calificación proporcionada como etiqueta para el análisis de sentimientos, mientras que la técnica no supervisada Lexicons- afinn, textblob para realizar el análisis.
El valor de flete es el valor de envío asociado con cada pedido. El cuaderno de predicción del valor de flete contiene pasos detallados de la construcción de modelos para predecir el valor de envío de un pedido, dada la distancia entre el vendedor y el cliente, las dimensiones y el peso del producto. Además, el modelo también se construye e implementa en Azureml como un servicio web. Se crea una aplicación web utilizando Dash Plotly, para consultar el modelo de predicciones de valor de flete.
La aplicación web se implementa en Heroku, construida en Dash Plotly. La aplicación proporciona una parte delantera al modelo de predictor de valor de flete construido en la plataforma Azureml. La aplicación web tiene la siguiente estructura de archivo.
__ app.py
__ layout.py
__ requirements.txt
__ Procfile
__ Resources
|__ API_key
|__ URL
|__ ship.png
El esquema a continuación es del servicio web construido en Azureml.
El archivo App.py contiene la instancia del servidor y el archivo LightOut.py contiene el diseño que se representará. El archivo requisitos.txt contiene las dependencias de la aplicación web
pip freeze > requirements.txt
El ProCfile se utiliza para iniciar una instancia del servidor de aplicaciones en la máquina virtual. El contenido del procfile son
web: gunicorn app:server
Una vez que los archivos estén listos, empuje el repositorio a Heroku Master
heroku create new_app
git add .
git commit -m "intial push"
git push heroku master
heroku ps:scale web=1
Se puede acceder a la aplicación web, implementada en Heroku a través de este enlace. https://olist-freight-app.herokuapp.com/
Nota:- El servicio web en Azure no está actualmente, en funcionamiento. Por favor, cree un servicio web similar en Azure y cambie los archivos API_KEY y URL en consecuencia.
El conjunto de datos Olist se analizó en múltiples frentes. Cada análisis reveló nueva información e ideas como se informa en el cuaderno. Para cualquier consulta, contacte - [email protected] y [email protected]