Olist-это бразильский стартап, который работает в сегменте электронной коммерции, в основном через рынок. Это хорошо распространено в стране. Этот проект представляет собой подробный анализ комплексных данных олистов. Оригинальный набор данных Olist содержит информацию о 100 тыс. Заказов с 2016 по 2018 год, сделанный на нескольких рынках в Бразилии. Его функции позволяют просматривать заказ из нескольких измерений: от статуса заказа, цены, оплаты и производительности груза до местоположения клиента, атрибутов продукта и, наконец, обзоров, написанных клиентами. Схема набора данных такова, как ниже:-

Многочисленные задачи анализа выполняются в наборе данных, начиная от описательного анализа до прогнозирования и прогнозного анализа.
Различные задачи анализа перечислены и объяснены ниже:-
Исходные данные используются для получения нескольких наборов данных с помощью соединений и манипуляций. Записная книжка манипулирования данными и комбинированная тетрадь Юпитера содержит пошаговый процесс и объяснения.
Предварительный анализ ноутбуков содержит подробный анализ. Этот ноутбук визуализирует и суммирует оригинальные и комбинированные наборы данных, чтобы найти тенденции, шаблоны или неисправности. Этот анализ дает целостный взгляд на набор данных TH.
Используя транзакционный набор данных, созданный из исходного набора данных, добыча правил ассоциации выполняется с использованием алгоритмов частых рисунков - деревьев роста FP. Модель возвращает частые наборы элементов с порогом достоверности 10%. Записная книжка по добыче правил ассоциации содержит подробное объяснение этой задачи.
Цель этого анализа - найти самые популярные продукты, популярные категории продуктов и категорию популярных продуктов в экосистеме Olist. Кроме того, сроки доставки и характеристики продукта, такие как - описание, количество фотографий и т. Д., Сравнены с популярностью, чтобы найти корреляции в данных. Записная книжка -анализа продукта содержит подробный код.
Анализ настроений проводится в обзорах, предлагаемых клиентами. Записная книжка содержит контролируемые и неконтролируемые методы для анализа настроений, анализ настроений. Контролируемый метод использует рейтинг, предоставляемый в качестве ярлыка для анализа настроений, тогда как метод неконтролируемой методики- Afinn, TextBlob для выполнения анализа.
Стоимость груза - это стоимость доставки, связанную с каждым заказом. Записная книжка по прогнозированию стоимости фрахта содержит подробные шаги построения модели для прогнозирования стоимости доставки для заказа, учитывая расстояние между продавцом и клиентом, размеры и вес продукта. Кроме того, модель также создается и развернута на Azureml как веб -сервис. WebApp создается с использованием Dash Plotly, чтобы запросить модель для прогнозов фрахта.
Веб -приложение развернуто на Heroku, встроенном Dash Plotly. Приложение обеспечивает переднюю часть модели предиктора грузовых значений, построенной на платформе Azureml. Веб -приложение имеет следующую структуру файла.
__ app.py
__ layout.py
__ requirements.txt
__ Procfile
__ Resources
|__ API_key
|__ URL
|__ ship.png
Схема ниже представлена веб -службы, созданной на Azureml.
Файл App.py содержит экземпляр сервера, а файл Mayout.py содержит макет, который будет представлен. Файл требований.txt содержит зависимости веб -приложения
pip freeze > requirements.txt
Procfile используется для запуска экземпляра сервера приложений на виртуальную машину. Содержимое проклина
web: gunicorn app:server
Как только файлы будут готовы, подтолкните репо до Heroku Master
heroku create new_app
git add .
git commit -m "intial push"
git push heroku master
heroku ps:scale web=1
Занятое веб -приложение можно получить на Heroku по этой ссылке. https://olist-freight-app.herokuapp.com/
Примечание.- Веб-сервис на Azure в настоящее время не работает. Пожалуйста, создайте аналогичную веб -службу на Azure и соответственно измените файлы API_KEY и URL.
Набор данных Olist был проанализирован на нескольких фронтах. Каждый анализ выявил новую информацию и понимание, как сообщается в ноутбуке. Для любых запросов, свяжитесь - [email protected] и [email protected]