Olist는 주로 시장을 통해 전자 상거래 부문에서 운영되는 브라질 스타트 업입니다. 그것은 나라 내에서 잘 퍼져 있습니다. 이 프로젝트는 포괄적 인 Olist 데이터에 대한 자세한 분석입니다. Original Olist 데이터 세트에는 2016 년부터 2018 년까지 브라질의 여러 마켓 플레이스에서 제정 된 100K 주문 정보가 있습니다. 이 기능을 통해 주문 상태, 가격, 지불 및화물 성과에서 고객 위치, 제품 속성 및 고객이 작성한 리뷰 등 여러 차원에서 주문을 볼 수 있습니다. 데이터 세트의 스키마는 다음과 같습니다.

설명 분석에서 예측 및 예측 분석에 이르기까지 다양한 분석 작업이 데이터 세트에서 수행됩니다.
다양한 분석 작업이 아래에 나열되어 다음과 같습니다.
원래 데이터는 조인 및 조작으로 여러 데이터 세트를 도출하는 데 사용됩니다. 데이터 조작 및 Combinig Jupyter 노트북에는 단계별 프로세스 및 설명이 포함되어 있습니다.
노트북 예비 데이터 분석에는 자세한 분석이 포함되어 있습니다. 이 노트북은 트렌드, 패턴 또는 결함을 찾기 위해 원본과 결합 된 데이터 세트를 시각화하고 요약합니다. 이 분석은 TH 데이터 세트에 대한 전체적인 관점을 제공합니다.
원래 데이터 세트에서 생성 된 트랜잭션 데이터 세트를 사용하여 관련 규칙 마이닝은 빈번한 패턴 알고리즘 인 FP 성장 트리를 사용하여 수행됩니다. 모델은 자신감 임계 값이 10%로 빈번한 항목 세트를 반환합니다. 협회 규칙 마이닝 노트북에는이 작업에 대한 자세한 설명이 포함되어 있습니다.
이 분석의 목적은 Olist 생태계에서 가장 인기있는 제품, 인기있는 제품 카테고리 및 카테고리 현명한 인기 제품을 찾는 것입니다. 또한 설명 Lenght, 사진 수 등과 같은 전달 시간 및 제품 특성은 데이터의 상관 관계를 찾기 위해 인기와 비교됩니다. 제품 분석 노트에는 자세한 코드가 포함되어 있습니다.
감정 분석은 고객이 제공하는 리뷰에 대해 수행됩니다. 노트북에는 감정 분석을위한 감독 및 감독되지 않은 방법이 포함되어 있으며 감정 분석을 검토합니다. 감독 된 기술은 감독 된 기술을위한 레이블로 제공되는 등급을 사용하는 반면, 감독되지 않은 기술 어휘, 텍스트 블로브는 분석을 수행합니다.
화물 가치는 각 주문과 관련된 배송 가치입니다. Freight Value Prediction 노트북에는 판매자와 고객 사이의 거리, 제품의 차원 및 무게를 고려할 때 주문의 배송 가치를 예측하기위한 자세한 모델 구축 단계가 포함되어 있습니다. 또한이 모델은 Azureml에서 웹 서비스로 빌드 및 배포됩니다. WebApp은 Dash Plotly를 사용하여 작성하여화물 값 예측 모델을 쿼리합니다.
웹 응용 프로그램은 대시 플롯으로 내장 된 Heroku에 배포됩니다. 이 응용 프로그램은 Azureml 플랫폼에 구축 된화물 값 예측기 모델의 프론트 엔드를 제공합니다. 웹 응용 프로그램에는 다음 파일 구조가 있습니다.
__ app.py
__ layout.py
__ requirements.txt
__ Procfile
__ Resources
|__ API_key
|__ URL
|__ ship.png
아래 스키마는 Azureml에 구축 된 웹 서비스입니다.
app.py 파일에는 서버 인스턴스가 포함되어 있고 layout.py 파일에는 렌더링 할 레이아웃이 포함되어 있습니다. 요구 사항 .txt 파일에는 웹 응용 프로그램의 종속성이 포함됩니다.
pip freeze > requirements.txt
ProcFile은 App Server의 인스턴스를 가상 컴퓨터로 시작하는 데 사용됩니다. Procfile의 내용은 다음과 같습니다
web: gunicorn app:server
파일이 준비되면 저장소를 Heroku 마스터에게 밀어 넣으십시오.
heroku create new_app
git add .
git commit -m "intial push"
git push heroku master
heroku ps:scale web=1
배포 된 웹 응용 프로그램은이 링크를 통해 Heroku에서 액세스 할 수 있습니다. https://olist-freight-app.herokuapp.com/
참고 :- Azure의 웹 서비스는 현재, UP 및 실행되지 않습니다. Azure에서 유사한 웹 서비스를 친절하게 작성하고 그에 따라 API_Key 및 URL 파일을 변경하십시오.
Olist 데이터 세트는 여러 전선에서 분석되었습니다. 각 분석은 노트에보고 된 바와 같이 새로운 정보와 통찰력을 공개했습니다. 문의 사항은 [email protected] 및 [email protected]으로 문의하십시오