Olist adalah startup Brasil yang beroperasi di segmen e-commerce, terutama melalui pasar. Itu tersebar dengan baik di dalam negeri. Proyek ini adalah analisis terperinci tentang data OLIST yang komprehensif. Dataset OLIST asli memiliki informasi 100 ribu pesanan dari 2016 hingga 2018 yang dibuat di berbagai pasar di Brasil. Fitur -fiturnya memungkinkan melihat pesanan dari berbagai dimensi: dari status pesanan, harga, pembayaran dan kinerja pengiriman ke lokasi pelanggan, atribut produk dan akhirnya ulasan yang ditulis oleh pelanggan. Skema dataset adalah seperti di bawah ini:-

Tugas analisis berganda dilakukan pada dataset, mulai dari analisis deskriptif hingga peramalan dan analisis prediktif.
Berbagai tugas analisis terdaftar dan dijelaskan di bawah ini:-
Data asli digunakan untuk memperoleh beberapa dataset dengan gabungan dan manipulasi. Manipulasi data dan notebook Jupyter Combinig berisi proses dan penjelasan langkah demi langkah.
Analisis data awal notebook berisi analisis terperinci. Notebook ini memvisualisasikan dan merangkum dataset asli dan gabungan, untuk menemukan tren, pola, atau kesalahan. Analisis ini memberikan pandangan holistik tentang dataset.
Menggunakan dataset transaksional yang dibuat dari dataset asli, penambangan aturan asosiasi dilakukan dengan menggunakan algoritma pola yang sering - pohon pertumbuhan FP. Model ini mengembalikan set item yang sering dengan ambang kepercayaan 10%. Buku catatan penambangan aturan asosiasi berisi penjelasan terperinci untuk tugas ini.
Tujuan dari analisis ini adalah untuk menemukan produk yang paling populer, kategori produk populer dan produk populer yang bijak dalam ekosistem Olist. Selanjutnya, waktu pengiriman dan karakteristik produk seperti - deskripsi lenght, jumlah foto dll, dibandingkan dengan popularitas untuk menemukan korelasi dalam data. Buku catatan analisis produk berisi kode terperinci.
Analisis sentimen dilakukan pada ulasan yang ditawarkan oleh pelanggan. Buku catatan berisi metode yang diawasi dan tidak diawasi untuk analisis sentimen, meninjau analisis sentimen. Teknik yang diawasi menggunakan peringkat yang disediakan sebagai label untuk analisis sentimen, sedangkan teknik tanpa pengawasan leksikon-afinn, TextBlob untuk melakukan analisis.
Nilai pengiriman adalah nilai pengiriman yang terkait dengan setiap pesanan. Notebook prediksi nilai barang berisi langkah -langkah pembangunan model terperinci untuk memprediksi nilai pengiriman untuk suatu pesanan, mengingat jarak antara penjual dan pelanggan, dimensi dan berat produk. Lebih lanjut, model ini juga dibangun dan digunakan di Azureml sebagai layanan web. Webapp dibuat menggunakan Dash Plotly, untuk menanyakan model untuk prediksi nilai barang.
Aplikasi web digunakan di Heroku, dibangun di Dash plot. Aplikasi ini menyediakan ujung depan untuk model prediktor nilai barang yang dibangun di platform Azureml. Aplikasi Web memiliki struktur file berikut.
__ app.py
__ layout.py
__ requirements.txt
__ Procfile
__ Resources
|__ API_key
|__ URL
|__ ship.png
Skema di bawah ini adalah layanan web yang dibangun di atas Azureml.
File app.py berisi instance server dan file tata letak.py berisi tata letak yang akan diberikan. File persyaratan.txt berisi dependensi aplikasi web
pip freeze > requirements.txt
Procfile digunakan untuk meluncurkan instance server aplikasi ke mesin virtual. Isi procfile adalah
web: gunicorn app:server
Setelah file siap, dorong repo ke Heroku Master
heroku create new_app
git add .
git commit -m "intial push"
git push heroku master
heroku ps:scale web=1
Aplikasi web, yang digunakan dapat diakses di Heroku melalui tautan ini. https://olist-freight-app.herokuapp.com/
Catatan:- Layanan Web di Azure tidak ada saat ini, berjalan dan berjalan. Mohon buat layanan web serupa di Azure dan ubah file API_Key dan URL yang sesuai.
Dataset OLIST dianalisis di beberapa bidang. Setiap analisis mengungkapkan informasi dan wawasan baru seperti yang dilaporkan dalam buku catatan. Untuk pertanyaan apa pun, hubungi - [email protected] dan [email protected]