Bienvenue dans le projet Data Engineering MTA Tursitile! Ce référentiel exploite les données de tourniquet MTA du monde réel, offrant un guide complet des concepts d'ingénierie des données grâce à une expérience pratique.
Livre étendu: Fondamentaux du processus d'ingénierie des données. Plongez profondément dans les concepts de base de l'ingénierie des données avec ce guide détaillé.
Vidéos YouTube: Suivez des tutoriels vidéo détaillés qui expliquent chaque étape et concept en détail.
Base de code complète: nos fonctionnalités de base de code:
Écrit par Oscar Garcia
Twitter @ozkary
Utilisez ce Wiki du projet pour les informations d'installation et de configuration
Rejoignez cette liste pour recevoir des mises à jour sur le nouveau contenu sur l'ingénierie des données Inscrivez-vous ici
Suivez-nous sur Twitter
Processus d'ingénierie des données série de blogs fondamentaux
Processus d'ingénierie des données Podcast vidéo YouTube fondamental
Processus d'ingénierie des données Livre fondamental sur Amazon
Si vous trouvez ce projet utile, envisagez de lui donner un ️ sur GitHub! Votre soutien nous aide à grandir et à atteindre plus de développeurs.
Pourquoi jouer ce projet?
Merci pour votre soutien! ?
Dans la ville de New York, les navetteurs utilisent le système de métro de la Metropolitan Transportation Authority (MTA) pour le transport. Il y a des millions de personnes qui utilisent ce système chaque jour; Par conséquent, les entreprises autour des stations de métro souhaitent être en mesure d'utiliser la publicité de géofension pour cibler ces navetteurs ou les consommateurs possibles et les attirer vers leurs emplacements commerciaux aux heures de pointe de la journée.
Le géofencing est un service technologique basé sur la localisation dans lequel le signal électronique des appareils mobiles est suivi lorsqu'il entre ou laisse une limite virtuelle (géo-clôture) sur un emplacement géographique. Les entreprises autour de ces emplacements souhaitent utiliser cette technologie pour augmenter leurs ventes.

Le système de métro MTA dispose de stations autour de la ville. Toutes les stations sont équipées de tourniquets ou de portes qui suit lorsque chaque personne entre ou quitte la station. MTA fournit ces informations dans les fichiers CSV, qui peuvent être importées dans un entrepôt de données pour permettre au processus analytique d'identifier les modèles qui peuvent permettre à ces entreprises de comprendre comment cibler les consommateurs.
Nous utilisons les données de tournique MTA pour 2023. À l'aide de ces données, nous pouvons étudier les critères suivants:
Les sorties indiquent que les navetteurs arrivent à ces endroits. Les inscriptions indiquent que les navetteurs s'écartent de ces emplacements.
Les données peuvent être regroupées en stations, à la date et à l'heure de la journée. Ces données sont auditées en blocs de quatre heures d'intervalle. Cela signifie qu'il y a des intervalles de 8h à 12h à l'exemple. Nous analysons les données dans ces intervalles de blocage temporel pour nous aider à identifier les meilleurs moments du matin et de l'après-midi pour chaque emplacement de la station. Cela devrait permettre aux entreprises de cibler une géo-clôture particulière proche de leur entreprise.

https://lookerstudio.google.com/reporting/94749e6b-2a1f-4b41-aff6-35c6c33f401e
En regardant le tableau de bord, les conclusions suivantes peuvent être observées:
Avec ces observations, des plans peuvent être faits pour optimiser les campagnes de marketing et cibler les utilisateurs autour d'une zone de géo-clôture et des heures de la journée avec la proximité des emplacements commerciaux correspondants.

Ce projet a été exécuté après ce processus. Les détails de chacune de ces étapes peuvent être trouvés dans ces sous-répertoires de projet.
Remarque: suivez chaque lien pour plus de détails

Les technologies suivantes ont été utilisées pour ce projet: