データエンジニアリングMTA TurnStileプロジェクトへようこそ!このリポジトリは、実世界のMTAターンスタイルデータを活用しており、実践的なエクスペリエンスを通じてデータエンジニアリングの概念に関する包括的なガイドを提供します。
広範な本:データエンジニアリングプロセスの基礎。この詳細なガイドを使用して、データエンジニアリングのコア概念に深く掘り下げてください。
YouTubeビデオ:各ステップとコンセプトを詳細に説明する詳細なビデオチュートリアルをフォローしてください。
包括的なコードベース:コードベース機能:
オスカー・ガルシアによって書かれました
Twitter @ozkary
このプロジェクトWikiを使用して、インストールおよび構成情報を使用してください
このリストに参加して、データエンジニアリングに関する新しいコンテンツの更新を受け取ります。
Twitterでフォローしてください
データエンジニアリングプロセス基本的なブログシリーズ
データエンジニアリングプロセス基本的なYouTubeビデオポッドキャスト
データエンジニアリングプロセスAmazonの基本的な本
このプロジェクトが便利だと思う場合は、GitHubで€するまってください!あなたのサポートは、私たちが成長し、より多くの開発者にリーチするのに役立ちます。
なぜこのプロジェクトに出演するのですか?
ご支援ありがとうございます! ?
ニューヨーク市では、通勤者は輸送のためにメトロポリタン輸送局(MTA)地下鉄システムを使用しています。このシステムを毎日使用している人は何百万人もいます。したがって、地下鉄の駅周辺の企業は、ジオフェンシング広告を使用して、通勤者や消費者をターゲットにし、その日のピーク時にビジネスの場所に引き付けることができるようにしたいと考えています。
Geofencingは、地理的な場所に仮想境界(ジオフェンス)に入るか、離れるときにモバイルデバイスの電子信号が追跡されるロケーションベースのテクノロジーサービスです。これらの場所の周りの企業は、このテクノロジーを使用して売り上げを増やしたいと考えています。

MTA地下鉄システムには、市内に駅があります。すべてのステーションには、各人がステーションに入るか出発するときに追跡するターンスタイルまたはゲートが装備されています。 MTAはこの情報をCSVファイルで提供します。これは、データウェアハウスにインポートして、分析プロセスがこれらの企業が消費者を最適にターゲットにする方法を理解できるようにするパターンを特定できるようにすることができます。
2023年にMTAターンスタイルデータを使用しています。このデータを使用して、次の基準を調査できます。
出口は、通勤者がそれらの場所に到着していることを示しています。エントリは、通勤者がそれらの場所から出発していることを示しています。
データは、ステーション、日付と時刻にグループ化できます。このデータは、4時間離れたブロックで監査されます。これは、例として午前8時から午後12時の間隔があることを意味します。データをそれらの時間ブロック間隔に分析して、各ステーションの場所に午前と午後の両方で最適な時間を特定するのに役立ちます。これにより、企業はビジネスに近い特定のジオフェンスをターゲットにすることができます。

https://lookerstudio.google.com/reporting/94749e6b-2a1f-4b41-aff6-35c6c33f401e
ダッシュボードを見ると、次の結論を観察できます。
これらの観察により、対応するビジネスロケーションに近接して、ジオフェンスエリアと1日の時間の周りのマーケティングキャンペーンとターゲットユーザーを最適化する計画を立てることができます。

このプロジェクトは、このプロセスに従って実行されました。これらの各手順の詳細は、このプロジェクトのサブディレクトリにあります。
注:詳細については、各リンクをフォローしてください

このプロジェクトには、次のテクノロジーが使用されています。