Добро пожаловать в проект Data Engineering MTA! Этот репозиторий использует реальные данные MTA MTA, предлагая комплексное руководство по концепциям разработки данных с помощью практического опыта.
Обширная книга: Основы процесса разработки данных. Погрузитесь глубоко в основные концепции разработки данных с этим подробным руководством.
Видео YouTube: Следуйте вместе с подробными видеоуроками, которые подробно объясняют каждый шаг и концепцию.
Комплексная кодовая база: наши функции кодовой базы:
Написано Оскаром Гарсией
Twitter @ozkary
Используйте этот проект Wiki для установки и информации о конфигурации
Присоединяйтесь к этому списку, чтобы получить обновления нового контента о разработке данных. Зарегистрируйтесь здесь
Следите за нами в Твиттере
Процесс разработки данных Фундаментальная серия блогов
Процесс разработки данных Фундаментальный видео -подкаст YouTube
Фундаментальная книга по проектированию данных на Amazon
Если вы найдете этот проект полезным, пожалуйста, подумайте о том, чтобы дать ему ️ на GitHub! Ваша поддержка помогает нам расти и охватить больше разработчиков.
Зачем звездовать этот проект?
Спасибо за вашу поддержку! ?
В городе Нью -Йорк пассажиры используют систему метрополитенного управления транспорта (MTA) для транспортировки. Есть миллионы людей, которые используют эту систему каждый день; Таким образом, предприятия вокруг станций метро хотели бы иметь возможность использовать рекламу геозоны для нацеливания на этих пассажиров или возможных потребителей и привлекать их в свои бизнес -места в часы пик дня.
Геозование-это технологический сервис, основанный на местоположении, в котором электронный сигнал мобильных устройств отслеживается по мере того, как он входит или оставляет виртуальную границу (Geo-Fence) в географическом месте. Предприятия в этих местах хотели бы использовать эту технологию для увеличения своих продаж.

Система метро MTA имеет станции по всему городу. Все станции оснащены турнинирами или воротами, которые отслеживают, когда каждый человек входит или покидает станцию. MTA предоставляет эту информацию в файлах CSV, которые могут быть импортированы в хранилище данных, чтобы позволить аналитическому процессу идентифицировать шаблоны, которые могут позволить этим предприятиям понять, как наилучшим целевым потребителям.
Мы используем данные MTA в течение 2023 года. Используя эти данные, мы можем исследовать следующие критерии:
Выходы указывают на то, что пассажиры прибывают в эти места. Записи указывают на то, что пассажиры уходят из этих мест.
Данные могут быть сгруппированы на станции, дату и время дня. Эти данные проверяются в блоках четырех часов с интервалом. Это означает, что в качестве примера существуют интервалы с 8 утра до 12 часов. Мы анализируем данные в эти интервалы времени блоков, чтобы помочь нам определить лучшее время как утром, так и днем для каждого места станции. Это должно позволить предприятиям ориентироваться на определенную гео-фонд, которая находится близко к их бизнесу.

https://lookerstudio.google.com/reporting/94749e6b-2a1f-4b41-aff6-35c6c33f401e
Посмотрев на приборную панель, можно сделать следующие выводы:
С этими наблюдениями можно составить планы по оптимизации маркетинговых кампаний и целевых пользователей в области гео-фонда и часах дня в близости к соответствующим бизнес-местам.

Этот проект был выполнен после этого процесса. Детали для каждого из этих шагов можно найти в этом проекте.
Примечание: перейдите по каждой ссылке для получения более подробной информации

Для этого проекта использовались следующие технологии: