¡Bienvenido al Proyecto de Ingeniería de Datos MTA Turnstile! Este repositorio aprovecha los datos del torniquete de la MTA del mundo real, que ofrece una guía completa de los conceptos de ingeniería de datos a través de la experiencia práctica.
Extenso libro: fundamentos del proceso de ingeniería de datos. Coloque profundamente en los conceptos centrales de ingeniería de datos con esta guía detallada.
Videos de YouTube: siga junto con tutoriales de video detallados que explican cada paso y concepto en detalle.
Base de código integral: nuestras características de base de código:
Escrito por Oscar García
Twitter @ozkary
Use este wiki de proyecto para la información de instalación y configuración
Únase a esta lista para recibir actualizaciones sobre el nuevo contenido sobre la ingeniería de datos, registrarse aquí.
Síguenos en Twitter
Serie de blog fundamental de proceso de ingeniería de datos
Proceso de ingeniería de datos Video de video de YouTube fundamental
Proceso de ingeniería de datos Libro fundamental en Amazon
Si encuentra útil este proyecto, ¡considere darle un ️ en GitHub! Su apoyo nos ayuda a crecer y llegar a más desarrolladores.
¿Por qué protagonizar este proyecto?
¡Gracias por su apoyo! ?
En la ciudad de Nueva York, los viajeros usan el sistema de metro de la Autoridad de Transporte Metropolitano (MTA) para el transporte. Hay millones de personas que usan este sistema todos los días; Por lo tanto, a las empresas alrededor de las estaciones de metro les gustaría poder utilizar el anuncio de geofencing para atacar a esos viajeros o posibles consumidores y atraerlos a sus ubicaciones comerciales en las horas pico del día.
Geofencing es un servicio de tecnología basado en la ubicación en el que se rastrea la señal electrónica de dispositivos móviles a medida que entra o deja un límite virtual (geo-cerca) en una ubicación geográfica. Las empresas en torno a esas ubicaciones les gustaría utilizar esta tecnología para aumentar sus ventas.

El sistema de metro MTA tiene estaciones en la ciudad. Todas las estaciones están equipadas con torniquetes o puertas que rastrean a medida que cada persona entra o sale de la estación. MTA proporciona esta información en los archivos CSV, que se puede importar a un almacén de datos para permitir el proceso analítico para identificar patrones que puedan permitir que estas empresas comprendan cómo apuntar mejor a los consumidores.
Estamos utilizando los datos del tendencia MTA para 2023. Usando estos datos, podemos investigar los siguientes criterios:
Las salidas indican que los viajeros están llegando a esos lugares. Las entradas indican que los viajeros se van de esos lugares.
Los datos se pueden agrupar en estaciones, fecha y hora del día. Estos datos se auditan en bloques de cuatro horas de diferencia. Esto significa que hay intervalos de 8 a.m. a 12 p.m. como ejemplo. Analizamos los datos en esos intervalos de bloque de tiempo para ayudarnos a identificar los mejores momentos tanto en la mañana como en la tarde para la ubicación de cada estación. Esto debería permitir a las empresas apuntar a una geo-cerca particular que está cerca de su negocio.

https://lookerstudio.google.com/reporting/94749e6b-2a1f-4b41-aff6-35c6c33f401e
Al mirar el tablero, se pueden observar las siguientes conclusiones:
Con estas observaciones, se pueden hacer planes para optimizar las campañas de marketing y dirigir a los usuarios en torno a un área de Geo-Fence y horas del día con proximidad a las ubicaciones comerciales correspondientes.

Este proyecto fue ejecutado después de este proceso. Los detalles para cada uno de estos pasos se pueden encontrar en los subdirectorios de este proyecto.
Nota: Siga cada enlace para más detalles

Las siguientes tecnologías se han utilizado para este proyecto: