Bem -vindo ao projeto de torneira MTA de engenharia de dados! Esse repositório aproveita os dados de torneiras MTA do mundo real, oferecendo um guia abrangente para conceitos de engenharia de dados por meio de experiência prática.
Livro extenso: Fundamentos do processo de engenharia de dados. Mergulhe profundamente nos conceitos principais de engenharia de dados com este guia detalhado.
Vídeos do YouTube: Siga junto com tutoriais de vídeo detalhados que explicam cada etapa e conceito em detalhes.
Base de código abrangente: nossos recursos de base de código:
Escrito por Oscar Garcia
Twitter @ozkary
Use este Wiki do projeto para informações de instalação e configuração
Junte -se a esta lista para receber atualizações sobre novo conteúdo sobre a engenharia de dados se inscrever aqui
Siga -nos no Twitter
Processo de engenharia de dados Série de blogs fundamentais
Processo de Engenharia de Dados Fundamental Vídeo do YouTube Podcast
Livro fundamental do processo de engenharia de dados na Amazon
Se você achar esse projeto útil, considere dar -lhe umri no Github! Seu apoio nos ajuda a crescer e alcançar mais desenvolvedores.
Por que estrelar este projeto?
Obrigado pelo seu apoio! ?
Na cidade de Nova York, os passageiros usam o sistema de metrô Metropolitan Transportation Authority (MTA) para transporte. Existem milhões de pessoas que usam esse sistema todos os dias; Portanto, as empresas ao redor das estações de metrô gostariam de usar o anúncio de geofencing para atingir esses passageiros ou possíveis consumidores e atraí -los para seus locais de negócios nos horários de pico do dia.
A geofencing é um serviço de tecnologia baseado em localização no qual o sinal eletrônico dos dispositivos móveis é rastreado à medida que entra ou deixa um limite virtual (geo-bência) em uma localização geográfica. As empresas em torno desses locais gostariam de usar essa tecnologia para aumentar suas vendas.

O sistema de metrô MTA possui estações em torno da cidade. Todas as estações estão equipadas com catracas ou portões que rastreiam quando cada pessoa entra ou sai da estação. O MTA fornece essas informações nos arquivos CSV, que podem ser importados para um data warehouse para permitir que o processo analítico identifique padrões que possam permitir que essas empresas entendam como melhor segmentar os consumidores.
Estamos usando os dados de torneira MTA para 2023. Usando esses dados, podemos investigar os seguintes critérios:
As saídas indicam que os passageiros estão chegando a esses locais. As entradas indicam que os passageiros estão se afastando desses locais.
Os dados podem ser agrupados em estações, data e hora do dia. Esses dados são auditados em blocos de quatro horas de intervalo. Isso significa que existem intervalos das 8h às 12h como exemplo. Analisamos os dados nesses intervalos de bloqueio de tempo para nos ajudar a identificar os melhores momentos de manhã e tarde para cada local da estação. Isso deve permitir que as empresas tenham como alvo uma cerca geográfica específica que está próxima de seus negócios.

https://lookerstudio.google.com/reporting/94749e6b-2a1f-4b41-aff6-35c6c33f401e
Observando o painel, as seguintes conclusões podem ser observadas:
Com essas observações, podem ser feitos planos para otimizar as campanhas de marketing e os usuários-alvo em torno de uma área geográfica e horas do dia com proximidade com os locais de negócios correspondentes.

Este projeto foi executado após esse processo. Os detalhes para cada uma dessas etapas podem ser encontrados neste subdiretório do projeto.
Nota: Siga cada link para mais detalhes

As seguintes tecnologias foram usadas para este projeto: