مرحبًا بك في مشروع MTA Turnstile MTA! يعمل هذا المستودع على الاستفادة من بيانات Turnstile MTA في العالم الحقيقي ، مما يوفر دليلًا شاملاً لمفاهيم هندسة البيانات من خلال الخبرة العملية.
كتاب واسع: أساسيات عملية هندسة البيانات. الغوص في عمق المفاهيم الأساسية لهندسة البيانات مع هذا الدليل التفصيلي.
مقاطع فيديو YouTube: اتبع مع برامج فيديو مفصلة تشرح كل خطوة ومفهوم بالتفصيل.
قاعدة كود شاملة: ميزات قاعدة الكود الخاصة بنا:
كتبه أوسكار جارسيا
Twitter Ozkary
استخدم هذا المشروع wiki للتثبيت والتكوين معلومات
انضم إلى هذه القائمة لتلقي التحديثات على محتوى جديد حول تسجيل هندسة البيانات هنا
تابعنا على Twitter
سلسلة مدونة عملية هندسة البيانات
عملية هندسة البيانات الأساسية على YouTube فيديو بودكاست
عملية هندسة البيانات كتاب أساسي على الأمازون
إذا وجدت هذا المشروع مفيدًا ، فالرجاء التفكير في إعطائه على github! مساعدتك يساعدنا على النمو والوصول إلى المزيد من المطورين.
لماذا نجمة هذا المشروع؟
شكرا لك على دعمك! ؟
في مدينة نيويورك ، يستخدم الركاب نظام مترو الأنفاق في متروبوليتان (MTA) للنقل. هناك ملايين الأشخاص الذين يستخدمون هذا النظام كل يوم ؛ لذلك ، تود الشركات المحيطة بمحطات المترو أن تكون قادرة على استخدام الإعلانات الجغرافية لاستهداف هؤلاء الركاب أو المستهلكين المحتملين وجذبهم إلى مواقع أعمالهم في ساعات الذروة من اليوم.
GeoFencing هي خدمة تقنية تعتمد على الموقع يتم فيها تتبع الإشارة الإلكترونية للأجهزة المحمولة عند دخولها أو تترك حدودًا افتراضية (Geo-Fence) على موقع جغرافي. ترغب الشركات في جميع أنحاء هذه المواقع في استخدام هذه التكنولوجيا لزيادة مبيعاتها.

نظام مترو أنفاق MTA لديه محطات في جميع أنحاء المدينة. تم تجهيز جميع المحطات بالاتاكهة أو البوابات التي تتتبع كل شخص يدخل أو يغادر المحطة. توفر MTA هذه المعلومات في ملفات CSV ، والتي يمكن استيرادها إلى مستودع بيانات لتمكين العملية التحليلية لتحديد الأنماط التي يمكن أن تمكن هذه الشركات من فهم أفضل المستهلكين المستهدفين.
نحن نستخدم بيانات Turnstile MTA لعام 2023. باستخدام هذه البيانات ، يمكننا التحقيق في المعايير التالية:
تشير المخارج إلى أن الركاب يصلون إلى تلك المواقع. تشير الإدخالات إلى أن الركاب يغادرون من تلك المواقع.
يمكن تجميع البيانات في المحطات وتاريخ ووقت اليوم. يتم تدقيق هذه البيانات في كتل من أربع ساعات. هذا يعني أن هناك فترات من الساعة 8 صباحًا إلى 12 مساءً كمثال. نقوم بتحليل البيانات في فترات الزمن هذه لمساعدتنا في تحديد أفضل الأوقات في الصباح وبعد الظهر لكل موقع محطة. هذا يجب أن يسمح للشركات باستهداف جغراف جغرافي معين قريب من أعمالها.

https://lookerstudio.google.com/reporting/94749e6b-2a1f-4b41-aff6-35c6c33f401e
من خلال النظر إلى لوحة القيادة ، يمكن ملاحظة الاستنتاجات التالية:
من خلال هذه الملاحظات ، يمكن وضع خطط لتحسين حملات التسويق والمستخدمين المستهدفين حول منطقة جغرافية وساعات من اليوم مع قربها من مواقع الأعمال المقابلة.

تم تنفيذ هذا المشروع بعد هذه العملية. يمكن العثور على تفاصيل كل من هذه الخطوات في هذا المشروع.
ملاحظة: اتبع كل رابط لمزيد من التفاصيل

تم استخدام التقنيات التالية لهذا المشروع: