ยินดีต้อนรับสู่โครงการ Data Engineering MTA Turnstile! พื้นที่เก็บข้อมูลนี้ใช้ประโยชน์จากข้อมูล Turnstile MTA ในโลกแห่งความเป็นจริงนำเสนอแนวทางที่ครอบคลุมเกี่ยวกับแนวคิดวิศวกรรมข้อมูลผ่านประสบการณ์จริง
หนังสือที่กว้างขวาง: พื้นฐานของกระบวนการวิศวกรรมข้อมูล ดำน้ำลึกเข้าไปในแนวคิดหลักของวิศวกรรมข้อมูลด้วยคู่มือโดยละเอียดนี้
วิดีโอ YouTube: ติดตามพร้อมกับบทช่วยสอนวิดีโอโดยละเอียดที่อธิบายแต่ละขั้นตอนและแนวคิดในรายละเอียด
Codebase ที่ครอบคลุม: คุณสมบัติ Codebase ของเรา:
เขียนโดย Oscar Garcia
Twitter @ozkary
ใช้โครงการ Wiki สำหรับการติดตั้งและการกำหนดค่าข้อมูลนี้
เข้าร่วมรายการนี้เพื่อรับการอัปเดตเนื้อหาใหม่เกี่ยวกับวิศวกรรมข้อมูลลงทะเบียนที่นี่
ติดตามเราบน Twitter
ซีรีส์บล็อกพื้นฐานด้านวิศวกรรมข้อมูล
กระบวนการวิศวกรรมข้อมูลพื้นฐานพ็อดคาสต์วิดีโอ YouTube
กระบวนการวิศวกรรมข้อมูลหนังสือพื้นฐานเกี่ยวกับ Amazon
หากคุณพบว่าโครงการนี้มีประโยชน์โปรดพิจารณาให้มันเป็น️บน GitHub! การสนับสนุนของคุณช่วยให้เราเติบโตและเข้าถึงนักพัฒนาได้มากขึ้น
ทำไมต้องแสดงโครงการนี้?
ขอบคุณสำหรับการสนับสนุน! -
ในเมืองนิวยอร์กผู้โดยสารใช้ระบบรถไฟใต้ดินการขนส่งเมโทรโพลิแทน (MTA) เพื่อการขนส่ง มีผู้คนหลายล้านคนที่ใช้ระบบนี้ทุกวัน ดังนั้นธุรกิจรอบสถานีรถไฟใต้ดินจึงต้องการใช้การโฆษณาทางภูมิศาสตร์เพื่อกำหนดเป้าหมายผู้โดยสารหรือผู้บริโภคที่เป็นไปได้และดึงดูดพวกเขาไปยังสถานที่ทางธุรกิจของพวกเขาในช่วงเวลาเร่งด่วนของวัน
GeoFencing เป็นบริการเทคโนโลยีตามตำแหน่งซึ่งสัญญาณอิเล็กทรอนิกส์ของอุปกรณ์มือถือถูกติดตามเมื่อเข้าสู่หรือออกจากขอบเขตเสมือน (รั้วภูมิศาสตร์) ในที่ตั้งทางภูมิศาสตร์ ธุรกิจรอบ ๆ สถานที่เหล่านั้นต้องการใช้เทคโนโลยีนี้เพื่อเพิ่มยอดขาย

ระบบรถไฟใต้ดิน MTA มีสถานีทั่วเมือง สถานีทั้งหมดมีการติดตั้งแบบหมุนหรือประตูที่ติดตามขณะที่แต่ละคนเข้าหรือออกจากสถานี MTA ให้ข้อมูลนี้ในไฟล์ CSV ซึ่งสามารถนำเข้าสู่คลังข้อมูลเพื่อเปิดใช้งานกระบวนการวิเคราะห์เพื่อระบุรูปแบบที่สามารถเปิดใช้งานธุรกิจเหล่านี้เพื่อทำความเข้าใจกับผู้บริโภคเป้าหมายที่ดีที่สุด
เรากำลังใช้ข้อมูล MTA Turnstile สำหรับปี 2023 การใช้ข้อมูลนี้เราสามารถตรวจสอบเกณฑ์ดังต่อไปนี้:
ทางออกบ่งชี้ว่าผู้โดยสารกำลังมาถึงสถานที่เหล่านั้น รายการระบุว่าผู้โดยสารกำลังออกจากสถานที่เหล่านั้น
ข้อมูลสามารถจัดกลุ่มเป็นสถานีวันที่และเวลาของวัน ข้อมูลนี้ได้รับการตรวจสอบในบล็อกห่างกันสี่ชั่วโมง ซึ่งหมายความว่ามีช่วงเวลา 8.00 น. ถึง 12.00 น. เป็นตัวอย่าง เราวิเคราะห์ข้อมูลในช่วงเวลาบล็อกเวลาเหล่านั้นเพื่อช่วยให้เราระบุเวลาที่ดีที่สุดทั้งในตอนเช้าและบ่ายสำหรับแต่ละสถานี สิ่งนี้ควรอนุญาตให้ธุรกิจกำหนดเป้าหมายไปยังรั้วภูมิศาสตร์ที่ใกล้เคียงกับธุรกิจของพวกเขา

https://lookerstudio.google.com/reporting/94749E6B-2A1F-4B41-AFF6-35C6C33F401E
โดยการดูที่แผงควบคุมสามารถสังเกตได้ข้อสรุปต่อไปนี้:
ด้วยการสังเกตเหล่านี้แผนการสามารถทำเพื่อเพิ่มประสิทธิภาพแคมเปญการตลาดและกำหนดเป้าหมายผู้ใช้รอบ ๆ พื้นที่รั้วภูมิศาสตร์และชั่วโมงของวันโดยอยู่ใกล้กับสถานที่ธุรกิจที่สอดคล้องกัน

โครงการนี้ดำเนินการตามกระบวนการนี้ รายละเอียดสำหรับแต่ละขั้นตอนเหล่านี้สามารถพบได้ในไดเรกทอรีย่อยโครงการนี้
หมายเหตุ: ติดตามแต่ละลิงก์สำหรับรายละเอียดเพิ่มเติม

มีการใช้เทคโนโลยีต่อไปนี้สำหรับโครงการนี้: