المكدس التكنولوجي لهذا المشروع أساسي بما فيه الكفاية ويجب أن يكون مناسبًا جدًا لمشاريع تحليل بيانات المبتدئين وتصورهم. في الأساس ، طالما أنك تفهم Python ولديك معرفة أساسية بالزحفات والشبكات و HTML وما إلى ذلك ، يمكنك تحقيق ذلك.
إن وباء الالتهاب الرئوي في فيروس كورونافروس الجديد (Covid-19 ، يشار إليه باسم "الالتهاب الرئوي الجديد فيروسات كورونا") قد أثار العديد من البلدان في جميع أنحاء العالم. في 11 مارس 2020 ، أعلنت منظمة الصحة العالمية (WHO) رسميًا أنها ستقوم بإدراج الالتهاب الرئوي الجديد فيروس كورونافروس كوباء عالمي.
في عملية محاربة وباء فيروس كورونا الجديد على مستوى العالم ، تم إنشاء بيانات الوباء على نطاق واسع غير مسبوقة. يمكن أن تساعد تكنولوجيا وأساليب تحليل البيانات الضخمة في اكتشاف مصادر عدوى الفيروسات ، ومراقبة تطوير الوباء ، وتخصيص مواد الإنقاذ ، من أجل تنفيذ أعمال الوقاية من الوباء والعمل بشكل أفضل. كجزء مهم من تحليل البيانات الضخمة ، يجمع تحليل البيانات المكانية بشكل عضوي بين معالجة البيانات الذكية والعرض البديهي والتحليل التفاعلي ، بحيث يتم دمج الذكاء الآلي وذكاء الإنسان بعمق ومكمل لمزايا بعضهما البعض ، وتوفير أساس فعال ودليل للتحليل والقيادة وصنع القرار في الوقاية من الوباء.
يأمل هذا المشروع في استخدام تقنية تحليل البيانات المكانية التفاعلية واستخدام Flask + Pyecharts لبناء منصة تحليل تفاعلية بسيطة لتصور وتصور البيانات الوبائية الجديدة للالتهاب الرئوي التاج ، وتتوقع اتجاهات التنمية والعقد الرئيسية للوباء ، وتحليل التطور الديناميكي لمواضيع وسائل التواصل الاجتماعي والعواطف ، ويدركون حالة التواصل الاجتماعي.
تم نشر تقرير تحليل المشروع في صفحة الويب ، يمكنك النقر فوق http://covid.yunwei123.tech/ لعرضها
لقطة شاشة من تقرير التحليل البصري التفاعلي:





مجموعات البيانات
China_provincedata.CSV البيانات الوبائية من المقاطعات والبلديات والمناطق المستقلة والمناطق الإدارية الخاصة في الصين
countrydata.csv البيانات الوبائية من 214 دولة ومناطق في جميع أنحاء العالم وسفينة الأميرة الأميرة Diamond
ncov_900k_train.unlabled.csv
تقوم مجموعة البيانات بجمع البيانات المستندة إلى 230 كلمة رئيسية تتعلق بـ "الالتهاب الرئوي الجديد فيروس كورونافروس" ، وتلتقط ما مجموعه مليون بيانات Weibo من 1 يناير 2020 إلى 20 فبراير 2020 ، ويصور يدويًا 100000 منهم. تنقسم التعليقات التوضيحية إلى ثلاث فئات: 1 (إيجابية) و 0 (محايدة) و -1 (سلبية).
ncov_100k_train.labled.csv هو نفسه كما هو موضح أعلاه ، تم وضع علامة عليه
نظرًا لأنه لا يمكن العثور على مجموعة البيانات الأصلية ، فإن الملفات المعالجة هي فقط حاليًا
NCOV_10K_TEST.CSV كما هو مذكور أعلاه
YQKX_DATA-5_21.CSV 100 أخبار الوباء اليومية التي تم الحصول عليها باستخدام زحف
الوقاية من المنظمة الاجتماعية في الصين-الوقاية والسيطرة-5_21
Weibocomments-5_21.CSV 5.21 Weibo و Doating Data تحت موضوع "محاربة الوباء"
دفتر ملاحظات يستخدم للتحليل
البرامج النصية MyScripts Python (الزحف ، التصورات ، معالجة البيانات ، إلخ)
قوالب: موقع HTML/CSS/JS وملفات الصور
INDEX.MD: إصدار Markdown من الموقع
Server.py: تطبيق Flask
تصميم خوارزمية التنبؤ لبيانات توقيت الالتهاب الرئوي
استخدم Docker:
docker build -t covidvisimage .
docker run -d --name covidvis -p 5000:5000 covidvisimage
أو:
pip3 install -r requirements.txt
python3 server.py
ملاحظة: إصدار Pyecharts المستخدم هنا هو 1.7.1 ، والذي قد يكون غير متوافق جزئيًا مع الإصدارات اللاحقة 1.8 أو أعلى. يمكنك تثبيته من خلال الأمر التالي:
PIP تثبيت pyecharts == 1.7.1