本項目的技術棧足夠初級,應該很適合作為新手入門數據分析與可視化的項目。基本上只要了解python,具備基本的爬蟲、網絡、html 等知識就可以實現。
新型冠狀病毒肺炎(COVID-19,簡稱“新冠肺炎”)疫情肆虐全球多個國家,2020年3月11日,世界衛生組織(WHO) 正式宣布將新冠肺炎列為全球性大流行病。
在全球抗擊新型冠狀病毒疫情的過程中,產生了前所未有的大規模疫情數據,利用大數據分析技術和方法能夠協助發現病毒傳染源、監測疫情發展、調配救援物資,從而更好地進行疫情防控工作。空間數據分析作為大數據分析的重要組成,將數據智能處理、直觀展示和交互分析有機地結合,使機器智能和人類智慧深度融合、優勢互補,為疫情防控中的分析、指揮和決策提供有效依據和指南。
本項目希望能利用交互式空間數據分析技術,使用flask + pyecharts 搭建簡單新冠肺炎疫情數據可視化交互分析平台,感知和預測疫情發展趨勢與關鍵節點、分析社交媒體話題與情感的動態演變、對社會輿情進行態勢感知。
項目分析報告已部署到網頁端,可點擊http://covid.yunwei123.tech/進行查看
交互可視化分析報告截圖:





dataSets
china_provincedata.csv 中國各省、直轄市、自治區、特別行政區的疫情數據
countrydata.csv 全球214個國家地區以及鑽石公主號郵輪的疫情數據
nCoV_900k_train.unlabled.csv
數據集依據與“新冠肺炎”相關的230個主題關鍵詞進行數據採集,抓取了2020年1月1日—2020年2月20日期間共計100萬條微博數據,並對其中10萬條數據進行人工標註,標註分為三類,分別為:1(積極),0(中性)和-1(消極)。
nCoV_100k_train.labled.csv 同上,有標註
由於原始數據集找不到了,目前只有處理過的文件
nCov_10k_test.csv 同上
yqkx_data-5_21.csv 使用爬蟲獲取的人民網疫情快訊新聞100篇
中國社會組織_疫情防控-5_21.csv 中國社會組織公共服務平台疫情防控專區新聞
weiboComments-5_21.csv 5.21微博《戰疫情》主題下的微博和評論數據
notebook 分析時使用的notebook
myScripts python腳本(爬蟲、可視化、數據處理等等)
templates: 網站html/css/js及圖片文件
index.md:網站的markdown 版本
server.py:flask app
新冠肺炎時序數據預測算法設計.docx
Use docker:
docker build -t covidvisimage .
docker run -d --name covidvis -p 5000:5000 covidvisimage
OR:
pip3 install -r requirements.txt
python3 server.py
注:此處使用的pyecharts版本為1.7.1 ,可能和後續1.8 以上的版本存在部分不兼容,可以通過以下命令安裝:
pip install pyecharts==1.7.1