이 프로젝트의 기술 스택은 기본적이며 초보자 데이터 분석 및 시각화 프로젝트에 매우 적합해야합니다. 기본적으로, 파이썬을 이해하고 크롤러, 네트워크, HTML 등에 대한 기본 지식이있는 한,이를 달성 할 수 있습니다.
새로운 코로나 바이러스 폐렴 ( "New Coronavirus pneumonia")의 새로운 코로나 바이러스 폐렴 (COVID-19)의 전염병은 전 세계의 많은 나라를 격노했습니다. 2020 년 3 월 11 일, 세계 보건기구 (WHO)는 공식적으로 새로운 코로나 바이러스 폐렴을 글로벌 전염병으로 나열 할 것이라고 발표했다.
전 세계적으로 새로운 코로나 바이러스 전염병과 싸우는 과정에서 전례없는 대규모 전염병 데이터가 생성되었습니다. 빅 데이터 분석 기술과 방법은 바이러스 감염원을 발견하고, 전염병의 발달을 모니터링하며, 구조 재료를 할당하여 전염병 예방 및 제어 작업을 더 잘 수행 할 수 있습니다. 빅 데이터 분석의 중요한 부분으로, 공간 데이터 분석은 지능형 데이터 처리, 직관적 인 디스플레이 및 대화식 분석을 유기적으로 결합하여 기계 인텔리전스 및 인간 지능이 서로의 장점에 깊이 통합되고 보완되어 있으며, 특집 예방 및 제어에서 분석, 명령 및 의사 결정을위한 효과적인 기초 및 가이드를 제공합니다.
이 프로젝트는 대화식 공간 데이터 분석 기술을 사용하고 Flask + Pyecharts를 사용하여 새로운 Crown Pneumonia 전염병 데이터를 시각화하고 시각화하고 전염병의 개발 동향과 주요 노드를 인식하고 예측하고 소셜 미디어 주제와 감정의 역동적 인 진화를 분석하고 사회적 여론의 상황을 분석하기위한 간단한 대화식 분석 플랫폼을 구축하기를 희망합니다.
프로젝트 분석 보고서가 웹 페이지에 배포되었으며 http://covid.yunwei123.tech/을 클릭하여 볼 수 있습니다.
대화식 시각 분석 보고서의 스크린 샷 :





데이터 세트
China_Provincedata.CSV 주, 지방 자치 단체, 자치 지역 및 중국의 특수 행정 지역의 전염병 데이터
CountryData.CSV 전 세계 214 개국 및 지역의 전염병 데이터 및 다이아몬드 공주 크루즈 선박
ncov_900k_train.unlabled.csv
데이터 세트는 "New Coronavirus pneumonia"와 관련된 230 개의 테마 키워드를 기반으로 한 데이터를 수집하고 2020 년 1 월 1 일부터 2020 년 2 월 20 일까지 총 1 백만 개의 Weibo 데이터를 캡처하고 수동으로 100,000 개를 표시합니다. 주석은 세 가지 범주로 나뉩니다 : 1 (양수), 0 (중립) 및 -1 (음수).
ncov_100k_train.labled.csv는 위와 동일합니다
원래 데이터 세트를 찾을 수 없으므로 처리 된 파일 만 현재
ncov_10k_test.csv 위와 동일합니다
YQKX_DATA-5_21.CSV 크롤러를 사용하여 얻은 100 명의 사람들의 일일 전염병 뉴스
중국 사회 단체 _epidemic 예방 및 통제 -5_21.CSV 중국 사회 조직 공공 서비스 플랫폼 전염병 예방 및 통제 구역 뉴스
Weibocomments-5_21.CSV 5.21 Weibo 및 "전염병 싸움"이라는 주제에 따라 댓글 데이터
분석에 사용되는 노트
MyScripts Python 스크립트 (크롤러, 시각화, 데이터 처리 등)
템플릿 : 웹 사이트 HTML/CSS/JS 및 사진 파일
Index.md : 웹 사이트의 Markdown 버전
Server.py : 플라스크 앱
New Coronavirus pneumonia.docx의 타이밍 데이터에 대한 예측 알고리즘 설계
Docker 사용 :
docker build -t covidvisimage .
docker run -d --name covidvis -p 5000:5000 covidvisimage
또는:
pip3 install -r requirements.txt
python3 server.py
참고 : 여기에 사용 된 Pyecharts 버전은 1.7.1 로, 후속 버전 1.8 이상과 부분적으로 호환되지 않을 수 있습니다. 다음 명령을 통해 설치할 수 있습니다.
PIP 설치 pyecharts == 1.7.1