999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Python的疫情數據的爬取與分析

2020-10-21 18:04:01譚康裕趙元成
科學導報·學術 2020年30期
關鍵詞:新型冠狀病毒趨勢

譚康裕 趙元成

摘 ?要:目的:直觀顯示新型冠狀病毒(2019-nCoV)肺炎疫情的發展趨勢,為復工復產的決策提供決策依據。方法:基于Python語言、使用requests庫下載網頁,使用re讀取目標數據,使用csv存儲目標數據、使用pyecharts展示疫情地圖分布和疫情發展趨勢圖、使用Javascript腳本顯示趨勢圖,包括疫情的地圖分布,全國疫情新增趨勢,全國累計/疑似趨勢,全國累計治愈/死亡趨勢,全國各省疫情概覽表等。結果:得到疫情發展趨勢的可視化圖表,可以直觀顯示疫情的發展趨勢,全國各省疫情概覽表等。我們可以看到,疫情已經趨于平穩。結論:2019-nCoV肺炎疫情的防控措施是有效的,各地方政府嚴格執行公共安全政策,保證了人民的生命安全,全力遏制了2019-nCoV的傳播,奪取了戰“疫”的最終勝利。

關鍵詞:新型冠狀病毒;Python;數據可視化;趨勢

新型冠狀病毒(2019-nCoV)是一種β屬的冠狀病毒,自2019年12月在湖北省武漢市發現 2019-nCoV以來,疫情快速蔓延[1]。國家衛生健康委員會疫情通報顯示,截至 2020年4月25日早上9點,累計確診人數 82816人,累計治愈出院病例77346例,累計死亡病例4632例[2]。為快速抑制病情蔓延,國家已出臺多種舉措,如延長春節假期、企業延遲復工、學校延期開學、限制出行、公共場所要佩戴口罩,居家隔離等。本文基于Python,通過網絡爬蟲技術收集2019-nCoV疫情數據,通過數據可視化手段,給出疫情的地圖分布,全國疫情新增趨勢,全國累計/疑似趨勢,全國累計治愈/死亡趨勢,全國實時疫情概覽表等。

1 對象與方法

1.1 數據來源

本文疫情發展數據取自中國疾病預防控制中心周報(以下簡稱中國疾控中心周報)和丁香園,其地址參看“參考文獻”中的[2]和[3]。隨著2019-nCoV的快速傳播,自1月25日開始,各地紛紛啟動“重大突發公共衛生事件Ⅰ級響應”,因此我們認定從1月25 日開始,病毒即進入傳播狀態。由于數據是從中國疾病預防控制中心周報中讀取,比較完整的數據是從1月29日開始,因此,本次采集的數據就是從1月29日開始,直至4月25日零點。

1.2 疫情數據提取的需求

設計疫情數據提取的代碼要解決的以下幾個問題:

(1)下載網頁:根據給定的URL下載其HTML網頁。

(2)網頁解析:根據網頁結構信息,提取網頁數據。

(3)數據存儲:把從網頁中解析出來的數據CSV文件中。

1.3 疫情數據提取的實現方法

(1)HTML下載器

本次設計使用requests庫和requests-html庫來下載網頁,分別使用requests來下載中國疾病預防控制中心周報的數據,使用requests-html來下載丁香園的數據。使用requests-html下載網頁的核心代碼如下所示:

import requests

url = 'http://weekly.chinacdc.cn/news/TrackingtheEpidemic.htm'

r = requests.get(url) #下載網頁

使用requests-html下載網頁的核心代碼如下所示:

from requests_html import HTMLSession

dxyurl = 'https://3g.dxy.cn/newh5/view/pneumonia'

response = HTMLSession.get(dxyurl) ?#下載網頁

(2)HTML解析器

Python使用BeautifulSoup來進行HTML的解析,提取目標數據。在中國控制中心周報中,我們使用BeautifulSoup直接讀取其注釋部分,而不是按行讀取目標數據所在的XPath。在中國控制中心周報網頁中,目標文本是位于標簽

中的注釋文本。通過分析中國控制中心周報網頁數據結構,我們可以通過分割

標簽,同時為了數據的提取,還要把

標簽添加回原來的數據項中。提取數據的代碼如下:

soup = BeautifulSoup(page,'html.parser')

content = soup.find_all("div",'box-article-content') #數據返回為列表

content_to_string = str(content) #將列表轉換成字符串,使用正則表達式提取

pattern = re.compile(r"<!--(.*?)-->") # 抽取<!--(.*?)-->中間的文本

通過構建正則表達式,提取網頁中的疫情數據。提取的疫情數據分別為日期、新增確診/疑似病例、累計確診/現存疑似病例、新增死亡/治愈人數、累計死亡/治愈人數。其正則表達式的構建如下所示:

date_regex = r"(.*?)<" ?#提取日期的正則表達式

conf_suspe_data_regex = r"

Confirmed cases:(.*?)new,(.*?)total. Suspected cases:(.*?)new,(.*?)total.<" ?#提取新增確診/疑似病例、累計確診/現存疑似病例的正則表達式

猜你喜歡
新型冠狀病毒趨勢
趨勢
第一財經(2021年6期)2021-06-10 13:19:08
突發公共衛生事件中的藥物使用法規依據
上海醫藥(2020年3期)2020-03-23 09:35:30
疫情防控下的高校網上財務管理思考
會計之友(2020年6期)2020-03-11 13:18:22
“新型冠狀病毒”該如何防治
環球時報(2020-01-10)2020-01-10 04:16:02
傳染病信息披露制度的法律建構與反思
大經貿(2019年12期)2019-03-09 11:29:39
初秋唇妝趨勢
Coco薇(2017年9期)2017-09-07 21:23:49
SPINEXPO?2017春夏流行趨勢
趨勢
汽車科技(2015年1期)2015-02-28 12:14:44
主站蜘蛛池模板: 久久香蕉国产线看观看精品蕉| 国产在线视频导航| 中文字幕资源站| 91精品伊人久久大香线蕉| 大陆精大陆国产国语精品1024| 欧美日本不卡| 精品国产免费观看| 亚洲天堂久久| 亚洲综合激情另类专区| 美女视频黄频a免费高清不卡| 欧洲av毛片| 高h视频在线| 在线另类稀缺国产呦| 国产精品自拍露脸视频| 亚洲无码日韩一区| 亚洲精品黄| 播五月综合| 一级毛片视频免费| 国产小视频a在线观看| 亚洲不卡无码av中文字幕| 国产精品区视频中文字幕 | 中文字幕在线播放不卡| 亚洲免费成人网| 四虎影视国产精品| 成年女人a毛片免费视频| 中国国产A一级毛片| 无码专区国产精品第一页| 色综合婷婷| 99热这里只有精品久久免费| 国产精品专区第一页在线观看| 蜜桃视频一区二区三区| 国产精品嫩草影院av| 成人亚洲天堂| 一本久道热中字伊人| 国产人成网线在线播放va| A级毛片高清免费视频就| 亚洲人妖在线| 国产真实乱人视频| 亚洲精品片911| 欧美激情第一欧美在线| 久久精品国产999大香线焦| 日韩欧美国产中文| 亚洲天堂久久久| 国产欧美日韩在线一区| 久久频这里精品99香蕉久网址| 国产午夜精品鲁丝片| 97视频免费看| 99无码中文字幕视频| 国产综合另类小说色区色噜噜| 免费女人18毛片a级毛片视频| 国产91精品调教在线播放| 日韩精品一区二区三区swag| 国产日韩欧美精品区性色| 久久毛片免费基地| 亚洲人成影院午夜网站| 久久夜夜视频| 亚洲bt欧美bt精品| 国产欧美日韩va另类在线播放 | 亚洲欧美日韩中文字幕在线| 国产精品亚洲一区二区三区z| 91极品美女高潮叫床在线观看| 四虎亚洲精品| 91网在线| 国产成人精品免费视频大全五级| 极品尤物av美乳在线观看| 成人一级黄色毛片| 欧美日韩国产高清一区二区三区| 免费无码网站| 2020极品精品国产| 久久99国产乱子伦精品免| 九九线精品视频在线观看| 欧美激情,国产精品| 2021国产精品自拍| 免费又黄又爽又猛大片午夜| 欧美性天天| 欧美亚洲一区二区三区导航| 亚洲中文在线看视频一区| 精品亚洲国产成人AV| 99久久精品美女高潮喷水| 青青草国产一区二区三区| 免费A级毛片无码免费视频| 国产大片喷水在线在线视频|