999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

COVID-19數據可視化及預測分析

2020-06-08 01:24:14大學生創新創業課題組
現代信息科技 2020年19期
關鍵詞:疫情模型

大學生創新創業課題組

摘? 要:COVID-19(新型冠狀病毒)是新型的嚴重呼吸系統疾病。從2019年12月開始在中國武漢開始大范圍暴發傳播,當時正值春運,全國處于人口流動高峰期,給病毒傳播提供有利條件,對中國人民的人身安全造成了嚴重的威脅,給社會經濟帶來了巨大的損失。文章對COVID-19疫情的發展進行了研究,其目的是通過編寫爬蟲,從國家衛健委及各省衛健委收集相關數據,將數據可視化來展示病毒傳播特點,分析病毒傳播的特征和模式,通過建立SIR模型分析疾病的發展過程,預測疫情疾病走勢。

關鍵詞:COVID-19;數據可視化;預測分析;SIR;Python

Abstract:COVID-19 is a new type of severe respiratory disease. A large-scale outbreak began in Wuhan,China from December 2019. It was during the Spring Festival transport season and the country was at the peak of population movement,which provided favorable conditions for the spread of the virus and caused serious threats and losses to the personal safety and social economy of the Chinese people. The article studies the development of the COVID-19 epidemic,and its purpose is to collect relevant data from the National Health Commission of the Peoples Republic of China and the Provincial Health Commission by compiling crawlers. Data visualization to show the characteristics of virus transmission,analyze the characteristics and patterns of virus transmission,analyze the development process of the disease by establishing an SIR model,and predict the trend of the epidemic disease.

Keywords:COVID-19;data visualization;prediction analysis;SIR;Python

0? 引? 言

本研究是福州外語外貿學院學生在導師的帶領下運用專業相關知識進行研究。本研究的目的是將COVID-19疫情發展的數據進行可視化,分析病毒傳播的特征和模式,然后使用SIR傳染病動力學模型,分析疾病的發展過程,同時預測疫情走勢,從而為中國政府在流行病預防和經濟生產恢復的決策中提供參考。

1? 研究背景與流程

1.1? 研究背景

COVID-19(新型冠狀病毒)是一種新型的嚴重呼吸系統疾病。從2019年12月和2020年1月開始,在中國武漢開始大范圍暴發傳播,對全國人民的人身安全和社會經濟造成了嚴重的威脅和損失。

1.2? 研究流程

本研究研究流程:首先確定研究目的、搜集相關文獻并制定研究方法,將數據前置處理,并將最新數據及過往數據進行匯整,接著著手進行研究,透過SIR模型分析疫情發展情況,并使用Python將數據可視化,進而提出結論與建議。

2? 數據收集

2.1? 數據來源

數據主要來源于網易新聞[1]和騰訊新聞[2],還有使用Python爬蟲從中國國家衛生健康委員會和各級地方衛生健康委員會官方網站爬取而來。

2.2? 數據表結構

數據在爬取過程中已經進行了數據預清洗,刪除了大量NA數據,具體步驟為:

(1)使用Python制作爬蟲爬取網易新聞及騰訊新聞每日公布在其網站上的數據,分別爬取了全世界的疫情數據、中國各省份的疫情數據以及詳細到中國各個城市每日新增的疫情數據,在經過數據清洗等步驟去除含有大量NA的疑似數據列等,還有一些列都是0,例如今日治愈以及死亡,這兩列的數據使用當天總的數據減去前一天總的數據所得,最終爬取到的數據格式如表1至表3所示。

(2)直接從騰訊新聞或者網易新聞獲取數據集的好處是速度快,且能直接獲取到想要的疫情數據,無文字符號等干擾,無需進行二次處理,爬取下來就能直接使用。但缺點是數據集的數據不全面,缺少一些關鍵數據,因此針對這一情況,有些省份所使用的數據是從該省的衛健委官網直接爬取的。以福建衛健委爬取的數據集為例[3],最終爬取到的數據格式如表4所示。

3? 統計分析

3.1? 全國的分析

本研究通過Python可視化數據,由圖1可知,中國在疫情的發展前期爭分奪秒的增建方艙醫院鞏固醫療體系,并出臺限制出行甚至實施封城等一系列防控措施的政策,取得良好成效,現如今國內本土新冠肺炎疫情已基本阻斷,但零星散發和局部暴發的風險依然存在。隨著疫情在全世界范圍內的大流行,我國病例大多由本土新增病例轉變為以境外輸入病例為主,但疫情防控形勢依舊嚴峻。

3.2? 世界對比分析的分析

在疫情發生時,中國政府爭分奪秒地控制發展與防控治療。疫情最嚴重的武漢則進行長達76天的“封城”,使疫情得以有效控制,現基本已恢復生產與生活。反觀美國,由圖2的數據可以直觀看出,不管新增病例還是死亡病例,全都居世界首位,現在已然成為全球新冠肺炎疫情大流行的中心,已經演變成一場美國全國性的公共衛生災難[4]。這與美國的疫情防控相關措施有著必然的聯系,在此前各州采取的緩解疫情的措施才剛開始取得成果,特朗普政府卻急于通過取消隔離限制來提振經濟,這恰好又形成了一個新的僵局。只因阻斷COVID-19傳播的進程中伴隨著巨大的經濟損失,美國遲遲不采取積極行動來遏制COVID-19的傳播,總是意圖做出有利于經濟利益的決定,而非以科學為指導保護健康的決策,導致疫情從緩慢且可控的傳播速度發展到如今的一發不可收拾局面。

4? 疫情發展現狀及其特點

本研究通過Python可視化及Tableau可視化工具,對全國、湖北省及福建省的疫情情況進行可視化分析。使用者可以從圖3、圖4、圖5和圖6中看到全國、湖北省及福建省三個地域從1月20日到8月16日期間的疫情變化情況,以折線圖,疫情地圖、條形圖、面積圖等形式呈現。讓使用者以圖形化的方式觀看疫情從1月20日到8月16日的疫情變化(注:數據若出現負增長現象,原因在于4月16日當天,湖北依法訂正疫情數據)。

4.1? 全國疫情發展分析

如圖7所示,從全國的疫情數據來看,全國新冠肺炎每日新增確診病例略有波動。由圖7可知,湖北是全國的疫情重災區,截至2020年8月16日,湖北省累計確診人數占全國的80%以上。

如圖8所示,疫情發展前期(疫情開始暴發至2月11日),新冠肺炎確診的手段主要依靠核酸檢測和試劑盒檢測,受制于試劑盒研發和產能的限制及檢測效率等因素,疑似感染者得以確診的速度較為緩慢。在2月4日達到高峰后,出現拐點假信號,連續7日新增確診人數下降。

疫情發展中期(2月12日至4月14日),從圖中可觀測到2月12日存在特別大的噪音,是由于湖北施行2月12日國家健康委辦公廳、國家中醫藥管理局辦公室印發的《新型冠狀病毒感染的肺炎診療方案(試行第五版)》[5]:增加CT檢測手段,并將其歸為臨床確診患者,并將臨床診斷病例也被納入確診人數。此方案使得疑似感染病例得到大面積確診,新增確診人數達到最高峰。同時有利于臨床確診患者能及早按照確診病例接受規范治療,提高了病人的收治率。在2月12日后,每日新增確診出現大幅回落,是由于湖北加大了對存量疑似感染患者的檢測速度,得以大面積排查現存疑似感染人群,迅速消化現存疑似感染人群。并施行延遲開學、規定出行準則、統籌推進疫情防控工作、部署防境外輸入工作等措施,有效地切斷了病毒的傳播途徑,新增確診病例呈現明顯的下降趨勢。

疫情發展后期(4月14日至8月16日),前中段新增確診病例的主要來源為境外輸入病例,因先前已有相關準備(入境檢查,集中隔離等),每日新增確診病例僅有小范圍波動。后段由于某些地區出現反彈現象,新增確診人數略比前中段高些,但總體處于良好控制水平。

從全國每日新增治愈病例來看,從1月21日開始,出現新增治愈病例。2月2日,武漢火神山醫院正式交付;2月3日晚,三所“方艙醫院”在武漢開建,用于收治新型冠狀病毒感染的肺炎輕癥患者;2月5日,雷神山醫院具備交付條件。隨著雷神山、火神山醫院及方艙醫院的開設,使得醫療資源緊張狀況得到緩解。方艙醫院主要收治輕癥患者,發揮著集中隔離、集中觀察、統一收治、統一管理、減輕重病救治壓力、提高救治率等優勢。而雷神山、火神山醫院主要收治重癥患者,配備專業救治設備和專業救護人員,患者的生命安全有一定的保障。結合國家統一領導、高效決策及全國統籌、對口支援等舉措共同作用下,治愈病例數不斷上升。2月21日當天治愈病例數首次超過新增確診人數,到2月27日達到最高峰。隨著疫情嚴峻形勢得到緩解,新增確診病例及治愈病例數均呈下降趨勢,但治愈病例數總體高于新增確診人數,該表現充分說明疫情得到有效控制。

從全國每日新增死亡病例來看,變化趨勢較為平緩。每日新增死亡病例僅在0~252范圍內波動,且總體低于每日治愈病例。直至4月18日至5月15日出現長時間清零現象。后期新增死亡病例僅在個位數變化。說明疫情形勢正在往好的方向發展。

4.2? 福建疫情發展分析

如圖9所示,從福建省新增確診病例數據來看,波動看起來較大,但其實數據僅在0~30范圍內變化,疫情控制形勢較好。其中1月31日和3月22日,這兩天前后數據變化趨勢較為明顯。截至8月16日,最高峰值(1月31日福建省新增確診人數25人)僅占該天全國新增確診病例的1.2%左右,占比較小,疫情形勢較樂觀。結合舉措可知,1月31日后福建省新增確診病例下降可能的原因是福建省部門對住房系統、疫情期間采購安全化與便利化等方面防控工作的部署得到有效落實。至2月27日后連續22天出現零新增確診病例。由于當前國外疫情形勢嚴峻,在外留學務工人士想要回國尋求更好的醫療資源,致使3月20日,新增確診病例(境外輸入確診)迅速增加。經3月19日,福建省對境外入閩人員14天集中隔離觀察,有效地切斷病毒傳播,后期僅有少量的境外輸入確診病例出現。在治愈病例方面,2月3日開始出現治愈病例,且集中于2月份及4月份。在死亡病例方面,僅1例。

如圖10所示,從福建本土病例與境外病例的對比圖中可知,2月28日起福建本土再無新增病例,直至3月20日境外涌入的確診人數開始快速增加。新冠病毒所帶來的危機已從國內傳播轉向外來入境人員。

4.3? 國際對比

從圖11可知,中國的確診人數趨于平緩,美國、印度、巴西等地都呈增長趨勢。最早出現疫情的是中國,但隨后美國在3月24日左右,確診人數大幅度增長;印度在4月4日左右,確診人數大幅度增長;巴西在4月17日左右,確診人數大幅度增長;且5月15日起美國、印度、巴西累計確診人數都高于中國。目前,美國已成世界確診病例最多的國家,但歐洲各國仍處于疫情暴發期。截至8月16日,美國累計確診病例占比26%左右,巴西累計確診病例占比15%左右,印度累計確診病例占比12%左右,中國累計確診病例占比0.4%左右。

從治愈人數對比上,四個國家的治愈人數均趨于上升趨勢。前期階段,中國的治愈病例數略高于其他三個國家;后期階段,中國治愈人數上升幅度較小,但與確診病例數的差距逐漸縮小,后期幾乎重合。其他國家治愈人數均以較快的速度增長,受限與醫療資源,社會環境等因素,治愈人數與確診人數之間仍存在較大差距。

由圖12可知,死亡人數對比上,中國死亡病例變化較為平緩,其他3個國家均以不同的增長速度不斷增長。其中,美國的死亡人數上升最為迅速。至8月16日,美國累計死亡病例達172 606例,將近我國的36倍。

5? SIR建模與分析

5.1? SIR模型簡介

SIR模型是傳染病研究中一種經典的動力學模型,最早由Kermack等在1927年提出[6]。模型相對簡單,參數較少,被廣泛地研究和使用。在一個復雜網絡群體中的所有個體(節點)可以大致分為有限的幾種狀態,包括易感的、受感染的和被移除的,可以使用這些狀態的組合表示不同狀態之間的轉換順序以及流行病學所處的階段[7]。模型中把傳染病流行范圍內的人群分成三類:S類,易感者(Susceptible),指未得病者,但缺乏免疫能力,與感病者接觸后容易受到感染;I類,感病者(Infective),指染上傳染病的人,它可以傳播給S類成員;R類,移出者(Removal),指被隔離,或因病愈而具有免疫力的人。當易感個體和感染個體充分混合時,感染個體的增長率為βIS-γI,易感個體的下降率為βIS,恢復個體的增長率為γI。易感者從患病到移出的過程可以用微分方程表示如下:

5.1.1? 模型初始參數設定

我們本次研究僅選取全國和湖北的數據來進行預測分析。假設湖北和全國人數為N,即總人數為296 000和1 400 000。在模擬過程中對總人數按比例縮放,其原因在于中國人口基數過大,預測出的數據過大導致實際數據被壓成一條直線,無法直觀表現出感染人數的變化過程,兩者難以比較。計算中使用的變量,I0為當天確診總人數,R0為當天恢復人數,S0為當天易感染總人數,其計算公式為N-I0-R0,β為感染系數,γ為治愈系數,其初始數值都為0.000 1。

5.1.2? 確認訓練集

方程中的參數β與γ皆為常數,能夠反映模型中疫情特征。但不同疫情具有不同特性,預防措施也不盡相同,實際上難以求解,只能通過模型計算得出數據進行預測。實驗期間,湖北為2020-1-15至2020-1-23這八天的數據來作為訓練集訓練模型,模型訓練出來的β與γ:[0.358 138 35? 0.037 049 89],全國為2020年1月15日至2020年1月23日這八天的數據來作為訓練集訓練模型,模型訓練出來的β與γ:[0.398 643 46? 0.028 968 42]。

5.1.3? 預測

使用訓練集訓練出來的β與γ值繪制的湖北省預測與實際對照的圖形如圖13所示。

在圖13可以看出,疫情實際拐點相對于預測拐點提前出現。這是由于疫情暴發初期沒有足夠的試劑盒檢測,導致部分疑似感染者無法檢測出是否感染COVID-19,數據存在缺陷,預測出的感染人數比實際感染人數高。隨著檢測試劑的增加,以及2月13日臨床診斷病例被納入確診人數,確定部分疑似感染者被感染,感染人數暴增。

疫情暴發前武漢實行封城,國家衛健委要求落實“集中患者、集中專家、集中資源、集中救治”原則,降低市民每日接觸率,阻斷病毒的傳播,減少市民感染風險。

在SIR模型中,病毒的傳播率是固定的。而圖14中感染人數單調的增加,一些局部變化而引起的顯著改變將無法預測。例如在1月23日武漢封城前,春運使得各城市人口流動數量暴增,導致病毒傳播率提高,為后續疫情暴發提供基礎;2月8日火雷兩院建成,對感染者進行有效治療與統一管理,減少感染者與人群密切接觸,每日感染人數稍有下降。

使用訓練集訓練出來的β與γ值繪制的全國預測與實際對照的圖形如圖15所示。

從圖15看出,在疫情前期預測數據接近實際數據。1月23日至2月11日,全國處于疫情爆發期,累計確診病例數量暴增。為控制疫情蔓延,各個城市關閉公共場合,所有小區拒絕外來訪客以此降低人口流動量,切斷病毒傳播途徑。只有在湖北封城前出城的湖北居民才有可能是新冠肺炎的攜帶者。但后期預測結果與實際相差甚大,其原因在于:SIR模型是默認所有人都有感染風險。而做好防護措施且沒有接觸肺炎攜帶者的人感染風險極小。所以SIR預測全國感染人數與實際相差甚大。2月16日疫情達到增長拐點附近,隨后每日確診的感染人數減少,治愈病例穩定增加,說明疫情期間的各項舉措開始發揮作用。

5.1.4? 感染系數β與治愈系數γ

在訓練參數的過程中,選擇使用疫情早期的數據作為訓練集進行模型訓練,而在疫情早期政府的防疫措施不夠完善,人為干預較少,預測出的曲線則更偏向自然傳播,感染系數β高達0.486 3。

隨后疫情暴發,武漢實行封城,使肺炎患者的數量集中在湖北一帶,患者密度增大。隨后雷神山、火神山醫院建成,患者和公共醫療資源較為充足,疫情得到較好的控制,有數據可知感染系數β=0.353 8,有所下降。

在長期的斗爭后,本土疫情逐漸穩定,隨后的增長主要是外部輸入,但零星暴發風險仍然存在。

6? 結? 論

本文基于國家衛健委及各級地方衛健委發布的官方數據,對中國、湖北、福建疫情進行了科學的分析和合理的預測,使用真實數據集對SIR模型進行訓練,運用訓練得出的參數β與參數γ對疫情后期發展進行預測。根據不同的政府措施將疫情分為3個時間節點,得出1月23日至2月2日的日感染系數在0.3左右,2月5日至2月12日的感染系數小于0.2且大于0.1。由此驗證隔離方法能有效降低感染系數。

結果表明得益于中國強勢的管控,采取封城及啟動一級響應,限制人口流動,健康碼的實時追蹤以及建造大型專用醫院,集中公共醫療資源等措施,使得疫情蔓延趨勢得到有效控制,現應該加強飛機場、港口等境外輸入渠道的管控,加強入境人員的健康跟蹤及反饋,以嚴密的措施防止境外疫情輸入。

參考文獻:

[1] 網易新聞.實時更新|新冠肺炎疫情動態地 [EB/OL].(2020-08-07).https://wp.m.163.com/163/page/news/virus_report/index.html.

[2] 騰訊新聞.實時更新:新冠肺炎疫情最新動態 [EB/OL].(2020-08-07).https://news.qq.com/zt2020/page/feiyan.htm#/global.

[3] 福建省衛生健康委員會.福建省新型冠狀病毒肺炎疫情情況 [EB/OL].(2020-08-07).http://wjw.fujian.gov.cn/ztzl/gzbufk/yqtb/.

[4] 柳葉刀TheLancet.COVID-19疫情防控:中國經驗VS美國經歷 [EB/OL].(2020-04-22).https://www.medsci.cn/article/

show_article.do?id=ac80192e541c.

[5] 新型冠狀病毒感染的肺炎診療方案(試行第五版) [J/OL].中國中西醫結合雜志(2020-02-08).http://kns.cnki.net/kcms/detail/11.2787.R.20200208.1034.002.html.

[6] KERMACK W O,MCKENDRICK A G. A Contribution to the Mathematical Theory of Epidemics [J]. Proceedings of The Royal Society A Mathematical Physical and Engineering ences,1927,115(772):700-721.

[7] 尹楠.基于SIR模型的有限區域內新冠肺炎疫情傳播仿真模擬 [J].統計與決策,2020(5):15-20.

作者簡介:蘇志湧(1997—),男,漢族,福建泉州人,本科在讀,主要研究方向:數據分析;通訊作者:何煌媚(1999—),女,漢族,福建龍海人,本科在讀,主要研究方向:數據分析;李榮杰(2000—),男,漢族,福建寧德人,本科在讀,主要研究方向:數據分析;陳祎(2000—),女,漢族,福建福州人,本科在讀,主要研究方向:數據分析;肖佳瑩(1999—),女,漢族,福建福州人,本科在讀,主要研究方向:數據分析;程曦(2001—),女,漢族,福建南平人,本科在讀,主要研究方向:數據分析;陳真真(2001—),女,漢族,福建泉州人,本科在讀,主要研究方向:數據分析;李仁鐘(1963—),男,漢族,臺灣宜蘭人,博士,教授,博/碩生導師,主要研究方向:智能計算、數據挖掘。

猜你喜歡
疫情模型
一半模型
戰疫情
重要模型『一線三等角』
抗疫情 顯擔當
人大建設(2020年5期)2020-09-25 08:56:22
疫情中的我
疫情當前 警察不退
北極光(2020年1期)2020-07-24 09:04:04
重尾非線性自回歸模型自加權M-估計的漸近分布
待疫情散去 春暖花開
文苑(2020年4期)2020-05-30 12:35:48
疫情期在家帶娃日常……
37°女人(2020年5期)2020-05-11 05:58:52
3D打印中的模型分割與打包
主站蜘蛛池模板: 成人午夜亚洲影视在线观看| 日韩大片免费观看视频播放| 欧美www在线观看| 欧美成人国产| 天天综合网亚洲网站| 久久青草免费91观看| 伊人久久大线影院首页| 国产免费久久精品99re丫丫一| 2018日日摸夜夜添狠狠躁| 亚洲A∨无码精品午夜在线观看| 91区国产福利在线观看午夜 | 亚洲v日韩v欧美在线观看| 久久综合结合久久狠狠狠97色| 天堂成人在线视频| 四虎亚洲国产成人久久精品| 萌白酱国产一区二区| 国产亚洲欧美日韩在线观看一区二区| 国产日韩av在线播放| 国产精品视频观看裸模 | av在线手机播放| 色悠久久久久久久综合网伊人| 亚洲综合九九| 久久精品无码一区二区国产区| 黄色国产在线| 98精品全国免费观看视频| 欧美在线视频不卡第一页| 亚洲国产天堂久久综合| 国产精品久久久精品三级| 精品久久久久久久久久久| 欧美日韩一区二区三| 亚洲第一国产综合| 国产精品第| 天堂久久久久久中文字幕| 亚洲品质国产精品无码| 免费网站成人亚洲| 中文国产成人久久精品小说| 久久精品波多野结衣| 欧美视频在线第一页| 成年片色大黄全免费网站久久| 午夜不卡视频| 激情综合激情| 亚洲第一香蕉视频| 欧美在线中文字幕| 97青草最新免费精品视频| 国产福利大秀91| 在线一级毛片| 日韩午夜片| 亚洲综合二区| 国产色婷婷| 动漫精品啪啪一区二区三区| 色妺妺在线视频喷水| 久操线在视频在线观看| 99视频国产精品| 少妇极品熟妇人妻专区视频| 国产亚洲精品无码专| 六月婷婷激情综合| 亚洲人成网址| 亚洲女同欧美在线| 国产爽爽视频| 久久综合结合久久狠狠狠97色| 国产激爽大片在线播放| 九九久久精品免费观看| 国产内射一区亚洲| 日本精品中文字幕在线不卡| 欧美色图第一页| 国产精品久久久久无码网站| 伊人激情综合| 91免费在线看| 久久亚洲国产视频| 免费不卡在线观看av| 亚洲激情99| 中文字幕自拍偷拍| 91欧洲国产日韩在线人成| 欧美人与牲动交a欧美精品| 综合五月天网| 天天综合亚洲| 被公侵犯人妻少妇一区二区三区| 日本三级精品| 国产无码在线调教| 在线观看精品国产入口| 一级爆乳无码av| 在线播放91|