


摘 ?要:隨著新型冠狀病毒肺炎的爆發(fā),如何建設(shè)新冠肺炎疫情醫(yī)療體系已然成為當(dāng)前炙手可熱的研究熱點(diǎn)。同時(shí)隨著大數(shù)據(jù)技術(shù)的不斷演變及進(jìn)步,亟需對當(dāng)前疫情醫(yī)療體系進(jìn)行建設(shè)及規(guī)范,改善和解決傳統(tǒng)醫(yī)療體系的缺陷。文章圍繞全球疫情數(shù)據(jù),利用大數(shù)據(jù)工具建立數(shù)據(jù)模型及參數(shù)指標(biāo)并進(jìn)行系統(tǒng)性分析,并探究如何建設(shè)新冠肺炎疫情醫(yī)療體系。
關(guān)鍵詞:大數(shù)據(jù);新冠肺炎疫情;數(shù)據(jù)分析;醫(yī)療體系建設(shè)
中圖分類號:R197.3;TP392 ? ? ?文獻(xiàn)標(biāo)識碼:A 文章編號:2096-4706(2020)12-0119-03
Abstract:With the outbreak of COVID-19,how to build the COVID-19 epidemic medical system has become a hot research hotspot. At the same time,combined with the continuous evolution and progress of big data technology,it is urgent to build and standardize the current epidemic medical system,so as to break the criticism and defects of the traditional medical system. Based on the global epidemic data,the author used big data tools to establish data model and parameter index and carry out systematic analysis,and explored how to build the COVID-19 epidemic medical system.
Keywords:big data;COVID-19;data analysis;construction of medical system
0 ?引 ?言
新冠肺炎疫情以突如其來的姿態(tài)席卷全球,其影響范圍之廣、傳染能力之強(qiáng),嚴(yán)重影響了全球數(shù)百個(gè)國家與地區(qū),時(shí)至今日仍有多個(gè)國家無法有效控制其蔓延趨勢[1]。
21世紀(jì)是大數(shù)據(jù)的時(shí)代,在擁抱大數(shù)據(jù)時(shí)代的同時(shí)應(yīng)將其充分應(yīng)用至現(xiàn)實(shí)中,以解決實(shí)際需求,在集全球之力對抗新冠肺炎疫情的同時(shí),可以利用大數(shù)據(jù)等技術(shù)從新冠肺炎疫情下的數(shù)據(jù)中挖掘出有用信息,并加快推進(jìn)對新冠肺炎疫情醫(yī)療體系的建設(shè)。
1 ?疫情數(shù)據(jù)分析
1.1 ?疫情數(shù)據(jù)爬取
筆者借助基于Scrapy的爬蟲框架,對全球新冠疫情數(shù)據(jù)進(jìn)行分析與探究,時(shí)間跨度為2020年1月22日—2020年5月22日,通過爬取美國霍普金斯大學(xué)在GitHub上共享的開源數(shù)據(jù),并以JSON文件格式進(jìn)行存儲導(dǎo)出及后續(xù)處理。
爬取過程重要代碼如下,得到的初始數(shù)據(jù)文件中包含日期、國家/地區(qū)、確診人數(shù)、死亡人數(shù)、治愈人數(shù)五個(gè)字段,并將其通過CSV文件導(dǎo)出:
for contry in datas['area']:
for province in contry['children']:
for city in province['children']:
with open(ExcelName, 'a', encoding='utf-8', newline='') as csvfile:
writer = csv.writer(csvfile)
writer.writerow([Datas ['name'], Province ['name'], str(Province ['total']['confirmed']), Province (city['total']['dead']), Province (city['total']['recovered']))
1.2 ?疫情數(shù)據(jù)清洗
根據(jù)基于Scrapy的爬蟲所獲取的CSV數(shù)據(jù)文件,對其數(shù)據(jù)特征進(jìn)行數(shù)據(jù)清洗。原數(shù)據(jù)中部分行和列根據(jù)地名排序且難以創(chuàng)造實(shí)際價(jià)值,因此利用DataFrame的數(shù)據(jù)格式篩選出有價(jià)值的行。
清洗過程重要代碼如下,通過刪除確診人數(shù)、死亡人數(shù)和治愈人數(shù)都為0的行并將其根據(jù)時(shí)間排序,同時(shí)刪除CSV文件的首行,以便后續(xù)更好地模擬真實(shí)數(shù)據(jù)傳輸:
val Sorted = spark.sql("select Datas,Province" +" confirmed,dead,recovered from view where confirmed!=0 or dead!=0 or confirmed!=0 " +"or confirmed!=null or recovered!=null or dead!=null order by Dates desc")
Sorted.coalesce(1)
.write.mode(SaveMode.Overwrite)
.option("header","False")
.option("sep",",")
.csv("csv")
1.3 ?變量設(shè)置及數(shù)據(jù)分析
Kafka是一種高吞吐量的分布式發(fā)布訂閱消息系統(tǒng),它可以處理消費(fèi)者在網(wǎng)站中的所有動(dòng)作流數(shù)據(jù)。對清洗過后的文件,采用Kafka作為實(shí)時(shí)處理工具,對確診人數(shù)、死亡人數(shù)、治愈人數(shù)等當(dāng)日數(shù)據(jù)與前一天定值比對得出確診率、死亡率、恢復(fù)率三大指標(biāo)進(jìn)行系統(tǒng)分析。同時(shí)選用Flask_SocketIO作為客戶端,通過MySQL數(shù)據(jù)庫逐行讀取數(shù)據(jù),同時(shí)Socket監(jiān)聽響應(yīng)函數(shù),對數(shù)據(jù)庫傳入的數(shù)據(jù)實(shí)時(shí)展現(xiàn)實(shí)現(xiàn)WebSocket。與此同時(shí)連接數(shù)據(jù)庫,將CSV文件存入MySQL數(shù)據(jù)庫中。
如圖1所示,id為自增主鍵,dates為日期(datatime數(shù)據(jù)),curerate為恢復(fù)率,state為狀態(tài)(僅設(shè)置0和1,當(dāng)數(shù)據(jù)被讀取后標(biāo)記為1)。
通過逐行讀取MySQL數(shù)據(jù)庫的內(nèi)容,同時(shí)更新數(shù)據(jù)庫state為1,Socket監(jiān)聽響應(yīng)函數(shù)并使用HTML網(wǎng)頁進(jìn)行展示,以下僅選取2020年1月22日—2020年5月22日全球疫情數(shù)據(jù)進(jìn)行分析,如圖2所示(圖2僅截取部分?jǐn)?shù)據(jù)),id為自增主鍵,country為國家/地區(qū),dates為日期(datatime數(shù)據(jù)),curerate為恢復(fù)率,Increase_rate為增長率,Mortality為死亡率,state為狀態(tài)(僅設(shè)置0和1,當(dāng)數(shù)據(jù)被讀取后標(biāo)記為1)。
通過分析圖2中2020年1月23日數(shù)據(jù)中的確診率、死亡率、恢復(fù)率,可以看出全球疫情體系存在一些問題:
一是三大指標(biāo)中全球各個(gè)國家之間的確診率、死亡率、恢復(fù)率差異化較大,由于各個(gè)國家的重視程度與疫情治理能力不同,對抗疫情也伴隨著相當(dāng)大的困難,從而增加了世界疫情格局的不確定性。
二是尚未建立疫情醫(yī)療體系標(biāo)準(zhǔn),各個(gè)國家各自為政,盡管世衛(wèi)組織在全球抗擊疫情中發(fā)揮重要作用,但由于其職能所限,只能針對傳染病預(yù)防,對各國如何應(yīng)對疫情只能進(jìn)行呼吁和建議,不具備關(guān)鍵決策權(quán),這使得全球抗疫效率取決于各國的自愿配合程度。[2]因此迫切需要國際社會建立相關(guān)疫情醫(yī)療體系標(biāo)準(zhǔn)。
三是缺乏人類命運(yùn)共同體意識,在全球化的今天,人類命運(yùn)共同體愈發(fā)成為世界人民立足之根本,只有各國一起合作,才能實(shí)現(xiàn)全球疫情醫(yī)療體系的穩(wěn)定有序發(fā)展,如果僅僅由少數(shù)國家對抗疫情,而大多數(shù)國家采取不作為的態(tài)度,這場疫情也難以得到繼續(xù)控制和防護(hù)。
2 ?疫情醫(yī)療體系建設(shè)的相關(guān)措施
2.1 ?加快不同省市區(qū)域內(nèi)疫情醫(yī)療體系建設(shè)
針對不同省市區(qū)域內(nèi)的疫情醫(yī)療體系,迫切需要建立相關(guān)制度與體系,對疫情區(qū)域強(qiáng)、中、弱地區(qū)進(jìn)行劃分及分類,對出現(xiàn)嚴(yán)重疫情的地區(qū)進(jìn)行及時(shí)管控并采取集中人員隔離的措施,對醫(yī)療體系的建設(shè)需嚴(yán)格遵循相關(guān)條例和法規(guī)制度,以此杜絕疫情下醫(yī)療資源的不對等及區(qū)域防范意識偏差。
2.2 ?集中醫(yī)療體系力量進(jìn)行綜合治理
對醫(yī)療體系的建設(shè)及規(guī)范,則重點(diǎn)在于集中醫(yī)療體系力量,最大的問題在于醫(yī)療體系往往只掌握在省會城市及部分發(fā)達(dá)地區(qū),當(dāng)疫情蔓延至偏遠(yuǎn)地區(qū),加上偏遠(yuǎn)地區(qū)的醫(yī)療治理能力及處理方式相對而言不夠成熟,往往會促使疫情擴(kuò)散及暴露醫(yī)療體系的種種問題。因此需集中醫(yī)療體系及醫(yī)療資源對偏遠(yuǎn)地區(qū)的防控提供支持,同時(shí)防止外來人口進(jìn)入偏遠(yuǎn)地區(qū)造成不必要的醫(yī)療資源流失,解決偏遠(yuǎn)地區(qū)醫(yī)療資源分配不均、醫(yī)療資源匱乏、重復(fù)使用等問題。
2.3 ?構(gòu)建大數(shù)據(jù)疫情醫(yī)療體系
現(xiàn)如今,我國的大數(shù)據(jù)醫(yī)療體系發(fā)展還處于初級階段,還在進(jìn)行醫(yī)療體制改革,并未對大數(shù)據(jù)時(shí)代下醫(yī)療體系,尤其是疫情醫(yī)療大數(shù)據(jù)進(jìn)行建設(shè)。從長遠(yuǎn)來看,疫情大數(shù)據(jù)建設(shè)的實(shí)施,對推動(dòng)醫(yī)療人類命運(yùn)共同體,改善城鄉(xiāng)居民疫情醫(yī)療體系的差異化有著重大意義。
因此,筆者提出可以建設(shè)基于大數(shù)據(jù)下的大數(shù)據(jù)疫情醫(yī)療體系,采集醫(yī)院、臨床中心、防疫站、實(shí)驗(yàn)室的疫情大數(shù)據(jù)數(shù)據(jù),通過構(gòu)建疫情大數(shù)據(jù)平臺進(jìn)行數(shù)據(jù)清洗與分析,對數(shù)據(jù)進(jìn)行區(qū)域疫情評級、疫情數(shù)據(jù)共享、疫情資源調(diào)配等智慧應(yīng)用,如圖3所示。
醫(yī)療數(shù)據(jù)大多數(shù)掌握在大部分醫(yī)院手中,數(shù)據(jù)的封閉性阻礙了大數(shù)據(jù)疫情醫(yī)療體系的發(fā)展,逐步開放醫(yī)療大數(shù)據(jù)并及時(shí)整合醫(yī)療信息資源是未來大數(shù)據(jù)疫情醫(yī)療體系發(fā)展的大勢。疫情醫(yī)療取之于社會而用之于社會,政府應(yīng)該積極推動(dòng)大數(shù)據(jù)疫情醫(yī)療體系的政策制定及制度化、科技化創(chuàng)新,更多地以政策推動(dòng)大數(shù)據(jù)疫情醫(yī)療體系的創(chuàng)新和發(fā)展。
3 ?結(jié) ?論
在大數(shù)據(jù)時(shí)代下,如何把握新冠肺炎疫情的數(shù)據(jù)特性,從錯(cuò)綜復(fù)雜的數(shù)據(jù)中提煉出規(guī)律,是我們迫切需要解決的問題。文章通過系統(tǒng)分析新冠肺炎疫情下數(shù)據(jù)分析的方法及思路,并針對疫情醫(yī)療數(shù)據(jù)提出了問題及相關(guān)應(yīng)對措施,對后疫情時(shí)代利用大數(shù)據(jù)工具如何建設(shè)新冠肺炎疫情醫(yī)療體系具有一定的現(xiàn)實(shí)意義。
參考文獻(xiàn):
[1] 張放,甘浩辰.疫情心理時(shí)空距離對公眾情緒的影響研究——基于新冠肺炎疫期微博文本面板數(shù)據(jù)的計(jì)算分析 [J].新聞界,2020(6):39-49.
[2] 史本葉,馬曉麗.后疫情時(shí)代的全球治理體系重構(gòu)與中國角色 [J].東北亞論壇,2020,29(4):60-71+127-128.
作者簡介:單佳宜(2000—),男,漢族,江西撫州人,本科在讀,研究方向:軟件工程。