郭宏曦
大數據時代的來臨,使得數據逐步透明化。2020年初,新型冠狀病毒肺炎疫情已成為世界焦點,從疫情初現端倪,政府和企業在此次疫情中的數據可視化,讓公眾直觀地掌握疫情動態。達到防控風險,抑制疫情的再擴散的目的。
當今世界已經進入大數據時代,各國已將數據列為新的戰略資源。在經濟高速運轉的今天,數據不再局限于小小的一個圈子,而是更加開放、包容,數據規模也更為客觀。數據不再是簡單的數字,如何從數據的背后挖掘出數據潛藏的價值成為國家和企業關心的熱點問題。
從初期的數據采集到后期的數據可視化,以數據為核心的產業鏈正走向完善,逐漸摒棄了單純售賣數據的單一盈利方式,轉而期望通過深度挖掘數據中潛在的價值獲得更高利潤。阿里云、百度云等以大數據為核心的人工智能科技企業已進入高速發展時期,大數據帶來的便利已走入我們生活。例如騰訊云通過分析春節前疫區流出人群去向得出該地區與其他地區聯系強度模型,提前分析出潛在高風險地區,百度地圖APP快速上線“遷徙地圖”和“發熱門診”功能。這些都是通過數據平臺采集數據,并分析數據潛藏的價值。
當然,數據只是數據,如何將這些數據轉化為能被大多數人理解的內容?這就要用到了數據可視化———將獲得的數據轉化為圖像的形式,直觀地展示在公眾面前。圖像比一串讓人看不懂的數據更容易理解,這就實現了數據的開放與共享。
中華人民共和國衛生健康委員會(簡稱國家衛健委)官網已成為此次疫情信息公開的前沿平臺,為社會公眾提供一手數據,為疫情的發展態勢提供數據支持。從2019年末第一例發現不明原因肺炎患者,到2020年1月29日確診5 974例,疑似9 239例。短短1個月時間,新型冠狀病毒肺炎疫情已呈席卷之勢。春運加劇了疫情擴散速度,病毒疫情不僅是地區之事,隨著事態發展,各省逐步啟動突發公共衛生事件Ⅰ級應急響應。

通過國家官方網站的大數據信息,驗證大數據開放與共享的原則:開放政府工作組“八項原則”。原則中提出完整、原始性、及時、可獲取、可機讀、非歧視、非專屬和免于授權。
完整性:數據的公開包含中國內陸、港澳臺及海外地區的疫情情況。
原始性:數據從各省市地區衛健委統計而來,未加工未修改。
及時:公眾通過網站能獲悉前一天的疫情確診人數,甚至部分數據平臺能做到數據實時更新。
可獲取、可機讀、非專屬性、非歧視性、免于授權:通過各地區的數據上報情況,各類平臺均能輕松獲得數據,不用通過特殊授權,即可使用數據,并將非結構化數據脫敏后轉化為機器可讀的結構化數據,可視化處理后公布給各界人士。
綜上所屬,對于此次新型冠狀病毒肺炎疫情數據,政府做到了數據開放與共享,滿足了公眾對疫情的了解需求,達到消除恐慌、抑制謠言等目的,使公眾了解疫情嚴重性,服從國家安排,眾志成城、抗擊疫情。通過政府數據平臺的建設,政府數據開放取得了實質性的進展,但國家衛健委平臺在開放數據上缺乏更詳盡信息,如要進一步了解部分地區疫情狀況就需要通過其他的網頁爬蟲,政府的數據共享有待進一步提高。
眾多企業大數據平臺也參與到了這場無硝煙的戰爭之中。經過各類數據平臺的數據開放共享,加快了大數據在這場疫情中可視化探索的步伐。
通過可視化方法散點圖矩陣,可以分析出春運后隱含高風險城市。隨著疫情地圖的實時更新,驗證了高維數據的可視化模型。而時空立方體技術模型在建模過程中,有層次離散化問題,還需進一步數據轉化。