黃文莉
摘 要本文首先對大數據的涵義及特點進行了梳理,在綜述國內外大數據應用實踐基礎上,歸納總結了我國大數據技術在疾病防控上應用面臨的困難和挑戰,進而提出了加快我國大數據發展的對策建議。
【關鍵詞】大數據 疾病防控
被喻為"未來的新石油"的大數據,正成為繼云計算、物聯網之后信息技術領域的又一熱點《華爾街日報》將大數據時代、智能化生產和無線網絡革命稱為引領未來繁榮的三大技術變革。大數據技術已經開始應用到各行各業。在給人類社會帶來海量信息和巨大變革的同時,大數據技術在疾病防控上的應用引起了人們越來越大的興趣。
1 大數據的定義
從某種程度上說,大數據是數據分析的前沿技術。簡言之,從各種各樣類型的數據中,快速獲得有價值信息的能力,就是大數據技術。
大數據的特點有四個層面:
(1)數據體量巨大。從TB級別,躍升到PB級別;
(2)數據類型繁多。如網絡日志、視頻、圖片、地理位置信息等等。
(3)處理速度快,1秒定律,可從各種類型的數據中快速獲得高價值的信息,這一點也是和傳統的數據挖掘技術有著本質的不同。
(4)高價值,只要合理利用數據并對其進行正確、準確的分析,將會帶來很高的價值回報。業界將其歸納為4個“V”——Volume(大量)、Variety(多樣)、Velocity(高速)、Value(價值)。
大數據,其影響除了經濟方面的,它同時也能在政治、文化、衛生等方面產生深遠的影響,大數據可以幫助人們開啟循“數”管理的模式,也是我們當下“大社會”的集中體現,三分技術,七分數據,得數據者得天下。數據有了,但如何駕馭這些海量數據,將它們應用于疾病防控工作方面,挖掘數據的核心價值,這就是我們疾控人員研究的方向。
1.1 大數據技術應用的必要性
傳統疾病預防控制的方式最大的不足在于實時性上,但疾病的防控搶的就是時間。如果能在疾病流行前即預測到疾病的發展態勢,加強對疾病的預防,就能達到最大限度保障群眾健康的目的。現在,利用大數據技術對疾病傳播進行更先進的監控與控制成為了可能。
1.2 大數據技術應用實例
(1)谷歌已在疾病預測防控上已經走出先例,那么我們先來看下谷歌的谷歌流感趨勢(Google Flu Trends,GFT)的工作成果,從中窺視疾病預防控制的大數據未來。
2008年,谷歌上線“谷歌流感趨勢”項目,該項目開始預測流感傳播。
2009年在美國的H1N1爆發幾周前,谷歌成功預測了H1N1在全美的傳播范圍,具體到了州還有特定地區,判斷非常及時,令美國公共衛生機構以及全美大為震驚,疾控中心通常只能在流感爆發一兩周之后才可以做到,而谷歌的及時性讓全美側目。
這是真正第一次利用搜索引擎大數據對疾病控制的預測嘗試,谷歌因此也獲得巨大殊榮。
(2)2014年4月2日,清華大學在京宣布,該校將聯合國內醫療設備生產企業啟動基于大數據的公共衛生項目國民“健康云數據”計劃,預計3年內完成數據平臺建設,并為遠程健康管理、疾病預防等提供支撐。這也是大數據技術服務于公共衛生領域的個案,這個項目將有效提升疾病早期預防等服務的針對性。通過對大規模數據的整理分析,可以在疾病早期防控和阻斷疾病產生根源方面產生更積極的作用。
2 大數據在疾病防控的應用方向
2.1 提前確定一定規模的未知疾病,為疫情控制爭取時間
無論傳統檢測還是歷史數據統計都是無法監測到任何沒有臨床癥狀的病例的,這些經驗在醫院的臨床經驗中都為0。但大數據卻可以做到這件事,通過醫院的共享信息、疾病監測系統網絡報告數據以及各類網絡監控引擎指定地區的用戶的頻繁搜索關鍵詞,可以檢測到某個地區已經出現了諸如不明原因的肺炎,某地餐館讓多少人出現嘔吐腹瀉等異常狀況……然后再通過與疾病控制中心的病毒庫中的病毒分析,尋找吻合的病毒,進行比對分析然后將其找出,為判斷疾病贏取時間。換句話說,有了大數據后,疾病預防可以真正在第一時間內去判斷出疫情的病毒源,進而為控制爭取時間。當前的科技下,疫情的發生是誰也無法控制的,我們目前唯一能夠控制的就是及時制止其傳播的范圍,而大數據則是目前唯一的也是最佳的途徑。
2.2 判斷人員流向,控制疫情
在疫情發生后,雖然國家可以第一時間控制住當地疫情,但是人員流動則是無法控制的。現在利用網絡技術可以做到,比如A地突然爆發了傳染病,而此時根據大數據的監控就能監測到傳染源區人員的主要流向地是B地與C地,于是疾控中心就拿出對應的醫療技術和對應的治療藥品以及疫苗來防治,第一時間趕到B地與C地,將一切藥物準備就緒并為當地人接種疫苗,這樣一來就減少了盲目的廣撒網式的全面布局情況,通過網絡技術上提供的人員流動數據,讓控制疫情在效率上大幅度提升。
2.3 治療藥物和疫苗的迅速研發
在疫情發生后最重要的事情就是研發對應藥物,傳統的做法是一個小范圍的研發,然后用傳統的交流方式,但是有了大數據就不可同日而語。在病人的治療中,所有藥物的使用數據以及用戶的病情數據都將全部聯網,當機器檢測到發現某種藥物(通過讀取錄入的藥物數據)對病人的病情(通過讀取錄入病人健康的關鍵指數后的數據)有部分效果后,將會迅速納入研發的決策范圍,為研發部門提供有用參考,為研發對抗疫情的藥物以及預防疫情的疫苗,提供全網的大數據的支持。
2.4 建立疾病防控監測預警預報機制
未來通過大數據技術在疾病防控的預警預報應用方面,不僅僅只是有關部門的決策者能夠收到,而是全民都享有的福利,從而保障更多人的安全。比如當你去出差時,網絡會在你的手機上提前通知你,你將要去的地區有食品安全問題,再比如第一時間通知你,你所在的地區有流感地區的人群大量流入,讓你及時做好預防工作以及接種疫苗等等。
3 面臨的困難和挑戰
谷歌雖然在09年的預測上做出了漂亮的成績,但是在2013年的2月谷歌流感趨勢被媒體大量批評,原因就在于其數據總是偏高于真實的流感數據。
谷歌出錯的原因有很多,比如谷歌的搜索算法調整會間接影響到用戶習慣,再比如谷歌的推薦搜索以及相關性推薦也會影響用戶的搜索結果,此外搜索某個關鍵詞的用戶也不一定是患病用戶,再加上運營商的地理位置判斷等問題,使得谷歌出現算法過度擬合的情況,將噪聲當成了信號,導致其結果的不準確性。
4 對策與建議
大數據是云計算的具體化,且正在成為一個國家最重要的國家社會資源,對大數據的獲取和利用能力正成為軟硬兼備的真實力。因此,對于大數據在疾病預防控制上應用的研究可以由政府為主導,搭建基于云計算的安全、可靠、準確大數據平臺,再引入社會力量建設各類疾病預防控制專業信息服務平臺,面向公眾提供疾病預防專業、權威咨訊。
困難從從,但機會與挑戰并存,我們要加快大數據技術研究,將其應用于疾病防控,最大限度地保障人民的身體健康。
參考文獻
[1]馬家奇.公共衛生大數據應用[J].中國衛生管理信息雜志,2014(04).
[2]于石成.大數據視角下的衛生統計工作[J].醫學信息學雜志,2013(10).
[3]高漢松,基于云計算的醫療大數據挖掘平臺[J].醫學信息學雜志,2013(05).
[4]于石成.全球疾病負擔研究-大數據分析應用實例[J].醫學信息學雜志,2013(09).
作者單位
廣東省肇慶市疾病預防控制中心 廣東省肇慶市 526060