董銀峰,劉忠于,王好鋒,陳暉娟,劉 欣,郭宇冰,高春芳
大數據是指利用信息收集和處理技術對所掌握的海量數據進行專業化處理、分析的統稱。它的意義在于實現對全部信息的整體把握,并從中挖掘出重要信息。疾病預防控制工作一直承擔著保障人民群眾健康的首要職責,涵蓋包括傳染病防治、慢性病預防、兒童疫苗接種、各種危害因素監測及干預等諸多方面,貫穿于生命的全過程。近些年,隨著互聯網和移動設備的普及,國家層面的醫療系統、手機、可穿戴醫療器械等日常設備為我們提供了巨大的醫療信息流,疾病預防控制成為大數據應用的一個重要領域。大數據不僅能夠顯著提高醫療工作者對傳染病疫情的追蹤和響應能力,對疾病早期預警信號的判斷能力[1],而且能夠加深醫務工作者對慢性疾病的成因了解,為早期預防、精準施藥、實時治療監控等提供便利。本文就大數據在傳染性疾病和慢性疾病防控方面的重要性進行簡單介紹。
隨著經濟全球化的發展,人員和貨物的全球高密度流動極大增加了大規模流行性疾病暴發的風險。近年來,非典、禽流感、“埃博拉”病毒等嚴重傳染病的大暴發,使我們深刻意識到傳染病預防和控制研究的重要性。傳統的傳染病調查主要通過調查嚴重傳染病病例,以確定類似案件,嚴格管理傳染源,迅速切斷傳染途徑,防止疾病進一步傳播[2]。但這個過程非常耗時,往往還在調查中,傳染病已經呈現地區性大暴發。此外,患者常常忘記近期到過的地方和接觸的人,這就更增加了防控的難度。然而通過全球定位系統信息和疾病流行數據,大數據卻可以在短時間內確定患者到過的場所、可能的感染者和傳播途徑,從而提高公共衛生人員對疾病追蹤、早期預警等能力。
1.1 大數據在傳染病疫情預測中的作用 2014年埃博拉病毒大暴發,大數據在疫情預測上發揮了至關重要的作用。一方面醫療救助機構利用大數據,透過分析電信公司提供的當地居民行動通信資料,定位當地疫區位置,預測當前病毒散布區域,為合理規劃醫療救助站位置、分配醫療物資、安排最優救助路線提供第一手資料[3];另一方面,加拿大Bio.Diaspora公司利用大數據,運用地理資訊系統,通過分析全球航班起降、人口移動、氣候溫濕度變化、家禽家畜密度、城市衛生管理系統等資訊,建立模型,發布動態全球病毒地圖[4],預測下一個可能引暴埃博拉病毒的地區,為早期預警、優先預防搶占先機。大數據在傳染病的預測防控上的應用還有很多,谷歌流感趨勢、百度疾病預測,以及科學家整合大量數據集,繪制H5N1禽流感感染風險地圖,并據此預測研究 H7N9 病例區域[5]。
1.2 大數據在傳染病監測的作用 自2003年非典后,我國加強傳染病信息化建設,目前國內已有包括傳染病與突發公共衛生事件監測信息系統、傳染病公共衛生實驗室監測信息系統、預防接種信息系統等多條信息收集途徑。不僅覆蓋全國所有縣級及以上疾控機構,縣級及以上醫療機構報告率達98%,鄉鎮衛生院報告率達87%,平均報告時間為0.8天;而且覆蓋39種法定傳染病,建立了霍亂、血吸蟲、鼠疫、艾滋病、結核病、不明原因肺炎等單病種監測系統,并開發和實施了國家傳染病自動預警系統[6,7]。如此龐大的衛生信息系統,再加上互聯網、移動設備等提供的實時資訊,為我國實時監測傳染病、及時快速應對傳染病提供了廣闊的空間。在此基礎上結合基于數據倉庫的BI和數據挖掘應用以及非結構化數據的分析、挖掘技術,可實現從數據到規律再到可執行策略的升華,為傳染病防控建立起堅不可摧的防控城墻。
最近發布的《2020年健康醫療預測報告》顯示目前我國高血壓患者超過1.6億人,高脂血癥超過1億人,糖尿病人口約有9240萬,血脂異常1.6億人,脂肪肝患者1.2億,并且預計2020至2050年我國將進入加速老齡化階段,到2050年,老齡人口總量將超過4億,老齡化水平將超過30%。隨著老齡化的到來,我國慢性疾病患者的人數勢必更加龐大,消耗醫療資源也將更多。對這些慢性疾病的防控及相關健康服務的管理將深刻地影響國家的福祉。大數據的發展將為慢性疾病的預防和治療帶來革命性的進展,為公眾健康來帶了轉機。
2.1 大數據在慢性非傳染性疾病防控中的作用慢性非傳染性疾病起病隱匿,病因一般非常復雜,不僅與遺傳相關,還與環境因素、個人行為等息息相關。基于大數據在數據收集、分析及大量個人健康數據的關聯上的巨大優勢,可以找出導致患病的非遺傳性關鍵因素,為慢性病公共衛生防控提供有力的參考依據。日趨完善的電子病歷、電子健康檔案等提供了豐富的慢性病資料,包括患者群基本信息、患病情況、家庭健康行為及個人健康行為等各方面信息[8]。以WHO全球慢性病監測框架為例,其監測包括水果攝入量、超重和肥胖、血糖升高、血壓升高、總膽固醇升高等多種指標。另外,社交網絡、移動終端、可穿戴性醫療設備也提供大量的個人社交、心理、生理等醫療信息。通過對這些數據進行提取、綜合分析,建立慢性數據模型,衛生管理部門能夠預測家庭生活環境、個人生活習慣與慢性疾病之間的潛在關系,適時采取干預措施,做好慢性病追蹤、疾病防控工作,爭取實現未病先防、既病防變。
2.2 大數據在個人健康管理中的作用 公眾的醫療健康意識逐漸提高,個人健康管理越來越受到重視,Google Health、百度云健康平臺、微軟的Health Vault等都在個人健康管理上嶄露頭角。借助可穿戴性醫療設備對人體的血壓、血糖、血氧、心率、BMI指數等進行持續監測,利用大數據技術對采集到的連續體征數據進行橫向和縱向的波動規律分析,橫向分析是將體征數據與同年齡、性別的人群比對,分析健康情況和罹患中長期慢性病的風險,縱向是與自己的基準值進行比對,判斷自己的健康狀況的發展趨勢,通過這些分析,可對身體進行健康風險評估,當出現異常時,盡快進行相應的預警調整,降低疾病風險。
2.3 大數據在臨床醫療決策中的作用 慢性疾病一般病程長,病情遷延不愈,因此慢性病的治療也是一個長期的過程。基于大數據的疾病治療模式,一方面遠程實時監控的移動醫療健康服務、可穿戴移動醫療設備的應用,可實現臨床指標的遠程和實時監測,對病情變化進行預判或及時調整治療方案,為患者提供最及時,最佳的醫療處理[10]。另一方面根據電子病歷等提供的醫療信息,可精準地分析患者的體征、療效數據,輔助臨床決策,避免過度或不良反應較為明顯的治療[11]。
目前我國電子化慢性病監測信息系統尚未健全,與WHO全球監測框架指標比較,還有很多指標缺乏中國的數據[12],為此《健康中國2020戰略研究報告》中提出將推出611億元預算的全民電子健康系統工程,完成健康檔案中的數據積累。并在《中國慢性病防治工作規劃(2012—2015)》提出了慢性病監測工作的三個指標:一是全人群死因監測覆蓋全國90%的縣(市、區);二是慢性病及危險因素監測覆蓋全國50%的縣(市、區);三是營養狀況監測覆蓋全國15%的縣(市、區)。通過收集分析這些醫療數據,可把握不同時期我國慢性病的流行現狀及其變化趨勢、積極采取應對策略及措施,切實做好疾病防控工作;同時還應通過講座、特刊、健康行活動等形式宣傳慢性病防治工作,提高全民健康意識,改變不良生活方式,降低疾病發生率。
大數據在疾病防控方面有著巨大的潛能,特別是在預防傳染性疾病方面能夠發揮出巨大的優勢,但是現階段醫療大數據也存在著不足。
3.1 大數據結果的準確性有待提高 2009年 “谷歌流感趨勢”曾成功預測美國冬季流感的發病率,但之后的幾年,預測結果與傳統的公共衛生監測方法相比,不同程度的高估了類流感的發病率,有時甚至高出一倍以上,使該項目在美國遭遇到了很大質疑。回顧該項目的原理主要是根據美國各州和主要城市對流感短語的搜索來預測流感的暴發,從中可以看出忽略了一個重要的因素——數據噪聲[1],即并非搜索流感資料的都是類流感患者。為避免大數據帶來的大錯誤分析,我們必須重視數據噪聲,在技術層面上避免或減小錯誤的發生。Khoury和Ioannidis在science一文中提出通過以下幾個方面可以有效降低噪聲信號[1]:①重視分析方法,建立數據-結果間合理、強有力關聯假設,避免數據與結果間的虛假關聯;②建立更專業的流行病學研究基礎,以獲得具有良好流行病學特征的人群優質數據信息;③綜合多方面數據信息,注重多學科知識的融合;④圍繞循證醫學原則,驗證關聯、預測的準確性。
3.2 醫療大數據中數據開放和個人隱私的平衡問題 從監管和技術層面來看,可以通過以下幾方面的改善逐步實現在不暴露個人隱私的前提下提供數據共享:①鼓勵公私合作;②明確數據訪問權限,出臺隱私和數據所有權政策,確保患者和他們的醫療保健提供者能夠正常訪問數據,同時為他們提供可靠的網絡技術和安全的數據共享;③允許數據開放,聯合非限制性的政府數據和非特有的私人數據組成一個開放的公共數據,以促進一個“大數據”的健康生態系統的發展;④加強可利用開源工具進行數據分析的人才隊伍建設;⑤加大醫療工作者與大數據人才之間的協作,打造“生活實驗室”,開發新的醫療大數據解決方案。
雖然大數據存在不足,但大數據為疾病的預測帶來的巨大變革是不可否認的,而且我們相信,在不久的將來,大數據匹配的分析方法會更加全面和精準,與大數據相關的政策法規也會陸續出臺,大數據必將在疾病防控方面發揮巨大的潛能。
[1] Khoury MJ,Ioannidis J.Big data meets public health[J].Science,2014,346(6213):1054-1055.
[2] Pentland A,Reid T.Big Data and Health:Revolutionizing Medicine and Public Health[J].WISH Big Data and Health Report,2013.
[3] Matthew Wall.Ebola:Can big data analytics help contain its spread?[EB /OL].http://www.bbc.com/news/business-29617831.2014-10-15.
[4] 辛 妍.Bio.Diaspora:基于大數據的疫情擴散預測[J].新經濟導刊,2014(11):44-49.
[5] Butler D.Mapping the H7N9 avian flu outbreaks[J].Nature,2013,496(7446):399.
[6]馬家奇.中國疾病預防控制信息體系規劃與發展[J].中國數字醫學,2011,6(6):11-13.
[7]相海泉.公共衛生的大數據應用:專訪中國疾病預防控制中心信息中心主任馬家奇[J].中國信息界:e 醫療,2013(5):43-44.
[8]周光華,辛 英,張雅潔.醫療衛生領域大數據應用探討[J].中國衛生信息管理雜志,2013,10(4):296-304.
[9] 利用大數據預防慢性病[EB/OL].http://365jia.cn/news/2013-11-27/FC834972FE1F5CB6.html.2013-11-27.
[10] Wagner EH,Austin BT,Davis C,et al.Improving Chronic Illness Care:Translating Evidence Into Action[J].Health Aff(Millwood),2001,20(6):64-78.
[11]喬 巖,王 偉.大數據在醫療領域的應用[J].健康管理,2014(07):48-49.
[12] 梁曉峰.我國慢性病監測還缺乏“中國數據”[EB/OL].http://health.sohu.com /20120818 /n350956939.shtml.2012-8-18.