葉于林 于繼偉 劉顯勝 周萌萌 呂志博
自新冠肺炎發生以來,面對這場沒有硝煙的戰爭,在黨中央堅強領導下,全國各族人民萬眾一心,同舟共濟,守望相助,共克時艱,采取了及時有力的舉措,堅決打贏這場疫情防控的人民戰、總體戰、阻擊戰,目前已得到有效控制,整體趨勢向好。回溯這次疫情防控全過程,從疫情研判到情況處置,從專家建議到管理決策,從傳染源控制到智能診斷,從藥物篩選到疫苗研制,從防疫物資生產到緊急調度等,無一不印證了“大數據”技術在其中發揮出的快速、精準、智能、便利、真實的巨大優勢和作用,為疫情防控堅定了必勝信心,提供了有力保證[1-3]。
大數據通過對海量的數據進行相關性挖掘分析,可以預測某一復雜事件的規律,做到提前預警[4],傳染病的防控也不例外。2009 年2 月,谷歌公司的工程師在《自然》上發表了一篇題目為《利用搜索引擎查詢數據檢測禽流感流行趨勢》的論文,利用統計某個地區的用戶搜索詞,來預測流感的發生,并設計了一個流感預測系統GFT(Google flu trends),宣稱該系統可以比美國疾病控制與預防中心(CDC)預測流感趨勢還要快,可提前2 周發布流感預警信息,準確率居然高達96%。論文一發表,很多人感到匪夷所思,該系統不去研究流感病毒本身有什么特征,僅憑著互聯網上的搜索詞,就可以預測流感?簡直是逆天了,這個消息一下子轟動全世界。
其實,仔細研究分析該論文,有力的印證大數據通過相關性分析的預測作用,如在某一個區域某一段時間,有大量有關流感的搜索指令,那么就可能存在一種潛在的關聯,在這個地區,就有很大可能性存在對應的流感人群,相關部門就值得發布流感預警信息。因為有人感冒了,或者快感冒覺得不舒服,就會上網去查一查“感冒吃什么藥好”、“哪里有賣感冒藥的”、“嗓子不舒服是什么原因”,或者是“什么原因會導致咳嗽”等,這些搜索詞就成了分析是否具有流感趨勢的數據,同時流感一般具有傳染性,所以如果這樣的情況形成了一個高峰,就可以考慮發布流感預警了。
但是,為什么這次新冠肺炎疫情大數據預警來得晚,且基本上沒有起到預警作用。這值得我們深思。粗略地分析一下原因,首先是傳染病根本沒有被列為互聯網界關注的優先點;其次是疾病控制與預防中心沒有相關的大數據分析平臺,或者是有,但沒有起到作用;再次是在發現不明肺炎之初,醫療機構的信息中心的技術人員敏感性不夠,沒有能夠根據十幾病例的病情分析出人傳人,沒掌握住病毒控制的主動權。因此,有了這次新冠肺炎疫情的深刻教訓,國家應該大力重視利用大數據等其他高科技信息技術進行疫情預警,做到防患于未然。
在傳染病的防控過程中,控制傳染源、追蹤密切接觸者至關重要。如何利用高科技技術手段快速準確的追蹤傳染源,并有效的控制,避免傳染進一步擴大,在這次疫情防控中,大數據實實在在的“大秀”了一把。武漢市封城前將近500 萬人流出,如何實現快速精準追蹤到這500 萬人,并追蹤與其密切接觸過的人,電信大數據、交通大數據、電力大數據等提供了強大的支撐作用。
現在手機已經成為我們個人的另一張身份證,目前我國獨立移動通訊用戶的普及率約為82%,幾乎具有獨立活動能力的人群都擁有一部手機,且實行了手機用戶的實名制,從手機用戶就可以識別持有人的身份。因此,可利用電信大數據進行基站定位追蹤,一般手機在待機的時候,用戶從一個地方移動到另一個地方,這個時候手機要不斷接收基站發出的測量信號,讀取基站測量信號,即選擇新的地方,在非待機的時候可實現基站切換,從而進行定位,且速度快,但定位精度不夠。為提升定位精度,可進一步采用全球導航衛星和數字地圖系統,因為現在我們用的大多為智能手機,且大多都具有全球導航衛星的接收能力,定位精度一般數十米,當然更好地可以做到米級,但是室內是做不到的。再加上數字地圖系統的應用,可進行街道掃描,進而可定位到每一棟樓。但前提是手機用戶必須下載數字地圖的APP,開機并啟用了定位功能,才能把變化的位置信息發送給GPS,進而確定其身份位置。同樣,電信大數據通過手機定位,也可以知道這個用戶是不是來自疫區,是否到過疫區,可以用于個人自證有無疫區行程;通過計費數據,可以知道用戶平時比較密切的聯系人,就可以確定是否為用戶的密切接觸者。
此外,也可以結合交通大數據,通過對離開武漢的航班、輪船、火車、公交車輛進行追蹤來確定離漢人員身份,但交通大數據更重要的是用于同行人及密切接觸人員的確定。通過電力大數據對用電情況的綜合分析,也可以確定一個家里邊是否有人在家,是否有人回來。在這次疫情防控中,國網電力杭州公司,就開發出大數據分析的算法,通過對采集的1 000 多萬條數據進行分析,能夠很好的知道,有沒有居家隔離的人,有沒有獨居的人,社區就可以根據這個來判斷來做針對性地服務。
有了以上的數據,怎么來決定疫情的傳播?國際上通常用一種叫SEIR 傳染病模型。它把人群分成四類,S(Susceptible)易感者,指未得病者,但缺乏免疫能力,與感染者接觸后容易感染;E(Exposed)暴露者,指接觸過感染者,但暫無能力傳染他人,對潛伏期長的傳染病使用;I(Infectious)感染者,指已經感染的人,可以傳播給 S 類,將其變為 E 或 I 類成員;R(Recovered)康復者,指被隔離或因病愈而具有免疫力的人。通過以上模式,采用大數據技術對其進行計算分析,可以得出傳播預測,為疫情防控精準施策,提供了有價值的參考意見。
大數據根植于人工智能,為人工智能的機器學習提供原料,兩者相互結合將釋放出具大的能量[5]。在本次疫情防控中,新冠肺炎患者的核酸檢測,取樣主要是通過口腔部來取樣進行檢測,但實際上這里感染并不算嚴重,肺部才是最嚴重的。因此,檢測結果有一定的誤差,如需確診還需進行肺部CT 掃描。對掃描出的大量CT 照片,如果一張張看耗時又耗力,況且時間也不允許,因為時間就是生命。利用醫學大數據,主要包括以前拍攝的CT 照片、醫生的診斷結果意見及相關的醫療經驗,結合人工智能技術,進行機器學習,研發出CT 影像大數據分析評價系統,通過系統就可以把CT 照片還原回一個3D 三維的肺,比較容易看清肺部有沒有纖維化,有沒有變毛玻璃狀,有沒有病灶,然后進行智能綜合病理分析,高效、精準給出診斷結果。過去醫生可能要花幾個多小時,現在幾分鐘就可以完成。在這次疫情中,大數據在智能診斷中實現了從直覺判斷到數據推導的轉變,為疫情防控贏得了寶貴的時間。此外,大數據在病毒檢測、基因序列分析、宿主分析等都起到了關鍵性的作用。
疫情大規模爆發后,防疫物資器材生產與緊急籌措調度供應是打贏這次防疫阻擊戰的重要保障,多生產一個口罩、一套防護服、一瓶試劑、一臺醫療設備,精準對接,按時達到,就能有效挽救更多危重癥患者的生命,大數據在其中起到了至關重要的作用。比如,海爾公司研發的疫情醫療物資信息共享資源匯聚平臺,一方面連接著醫院、政府、社區等,多達1 000 多家,發布了需求5 000 多萬件;另一方面連接著能生產醫療物資的企業和能支持援助的民間組織、團體、個人以及國家、國際友人,打通供求上下鏈條,實現了抗疫資源的精準對接。此外,它的采購不只限于中國,甚至還到了全球。湖北省由志愿者開發了一個醫療物資需求平臺,該平臺主要從互聯網上爬取數據,然后按城市醫院類別進行分類,登出需求、運輸及聯系方式供物資供應企業查詢。四川省開發了防控應急物資的管理系統,把物資的入庫、調度、審批、庫存、日常消耗需求匯總在一起,進行智能分析,實現物資的合理調度,提高了應急物資配置的調度效率。浙江省寧波市也搭建起了數字化防疫平臺,有7 300 多家企業、15 000 多名員工做了登記,復工的同時讓防疫工作可溯可控,從而保證了急需防疫物資生產擴能。這些智能平臺、決策系統,有了“大數據”的幫助,充分發揮其效能,火力全開,全面助力疫情防控。
在傳染病防控過程中,“防”是首要任務,“控”是關鍵任務,如何從根本上進行控制,就需要藥物和疫苗。本次發生的新冠肺炎,目前是還沒有特效藥用于治療,在臨床上主要采用老藥新用,把一些過去抗艾滋病、流感的藥物重新檢驗一下,看它有沒有可能對新冠肺炎有效。但是,我們知道,目前已經上市的和臨床實驗的藥物有近萬種,一種一種來篩選,時間是很長的,這就需要通過大數據技術來對各大醫藥公司生產的藥物的原始數據及臨床數據進行智能分析篩選,起到事半功倍的作用。同樣,新藥和疫苗的研制總體過程也是比較長,主要包括藥物的篩選、活性的評價、藥理的分析、安全評價等,甚至到臨床還要做很多工作,這就更需要人工智能藥物研究平臺,以大數據為技術手段,進行智能分析,從而為新藥及疫苗研制奠定基礎[6-7]。如清華大學藥學院,研發的人工智能藥物研發大數據平臺,收集了以前冠狀病毒研究中涉及的900 多個小分子的實驗信息,利用大數據智能分析就大大加快藥物的篩選。
在本次疫情防控中,為減少線下診療壓力和交叉感染風險,各省各級各部門利用大數據信息技術,高效跟蹤、篩查、預測疫情發展,為科學防治、精準施策、便民服務提供強有力的支撐。據不完全統計,疫情發生以來,基于“大數據”平臺,全國推出的疫情服務小程序多達百余款,為廣大民眾提供口罩預約、疫情防控指南、疫情態勢、防疫健康碼、在線義診、患者同程查詢、康復者跟蹤回訪、在線教育、在線辦公、復工疫情城市熱力圖等服務。武漢市政務服務和大數據管理局研發的“武漢戰疫”小程序,市民可通過手機小程序隨時了解疫情最新情況、查看定點醫院病床使用情況、自查發熱癥狀、查詢發熱門診導航等疫情服務;廣州市政府推出的“穗康”小程序,具有“健康自查上報”、“疫情線索上報”、“醫療物資捐贈”、“口罩預約購買”等多項在線服務功能;為緩解廣大市民的焦慮情緒,武漢市協和醫院開啟了小程序網上門診服務,為武漢市民提供線上服務。據騰訊官方數據顯示,“騰訊健康”服務目前全國已有18 個省份多家醫院接入了微信推出的城市服務“疫情專區”、“發熱問診”、“發熱自查”等小程序,為廣大用戶提供在線免費問診服務,這些程序雖“小”,但在疫情服務上卻發揮了“大”作用,充分發揮了大數據的方便有利優勢。
最后,與17 年前的非典疫情防控相比,本次疫情防控在“大數據”科技的助力下,成了一場全民參與的科技信息戰,實現了科學防治、精準施策,“大數據”也已成為這場沒有硝煙的戰役中克敵制敵的法寶,但是大數據也不是智慧醫療的唯一方法,需要跟其他信息技術結合,同時也要跟醫學專業知識結合,才能發揮其巨大效能。因此,此次戰役中“大數據+疫情防控”的創新模式,使得大數據應用環境進一步優化,已經給未來各個行業、領域探索“大數據”信息技術的應用,提供了一條高效可循的發展之路[8]。相信不久的將來,智慧城市、智慧交通、智慧家居等智能社會模式全面深入展開,將大大有利于服務生活,服務社會,服務全人類。