馬曉江 周 然 鄒顯東 張振喜 高貴軍
(1河北省疾病預防控制中心公共衛生信息所 石家莊 050021 2 河北省衛生健康委員會項目管理中心 石家莊 050000)
當前,全球經濟文化交融逐漸深入,人員流動增加,突發公共衛生事件的暴發和傳染病的新發、再發,對人類生命健康安全構成嚴重威脅[1]。疾病預防控制人員面臨如何控制傳染病和突發公共衛生事件經濟成本,提高工作效率,增強公眾衛生保健意識,保障公眾身體健康等問題。隨著信息技術的發展進步,基于大數據、云計算、人工智能等技術的相關解決方案逐漸顯現出獨特優勢,蘊藏巨大發展潛力。本文以河北省疾病預防控制中心公共衛生數據平臺建設為例,對大數據技術在公共衛生應急管理工作中的應用問題進行初步探討。
公共衛生信息化建設需要總體規劃、統一標準和統一平臺,以便有效采集和利用醫療信息,應對傳染病流行和公共衛生事件突發等問題,推動河北省公共衛生信息化縱深發展。河北省公共衛生數據平臺(以下簡稱平臺)依托中國疾病預防控制中心信息管理系統(以下簡稱直報系統)原始數據,結合河北省公共衛生應急管理工作特點,研制開發符合實際工作需要的數據平臺。
平臺與直報系統對接,同步上傳、接收傳染病與突發公共衛生事件數據。根據實時、定制化統計分析資料,追溯傳播源頭、明確傳播路徑、發現突變規律及其潛在風險,以最快時間做出研判。針對即將可能發生的突發公共衛生事件,為切斷傳染源,阻止致病細菌、病毒大規模蔓延[2]以及制定科學、精準、適合的應對防控措施提供信息支撐。
2.1.1 平臺總體架構 平臺縱向包括基礎環境層、數據資源中心服務層、支撐應用服務層、平臺應用層和接入層5層;橫向包括標準規范體系、業務應用體系和安全保障體系3部分,形成面向服務應用系統集成、信息共享和交換的整體架構,見圖1。

圖1 河北省公共衛生數據平臺總體架構
2.1.2 數據同步架構 為保持數據一致性,需要自動同步國家直報系統屬地化傳染病和突發公共衛生事件數據,建立數據交換與共享平臺,即數據同步系統。建立星型結構數據交換體系,數據交換管理平臺處于中心位置,成為實現數據交換的核心,通過數據交換管理平臺為每個數據交換節點提供服務,見圖2。

圖2 河北省公共衛生數據平臺數據自動同步架構
2.2.1 統計分析查詢模塊 根據不同疾病分類制訂統計指標,實現實時、定時、比較等統計分析功能。按照時間、地區、人群等分類定制統計分析內容。其中包含地區排序、發病趨勢和高發地區分布等專題分析。完成查詢和報表輸出。輸出統計圖,生成分析結果,給予直觀評價。并對數據存在的差異性給予定量、計數等統計學方法分析,進一步推斷利用。
2.2.2 智能簡報功能模塊 疾病報告動態分析是報告管理工作的重要內容,包括每月進行常規動態分析,每年度進行深入、全面和前瞻性的例行分析;設置不同病種和事件實時專題報告。手工制作費時費力且無法滿足各方面需求,應用數據平臺的簡報功能模塊,可以根據不同業務需求定義多個簡報模板,并對簡報模板進行管理。針對不同簡報模板,結合流行病學現場和實驗室監測資料設置不同任務。參考現時和歷史報告資料作出比對、推斷分析,在簡報中給予描述,解決人工制作耗時費力問題。同時特別設置傳染病和突發公共衛生事件聚集性監測、重點關注監測、高發流行監測3個模塊。可自定義聚集性監測時間,如監測7日內事件聚集情況、重點關注高發流行病種。
2.2.3 預警預測功能模塊 根據傳染病及突發公共衛生事件發生、發展規律,對可能發生的流行趨勢作出預測。主要依靠初始基礎數據和預警模型,根據任務需要配置后臺不同預警模型、計劃預警周期。同時考慮模型信息設定(常量)、閾值設定(設置方式及常用指標的靈活配置維護)和預警的頻率及格式(周期和定性、定量),實現與國家直報系統中河北省相關數據同步,隨后將產生的實時數據經過分析處理后傳送到數據平臺。達到觸發條件時,實時預警并以短信方式通知工作人員。還可將傳染病預警模型計算結果顯示在地圖上,實現預警信息的地域分布及其量化數據的可視化,見圖3。

圖3 河北省公共衛生數據平臺預警預測功能模塊架構
2.2.4 地圖展示功能模塊 省、市、縣不同級別用戶可以從時間、疾病等維度定制地理信息系統(geographic information system,GIS)統計分析圖形,并通過電子屏幕展示。對滿足預警條件的傳染病和突發公共衛生事件,通過不同等級的圖例進行預警展示。展示內容還包括醫療救治、疾病防控、人口、經濟等方面,可通過短信、視頻會議方式進行決策分析、指揮調度,及時有效處置突發公共衛生事件。
應用大數據融合等技術手段,將醫院、公安、通信、交通、物流系統等相關部門采集的“面上數據”與疾控部門信息平臺上報的“線上數據”有機結合。預留與公安、通信、交通、物流等其他行業機構的接口,保證業務系統數據庫結構和編碼規范化。
首先是物理安全。指服務器的安全保障,電源和設備容錯等。其次是網絡安全態勢覺察。監測漏洞和病毒,實時跟蹤并給予預警,全面掌握河北省數據平臺安全態勢。最后是發現網絡安全威脅、風險隱患和網絡攻擊情況。了解網絡最新告警情況、攻擊類型分布、攻擊地址排行、病毒分布類型、漏洞排行以及整體安全態勢。對已經發現的威脅治理情況給予展示,完成分析總結。
傳染病及突發公共衛生事件的發生與地理環境、氣象因素、社會因素、人類行為等多種要素高度相關,目前系統僅能實現對數據的宏觀展示。下一步應依托大數據技術與流行病學、統計學等多學科交叉融合技術,對地理、氣候因素與其發生傳染病流行的內在關系進行深度挖掘,為傳染病早期發現、風險研判、因地制宜制定傳染病預防措施等方面提供支撐和科學依據。
預警模型主要采用機器學習技術,數據采集、病原體變異等原因可能導致預測偏差,中遠期預測能力不足,不能實現定期和定義性的預測功能,同時主觀因素也會影響預警預測準確性。
平臺建設過程中發現,由于跨部門間缺乏常態化的數據共享和開放機制、數據交換和共享較為困難。各行業自行建立數據平臺格式、預留接口不統一,不易對接,冗余程度較高。因此需要依據交換流程預留接口,并制定接口標準規范。
通過大數據技術迅速下沉,推動實現全鏈條傳染病防控,促進防、控、治環節之間快速、有序銜接[3]。借助人工智能(artificial intelligence,AI)和大數據技術對疾控數據進行深度學習,結合地域特征、區域密度和人口流動率等數據,采集疾控內部縱向“縣(區)-市-省-國家”自下而上的垂直領域數據、跨行業部門橫向(如地理、氣候、公安、交通等)相關數據,實現數據銜接貫通,消除“信息孤島”。
在制定接口規范時,不僅要考慮可擴展性,同時還要考慮執行效率[4]。制定出臺基礎數據的管理和使用規范,保障至少全省范圍內數據的一致性[5]。即建立唯一的標識和索引,對疫苗接種、就醫就診等信息一鍵查詢。實現疾控機構與醫院診療的接口統一,使接收者和發送者能夠準確解讀所需信息,保證數據兼容順暢。
“平臺”建設的核心是預警預測,即利用數據倉庫統計、關聯、挖掘等分析手段,結合數學模型和人工智能技術對傳染病進行定性和定量分析[6]。在使用此功能時發現,由于人為主觀因素、環境變化、病原體變異和數據采集偏差等原因,預警預測的精準度受到影響,中遠期預測能力不足。因此提高數據采集的質量,優化機器學習方法,處理好殘差異構數據序列等問題,提高精準度是未來的主要工作目標。
網絡信息安全是平臺數據暢通運轉的前提和基礎,要從整體上認識平臺信息安全的重要作用,建立新型無中心化證書授權(certification authority,CA)認證體系,有效提高加密安全性和破解難度[7]。加強日志系統建設,做好日志綜合分析利用,及時發現安全隱患[8]。應用個人信息保護與信息共享安全管理模式[9],保證系統數據內所涉個人信息安全。全方位采集網絡設備、安全設備、安全管理系統的數據,進行深度挖掘與分析,對網絡的攻擊和威脅做好實時監測與預測。
由于原有公共衛生數據平臺已經不能完成當前最新工作任務,升級建設全覆蓋的區域化多觸點信息化數據平臺,利用新一代信息技術,打通多部門多渠道業務系統數據通道,實現多源數據的匯聚與融合,促進多部門業務協同聯動。推進對傳染病、突發公共衛生事件及其危險因素的監測精細化、管理智慧化[10]。保證能夠快速開展應對策略研究,組建傳染病流行病學、臨床醫學、實驗室檢測和應急管理等領域的專家團隊,基于系統初步風險評估結果對當前傳染病風險進行深入研判,進而高效快速響應和處置,在降低感染率的同時節約醫療支出[11]。提高應急處置能力、疾控工作能力和整體水平。