張萍 趙向梅 任志宏 李娜
(西安歐亞學院 陜西省西安市 710000)
2020年爆發的傳染性疾病不僅威脅全世界人類的生命健康,還造成全球經濟萎縮。目前,我國各級政府出臺了各種監控監測措施以應對傳染性疾病蔓延。監控措施本應與地理空間信息具有強相關性,即監測手段措施應具有明顯且充分的空間屬性和空間指向性,監測預警信息的可視化在時間和空間維度上應具有充分的信息易讀性,并能達到直觀的視覺沖擊,則后續各種調控手段才能有效發揮作用,有利于決策機構制定合理的防控政策,衛生系統支持人員才能更好地貫徹執行防控措施,廣大民眾亦能更好地配合參與抗疫。
本文基于WebGIS 技術,以傳染性疾病數據為例,將丁香醫生實時傳染性疾病地圖數據和國內傳染性疾病數據進行整合,通過MyBatis(SSM)框架集獲取數據并解析到瀏覽器頁面,利用VUE 開源框架和JavaScript 語言,結合Echarts 圖表庫等可視化工具,搭建了全國傳染性疾病模擬模塊的傳染性疾病視化系統。為決策部門提供分布式的遙感影像、文字說明等多種信息,涵蓋地理空間數據特點的傳染性疾病數據分布,并進行地理空間分析、查詢,達到發布和預警的目標。
丁香醫生“實時傳染性疾病”的推出受到公眾的廣泛關注和轉發,并一度成為公眾討論傳染性疾病的重要信息參考[1]。運用Python 爬蟲技術是當前一個有效獲取網絡數據的方法,網絡爬蟲主要是以模擬瀏覽器行為的方式實現目標網絡數據的獲取,爬蟲架構的運行流程見圖1。將丁香醫生網站的 URL 確定下來后,接下來我們就要對網站中爬蟲內容所處的位置進行分析。當前的目標信息包括傳染性疾病所在的地區、昨日本土新增、現存確診、風險地區和傳染性疾病詳情等。通過通用瀏覽器進入丁香醫生頁面,隨后對頁面的源代碼進行分析,就能將所需信息的CSS 代碼找出。本論文中我們模擬2021年1月1日到2021年8月1日期間數據為查找目標,結合瀏覽器給到的傳染性疾病信息,與 CSS 關鍵代碼相互對應。使用Python 中requests 庫的requests.get(url)方法向指定網站服務器發送HTTP 請求,得到相應的數據響應,并通過對返回的數據進行分析和解析,提取傳染性疾病的相關信息,建立傳染性疾病信息數據庫,最后結合GIS 衛星影像圖形成具有時空信息特點的傳染性疾病時空數據庫[2]。

圖1:網絡爬蟲架構運行流程圖
WebGIS 具有強大的空間數據處理能力,可以將各種空間信息資源整合在一起,為多時態、多存儲格式、多語義、非結構化的數據提供不同維度的存儲和展現形式。WebGIS 空間分析和信息查詢能夠作為醫療信息資源有效集成的模式,通過對疾病感染人員的地理位置分布、交通、人文等因素,從而建立基于空間地理信息的傳染性疾病的發布和預警平臺[3]。
在面向平臺建設時,通盤考慮到從采集處理到分析挖掘以及應用的整體架構體系,初步構建了傳染性疾病數據應用服務系統,其總體技術架構見圖2。

圖2:基于WebGIS的傳染性疾病發布和預警系統平臺架構
基于WebGIS的傳染性疾病發布和預警系統平臺采用瀏覽器/Web 服務器/數據庫服務器三層J2EE 體系結構,由基礎支持層、邏輯分析層、應用服務層三部分組成。其中,基礎支持層對不同來源的傳染性疾病數據進行數據抽取、轉換、空間屬性分析,借助分層技術,將這些屬性在GIS 中進行定位,通過共同處理圖形與數據庫信息,對平臺進行數據及平臺的基礎支持;邏輯分析層采用組件技術進行數據標準化建模、數據融合、場景關聯,研究單個或多個因素在空間上的分布性和關聯性、有無聚集性或變動性等;應用服務層以一個嶄新的視角提供數據服務和可視化輸出的應用場景[4]。
基礎支持層包括傳染性疾病數據源的采集和GIS 的底層支持兩部分,主要完成數據采集和地理信息基礎支持。通過虛擬化平臺中部署的Oracle BIEE 工具進行數據的管理、抽取及轉換分析,為邏輯分析層提供數據輸入。基礎的地理信息支持包括電子底圖數據、遙感影像資料、專用圖像數據等,提供邏輯分析層GIS 組件的輸入。
邏輯分析層主要進行數據標準化建模、數據融合、數據可視化分析、數據分層管理、數據安全控制等功能。將基礎支持層提交各類傳染性疾病數據進行空間屬性分析,分為若干數據集,結合空間數據庫管理方式,設計并建立基于SuperMap SDX+的空間數據庫。在此基礎上,利用J2EE 平臺進行Super MapObjects 全組件式GIS模塊的二次開發。以地理空間數據庫為基礎數據,在計算機軟、硬件的支持下,對傳染性疾病數據進行坐標運算和分析,將多個屬性層級進行疊加,能夠大規模、綜合性地分析傳染性疾病數據的各種應用場景。
應用服務層主要是在邏輯分析層業務處理的基礎上,提供數據服務和可視化輸出。為了更好地為其他應用模塊提供基于GIS 的醫療信息服務,平臺采用了Web Service + XML 和REST + JSON 兩種標準化的接口服務形式,可以為醫療資源優化配置、傳染性疾病預警等各種應用提供支持。
基于WebGIS的傳染性疾病發布和預警系統平臺,可及時發布及預警大規模傳染性感染人員的綜合狀況、優化醫療保障資源配置、提高醫療保障預警能力、改進醫療服務水平、提升應急醫療保障能力等。
開展面向醫療部門、基層衛生醫療機構、醫療人員等的一系列醫療應用服務。通過醫療數據資源采集、存儲處理、分析以及應用管理能力的支撐,設計健康預警、輔助決策支持、傳染性疾病模式分析、傳染性疾病防控等分析應用服務框架[5]。
通過對所獲取的數據進行歸納整理,并結合相關使用者的需求,設計了一個較為直觀的傳染性疾病可視化系統,該系統主要由發布及預警模塊、分析模塊、決策支持模塊構成。
包括的功能有:傳染性疾病發布、傳染性疾病監控、傳染性疾病預警。實現傳染性疾病信息的統一結構化管理,通過與各業務系統的集成,構建統一數字化傳染性疾病監測平臺,統一更新,保證信息的權威性和準確性,以提升衛生領域精益化數字管理水平,并能夠實時的反應當前傳染性疾病狀況。
包括的功能有:空間查詢、傳染性疾病時空發展趨勢分析、空間聚焦性分析、傳染性疾病感染熱點分析、影響因素分析。本模塊完成數據統計查詢,各地傳染性疾病信息、歷史傳染性疾病信息、各時間段傳染性疾病信息在地圖上的顯示,地域顆粒度可到縣級。
包括的功能有:傳染性疾病管理、衛勤應急管理、醫療衛生部門資源配置。本模塊中將系統中的公用信息進行標準化管理,以便系統維護和擴展,并保持系統一致性。這些標準信息包括:區劃標準、疾病編碼標準、檢測點信息管理、臨床表征等。同時還包括跨部門的信息集成:衛健委、應急響應、疾控中心等部門的信息集成。
數據庫是空間數據和屬性數據存放的一個集合。建立數據庫不僅僅是為了保存數據,更主要的是為了幫助人們管理和控制與這些數據相關聯的事物。本系統的數據庫設計包含兩個部分:空間數據庫設計、屬性數據庫設計和傳染性疾病數據庫設計。
空間數據庫用Oracle 11g + SuperMapSDX+5 的配置,設計充分考慮到其開放性、安全性和可擴展性。SuperMapSDX+5 能支持多種數據庫,同時支持矢量和柵格數據。在圖形數據和屬性數據的處理上,采取圖形數據和屬性數據統一存放和管理,圖形數據通過數據引擎連接,屬性數據通過JDBC 連接的方式[6]。
空間數據主要包括三部分,即基礎圖、專題圖和預警圖。基礎圖包括政區圖、道路、河流、高程等,直接由數字化產生。專題圖是按照一定的目的,由基礎地圖歸納或模擬生成。預警圖建立在專題地圖和模型分析結果的基礎上,通過空間分析綜合生成。空間數據以數據表的形式存儲在數據庫中。為了有效地利用衛星遙感資源迅速繪制出各種專題地圖,本文采用的是采用SuperMapDeskpros 5.0和SuperMap SDX 來存儲各地的地理數據,包括各個區域的經緯度,地名,區域面積等等,因此通用性很強。
屬性數據庫是最常見的類型,它含有描述空間特征性質或特點的數據。在此系統中包括與傳染性疾病發生和流行有關的衛健委管理、水源、交通、人口、經濟等情況,以及當地傳染性疾病收治和死亡情況的病例和診治信息庫。業務數據主要來源于疾控中心的每日發布以及一些醫療部門等的業務數據庫。
為了及時準確地獲取相關的業務數據,可以通過數據交換平臺如中間件、聯機分析處理等技術跨庫來獲取數據,這就涉及到數據格式等的統一及其他行政方面的協調等問題,這里只是一個實現數據的想法,要實現需要投入更多的人力物力[7]。
本文以傳染性疾病數據為例,利用Spring MVC + Spring+MyBatis(SSM)開發框架進行業務數據的訪問,在前端可視化表達方面采用Cesium 二、三維開源地圖框架,結合Echarts 圖表庫和Bootstrap 前端框架將數據以不同的可視化方式展示,系統主要功能論述如下。
全國傳染性疾病界面主要是對傳染性疾病情況進行分析,中間部分采用Cesium 二、三維開源地圖框架將全國感染人數展示在衛星影像圖上,顏色深淺代表不同區域感染人數的數量,顏色越深感染人數越多。該模塊可以按天查詢每日各省感染人數情況,以及按時段動態展示各省感染人數的變化,當點擊某一個省份還可定位到此省份或自治區并查看其相關傳染性疾病信息以及交通人文經濟等相關情況,如圖3所示。

圖3:某行政區交通人文、地形地貌等的信息展示
界面右側包括每日傳染性疾病確診趨勢折線圖以及年齡段分布情況,右下角是治愈及死亡人數餅狀圖。通過以上不同的可視化表達可以多維度非常直觀地展示全國傳染性疾病情況,如圖4所示。

圖4:傳染性疾病統計與展示系統主界面
年齡分段目錄可根據年齡分四組來記錄病情的情況,季節分組分為春夏秋冬來記錄每個季節出現病情的狀況,其他大型的傳染病情都可以依靠此系統來進行記錄監控,如圖5所示。疾病分類目錄是以年度為單位展示每年的患病情況以及控制程度,如果患病情況嚴重,上方描述會提示“要及時治療,必要時呼吸內科就診”,所有的建議診斷描述提取的數據均為某三甲醫院HIS 數據庫中的建議診斷描述。

圖5:年齡分段信息和季節分組目錄信息
傳染性疾病是近年來影響我國乃至全世界的一次重大的突發公共衛生事件,對我國公共衛生應急管理提出了巨大的挑戰。本文探討了基于WebGIS的傳染性疾病發布和預警的應用,研究利用WebGIS 直觀展現傳染性疾病感染人員的地理位置等,建立預測模型,預測傳染性疾病的蔓延趨勢,以可視化的方式顯示各類醫療衛生機構分布,便于各級衛生主管部門指揮調度,完成應急醫療力量的人員派遣、規劃、緊急調度和路徑優化等任務,為主管部門提供醫療信息服務,為醫療保障研究提供有效的信息化工具和科學決策支持手段都具有重大的意義。
但目前的研究還處于初級階段,還有一些問題亟待解決,例如醫療機構數據共享,醫療資源配置調度的協調性等問題,這也是下一步研究的方向和思路。