杜文華
(中南民族大學,湖北 武漢 430074)
大數據背景下突發事件、情報數據信息的采集與研判,需要充分利用大數據挖掘技術、云計算技術、人工智能技術等,對海量的外部環境空間信息,進行數據采集、挖掘分析及應急預警,并將網絡或現實突發事件的預警結果,經由5G 通信網絡傳送至用戶端口。借助于DKhadoop 應用程序框架、MySQL 數據庫,以及TCP/IP 開源協議、Apache 服務器等的軟硬件,建構應急管理情報系統,對前端收集到的突發事件信息、情報數據信息進行處理,實現小范圍空間內的突發事件信息收集、自主處理、資源共享與應急預警等的管理[1-3]。
在某一小范圍的空間環境中,可能會由于外部因素、內部因素等的影響,而發生不可控的突發事件或狀況,對于多種突發事件信息、情報信息的采集,通常會用到一系列的無線傳感技術。
當前不同社會空間中使用到的無線傳感技術,包括環境光/溫度/濕度傳感器、聲音傳感器、RFID 無線射頻識別傳感器、人臉識別傳感器和視頻監控器等的裝置,多種傳感裝置分別負責光線、溫度、濕度、聲音和視頻等數據信息的采集,完成某一空間范圍內的人流車流、突發地震、非法侵入、爆炸、車禍和疾病等信息采集。隨后由應急管理情報系統的后臺,去除傳感裝置中的冗余信息,獲取到穩定的數字信號。
對于突發事件信息、情報信息的挖掘計算,主要利用DKhadoop 應用程序管理平臺、spark 分布式計算框架,建立起用于突發事件數據挖掘的分布式計算系統。而后借助于多元線性回歸的統計分析算法、機器學習算法,對前端傳送的重要溫濕度、圖像、聲音等日志或表單信息,展開數據收集、分類、挖掘處理,并整合系統內的日志信息、表單信息,輔助后臺管理人員作出工作決策。
面對大規模的突發事件數據、信息計算任務,要利用基于Web service、Agent、中間件等的分布式計算技術,以及MIMD 多指令流向量處理的并行計算技術,從事前、事中、事后等的全流程,開展突發事件信息、情報信息的運算處理。
其中Web service 為Web 應用程序的可編程組件,通過使用XML 可擴展標記語言,對Web service組件進行開發、軟件功能配置,可使后臺管理者無需第三方軟件,即可實現突發事件及情報的數據集成、資源交換。而Agent 技術、中間件技術,也常用于分布式數據處理系統的開發中,負責依托5G 通信網絡的D2D、M2M 技術,形成前端計算機硬件、后端數據庫設施之間的連接。突發事件數據的并行計算,則是運用計算機硬件、網絡虛擬機,進行海量化數據資源、數據處理任務的并行計算,可最大程度上提升突發事件數據處理、業務服務的效率。
在不同區域空間的突發事件信息采集、應急響應管理執行過程中,主要依托5G/GPRS 通信技術、TCP/IP 協議,以及網絡計算機、后臺服務器、數據庫、DKhadoop 應用程序管理平臺、spark 分布式計算框架等的軟硬件,搭建起突發事件的應急管理情報系統,包括IAAS 基礎軟硬件層、PAAS 平臺資源層、SAAS云任務處理層等的多層架構,具體組成架構如下頁圖1 所示[4]。
從下頁圖1 的突發事件應急管理情報系統組成架構可以得出:IAAS 基礎軟硬件層為整個系統的基礎設施底層,包含大數據云平臺、數據處理組件、情報感知組件和應急響應管理組件等的模塊。在網絡計算機、后臺服務器、數據庫等硬件的基礎上,運行Web service 可編程組件、Agent 組件、中間件等的組件,虛擬化出網絡資源池、CPU 處理計算池、數據存儲資源池,來為突發事件信息、情報信息的挖掘與處理提供支持。
而后PAAS 平臺資源層,主要DKhadoop 應用程序框架、Spark 分布式計算框架、MySQL 數據庫等的軟件服務工具,構建起突發事件的業務系統、情報系統、應急管理系統等組成模塊,并依托5G/GPRS 通信技術、TCP/IP 協議,與最外部的SAAS 云任務處理層形成連接。
其中DKhadoop 應用程序架構、Spark 分布式計算框架,共同構成網絡或現實突發事件的監控體系,負責計算機主機監控、組件運行監控、突發事件的異常行為監控,并依據突發事件信息、情報信息處理后的結果,發出指定事件的報警預警,具體業務執行流程如圖2 所示[5]。
最后,SAAS 云任務處理層級,為突發事件應急管理情報系統的最外層,依托于D2D、M2M、TCP/IP 協議、通用網關接口等的通信技術,也形成與PAAS 平臺資源層之間的對接,進行突發情報獲取、資源調度、數據信息處理分析、應急響應與管理的任務執行,并將突發事件信息、情報信息處理,以及應急預警響應的結果,在用戶端的視圖顯示頁面呈現。
大數據挖掘技術、云計算技術應用的環境下,搭建基于DKhadoop 應用程序、MySQL 內核、Spark 分布式計算框架的應急管理情報系統,可針對海量的突發事件信息、情報信息,調用后臺云服務器的虛擬主機、API 接口,運用DK.的統計分析算法、機器學習算法,進行相關數據信息索引、排序、檢索的分布式管理,具體的業務執行流程如圖2 所示。
面對突發事件管理系統中的軟硬件運行狀況,利用虛擬化技術對網絡計算機、服務器主機、存儲設備進行虛擬化操作,作出CPU 微處理器、服務器、I/O 接口、操作系統等的虛擬化,可完成現有物理硬件資源合理配置,以及實時監控計算機與主機硬件、虛擬化硬件的正常工作情況.
目前突發事件應急管理情報系統中,共運行有1臺服務器主機、2 臺網絡計算機,且均屬于正常運行狀態。其中服務器主機的物理內存、交換內存消耗分別為3 668 Gbyte、33 Gbyte,平均負載在30%左右、特定時間節點的高負載可達60%以上,表明物理內存占用較高,但主機整體的磁盤使用、內存占用仍舊合理,可保證集群主機的監控效率、資源利用效率。
多種Web service 可編程組件、Agent 組件、中間件等的監控,主要通過不同角色實例、業務服務的級別健康檢查、問題診斷,發現某個組件運行過程中的健康狀態情況,并以審計日志的方式顯示診斷問題的結果。系統管理員在查看組件的健康檢查狀態后,會對配置更改的審計日志作出處理建議。
DKhadoop 應用程序提供了不同突發事件的列表,并對異常突發事件的點度中心度、特征向量中心度等的數值,進行界定與聚類計算,得出在海量突發事件數據搜集、整理完畢后,不同突發事件信息、情報信息處理的歷史數據結果,并通過配置DKM 的突發事件應急管理系統響應,可以對相應的突發事件信息、情報信息產生警報預警。如某一區域在1 年內突發事件異常行為的監控結果如下頁表1 所示。
從下頁表1 的異常行為監控結果可以得出:某一區域突發事件的點度中心度、特征向量中心度較高,管理人員在應急預案、應急指揮方面的反應較為及時,但應急救援、應急管理仍舊存在著一定的滯后問題,需要采取相應措施予以完善。

表1 某一區域突發事件異常行為的監控結果
不同情報突發事件的應急預警、響應與控制,通常存在事前預警、事中響應、事后管理控制等的執行流程。面對重大突發事件的應急管理,通常需要運用無線傳感技術、大數據挖掘技術、分布式與并行計算技術,通過虛擬化硬件配置、分布式資源調配,開展復雜多樣化突發事件信息、情報信息的搜集,以及情報有價值信息挖掘、數據并行計算,然后對突發事件的異常行為監控、警報預警作出及時處理,以保證突發事件數據處理、業務服務的質量。