□ 文/李正東
實時數據處理技術在情報實戰中的作用
□文/李正東
隨著信息技術的進步,現代警務體系的建設取得了長足的發展,以合成作戰指揮平臺為代表的新一代警務應用系統在實戰得到檢驗。本文分析了情報大數據平臺的發展過程,特別是實時數據采集與識別對于公安實戰的作用。并指出公安應用領域實時數據處理的核心是要解決可計算,可視化和動態調整三個方面的能力。簡要討論了實時數據的應用場景和案例,對當下實時數據的采集及應用中的局限性進行研究,結合應用現狀給出相關的建議。

1829年,現代警務體系的雛形在英國出現,此后隨著現代化進程而不斷演化。未來,現代警務體系將向多元化的價值理念、法治化的制度規則、網絡化的組織結構與合成化的運行機制方向發展[1]。隨著信息技術的進步,我國的公安警務體系的建設取得了長足的發展,特別是近年來,以合成作戰指揮平臺為核心的現代警務指揮體系建設,整合了公安三大中心(接警、情報、指揮),五大系統(一體化指揮調度、情報研判、勤務管理、民生警務、滿意度測評),提高了公安一線的指揮和作戰效能,得到了實戰檢驗。
與以往不同的是,現代警務指揮體系的基礎是警務大數據,統一通訊服務和地理空間定位服務,它們為合成作戰平臺實現扁平化、可視化、點對點指揮調度的提供了基礎支撐。在各級指揮部門(指揮長)進行統一調度時,現代警務指揮平臺可以將情報信息與業務指令關聯起來,統一發送到接受者的終端上;與此同時,現場處置的警員也可以將實時數據采集并回傳給指揮中心,為后一步的調度指令提供參考,這個過程形成了一個動態完整的信息鏈。
在合成作戰指揮的“情報-指揮-勤務-行動”四大關鍵步驟中,情報分析是第一個環節,也是后續指揮作戰的重要參考因素,這也是為什么各級公安部門都非常重視情報實戰平臺建設的原因。警務大數據是情報實戰平臺的信息來源入口,也是情報平臺建設的先決條件,它是由基礎資源池數據和實時數據分析兩個部分構成。其中:基礎資源池數據包括基礎信息(人口、法人、重大事件、房屋、民生)、出入境數據、旅店數據、交通路網和消防數據、鐵路、民航、賓館、網吧、工商、稅務、房產、水電油氣數據等;實時數據則包括動態信息(警情、輿情、交通、反恐、維穩、治安視頻、實時通訊)等。前者在警綜平臺的建設過程中,已經得到了較好的解決;而實時數據的處理與分析,由于實時信息的具有非數值和多維的特性,使得其采集與分析都不同與傳統的數據處理方式,并且它還是飛速增長的海量信息,這在當下的信息處理技術上,還沒有得到完善解決。
實時數據分析要解決的是海量信息的處理問題,由于數據源是不間斷的,從實戰的要求來講,其響應時間也必須是實時的,一般是要求處理響應是秒級。以中國南方的某一個大型城市的交通卡口大數據項目為例,在全市64個交通卡口,以及130個主要橋梁隧道出入口采集的數據量,高峰時可以達到每個小時200萬條記錄,這對于傳輸和處理都造成了巨大的壓力。所以,實時數據的處理需要進行分流,對于數據量大而無法或沒有必要進行后臺運算的,需要分節點來處理,從而達到響應速度的提高。
在公安應用中,實時數據處理的核心是要解決可計算,可視化和動態調整三個方面的能力。可計算是指對于流媒體格式數據的處理能力,比如視頻和語音數據的檢索,實時的數據計算和分析可以動態實時地刷被監控對象的行為,展示其變化情況。以平安城市監控為例,分布在城市的監控點有上萬路,每時都在上傳海量的視頻信息。雖然現在有技術可以針對視頻進行特征量的提取和多維分析,但這是個耗時比較長的計算,若是對于每一路視頻都進行分析,那么這個計算量是非常大的,目前的技術處理能力是不可能完成的。
對于流式實時數據的處理,不能作為一般性工程問題來解決,試圖通過無限增加計算節點來提高計算能力的方法不可取。在現實中,通常可以采取提高主干道和出入口的視頻分析能力,排除非重要路口的視頻分析量,這好比將人的主動脈監管起來,從而達到將城市的關鍵數據加以收集分析。此外,也可以通過調節識別精度來降低計算量,對于實時數據篩選來講,不是每一次的分析結果都必須是唯一性的,更有效的方式是先解決模糊數據的排查問題,定位問題最大的可能區域或時間,再進一步精確分析。實時情報分析的精準度是可以調節的,因為大量數據的查詢需要工作時間長,特別是面對非結構化數據的處理,其特征量的分析提取本身就是個運算量極大的工作。通過多次重新定位和分析,來提高情報分析結果的正確率。
在警務大數據分析中,另一項重要就是內容態勢分析,它是基于空間與時間相結合的情報分析展示,信息的可視化就是為了讓情報分析的結果可以被更好的辨識,從而提高決策的效率。1987年美國國家科學基金會舉辦的可視化會議,首次正式提出了可視化這一術語,可視化作為一個研究領域開始發展起來。1989年,Robertsong, Cardsk和Mackinlayjd首次提出了信息可視化這個概念[2]。在實時情報分析領域的研究中,對于海量信息的檢索與海量信息的展示,都是非常重要的。如果動態信息不能有效的展示出來,那將會給指揮者造成困擾,有時甚至會得出錯誤的判斷,從而影響決策。
從事研究的情報實戰平臺產品中,能對實時數據的抽取的分析結果,通過三種方式進行展示。一種是統計分析圖形化展示,即將各個專題數據進行多緯度的統計分析,并以圖形或表格形式進行展示,以便于得高識別度;其次是空間的關聯性分析,也就是通常說的密度圖展示,將經過分析的數據在地圖空間上進行多維度分析,可以看到全局和某一個區域熱點分布情況,從而讓決策者能快速定位問題發生的熱點區域;第三種是時間軸的河流模型分析,屬于專題可視化分析方法,其效果是使決策者不必逐個分析過程,直接通過拖動時間軸就可以了解某個事件在某個時間段或整個時間區間內的發展趨勢,以及多個事件在時間維度上的對比情況,并表現出地點、實體之間關聯關系的耦合程度。
最后一項,就是實時數據分析的動態調整能力,這也是實時中最難建設的一個部分。公安部門已經掌握了大量的社會化信息,針對這些信息的查詢及綜合統計分析方面,也已經有相當的成熟度。可以說,對于這些信息的有效分析與處理給一線的治安工作提供了極大的幫助,但是在實際工作中,還是有很多無法預測的問題出現,這些問題的產生就是因為情報分析工作的滯后性。近年來,在反恐領域的突發事件增加的形式之下,提高情報分析工作的預測能力和干預能力,其最終目標就是打擊和預防事件的發生。

在筆者與以色列國內安全機構交流學習過程中,了解到他們對于實時情報分析中非常重視,盡管在他們國內的情報分析平臺中,收集了大量結構化的數據,可以提供詳細的篩查功能。然而,在實際工作中,對于非結構化的實時性的數據采集與分析,其重要性甚至要高于結構化的數據。這方面的他們采用工具也較完善,比如通過實時監測被監控人的通話或短信,可以直接干預通話內容,從而達到將可能發生的事件引到被控制區,進行干預和消滅。實時情報的動態調整能力并不是一個特定的應用,它是需要在各種應用系統之間數據接入和轉換上進行干預,從而防止因為信息的不對稱,導致指令或行動的沖突。據以色列的安全人員介紹,他們每天防止的恐怖事件約30起。
綜上所述,在公安行業應用領域,實時大數據分析的方法及工具已經得到部分的應用,這些應用相較以前的結構化分析來講,算是進了一大步。但是面對現實工作,還是有大量非結構化信息不能得到及時的處理與分析,從而限制了情報工作的成果在實戰中的發揮。實時數據分析在情報工作的效果,不僅僅是為了情報分析的結果正確性,而是需要考慮多個方面的平衡,包括完整性分析,合理性分析,時效性分析和精確度分析。實時數據分析技術作為大數據信息化的最新研究方向,將會成為公安及其它行業應用中新的創新力,從而促進情報平臺的升級和工作方式的轉變,進一步推動現代警務平臺的優化升級。
作者單位:金鵬電子信息機器有限公司