■ 文 /胡傳平 梅 林 齊 力 徐 崢 戴 杰
胡傳平,河南鐵道警察學院副院長,研究員,博士。
梅林,公安部第三研究所物聯網中心主任,研究員,博士。
齊力,公安部第三研究所物聯網中心副主任,副研究員,博士。
徐崢,公安部第三研究所物聯網中心助理研究員,博士。
戴杰,公安部第三研究所物聯網中心助理研究員,博士。
公共安全領域進入大數據時代。
安全是公眾的基本需求,因此,在智慧城市的建設過程中,應當充分利用大數據、云計算、物聯網等技術使城市的安全管理做到更智慧、更高效、更安全。黨和國家領導人對大數據,尤其是大數據在公共安全領域的應用高度重視。2017年2月17日,中共中央總書記、國家主席、中央軍委主席、中央國家安全委員會主席習近平在北京主持召開國家安全工作座談會并發表重要講話。習近平強調,要筑牢網絡安全防線,提高網絡安全保障水平,強化關鍵信息基礎設施防護,加大核心技術研發力度和市場化引導,加強網絡安全預警監測,確保大數據安全,實現全天候全方位感知和有效防護。
公共安全大數據是指圍繞社會公共安全需求的,國家政策法規允許的,用于支持公共安全保衛的所有數據。按照數據采集方式來區分,公共安全大數據的主要數據來源有3類。第一類是對象被動產生的數據。這類數據主要是通過各種強制的法規或者手段,采集公共安全事件涉及的對象產生的數據,例如在賓館住宿時需要登記身份證信息、乘坐飛機或高鐵需要進行安檢等。這類數據是傳統意義上的公共安全數據。第二類是對象主動產生的數據。這類數據主要是公共安全事件涉及的對象在案件過程中,為了達到犯案目的所主動產生的,例如同伙之間的通聯數據、事件對象在案發現場的視頻監控數據等。這類數據的價值通常最高。第三類是對象自動產生的。這類數據是在對象不知情的情況下,從對象身上自動獲取的,例如人的定位信息、車輛的定位信息等。這類數據的規模最大,種類也最多,但有價值的信息最少。

大數據都具有4V特征:數據容量大(volume),數據類型繁多(variety),商業價值高(value),處理速度快(velocity)。公共安全大數據除具有一般大數據的4V特征之外,還包含4個特征,簡稱公共安全大數據的4P特征。一是政策性(policy),公共安全大數據的采集、處理、分析等過程,高度依賴國家相應的政策法規,在政策法規允許范圍內的數據,才可以被采集。二是私密性(privacy),與一般數據不同,公共安全大數據很大一部分是與對象相關的隱私數據,例如地理位置信息、通聯記錄等。因此,公共安全大數據具有隱私性。三是精準性(precision),公共安全大數據的挖掘分析結果需要極高的精準性,公共安全事關人民群眾的最高利益。因此,公共安全大數據必須做到精準處理。四是時效性(promptness),公共安全事件處理對時效性要求很高,處理方式主要為事前精準預防預警、事中快速響應、事后準確溯源。公共安全大數據的分析、挖掘要求極高的時效性。
大數據本身是一把“雙刃劍”,對于公共安全行業來說,它既帶來了前所未有的機遇,也相伴而生許多挑戰。
公共安全領域面臨的一大挑戰是公共安全領域數據處理成本與收益之間的矛盾。大數據的一個重要特性是海量性,數據規模越大,存儲成本越高。由于大數據強調在全量數據中進行挖掘分析而非傳統的抽樣調查,因此更增加了處理成本。如何快速過濾無價值的數據,對公共安全數據進行準確處理是一個重要的挑戰。公共安全領域面臨的另一個挑戰是公共安全數據互聯互通需求與管理體制之間的矛盾。大數據的重要特性是建立數據之間的關聯,通過關聯挖掘提取數據的價值。但是,各類安全數據之間統一標準的缺乏,現有組織、部門、制度間的分割以及信息管理理念的滯后,往往導致“數據孤島”現象的出現。第三大挑戰是公共安全數據處理技術的快速發展與缺乏相應的標準之間的矛盾。大數據技術發展迅速,但缺乏相應的標準對其進行規范。
要應對公共安全大數據的挑戰,公共安全大數據領域亟待解決以下幾個關鍵問題。
首先,公共安全大數據如何由存不起轉變為存得起。大數據的重要特征是對全量數據進行分析,“全量數據”意味著要對大量的數據進行存儲。公共安全領域迫切需要解決數據存儲安全與空間成本的問題。數據存儲多久,如何存儲,采用分布式還是集中式,都是亟待解決的問題。
其次,公共安全大數據如何由聯不通轉變為互聯互通。大數據在公共安全領域的應用是對數據進行關聯分析,然后從中獲取數據的價值。由于體制、數據類型、數據模態等多種問題,公共安全相關的數據依然無法做到有效地互聯互通。如何建立數據之間的聯通機制,如何對數據進行有效的關聯融合,也是亟待考慮的問題。
再次,公共安全大數據如何由找不準轉變為找得到、看得準、挖得深。目前,國家仍然缺乏非常有效的手段對公共安全相關數據進行處理。例如,針對視頻信息的分析,現階段的技術水平依然無法做到精準的對象識別,因此,仍需要有效的數據分析手段,把原始的非結構化的數據轉變為結構化的可理解、可分析的數據。
公安數據中心主要由“三朵云”組成,分別為管理云、應用云和視頻云,這三朵云通過統一運營維護來獲得安全保障。應用云的數據由兩大部分組成:一部分來自從管理云、視頻云及公安業務系統抽取的業務數據;另一部分來自業務系統內部數據。
大數據云平臺通過多租戶、多項目空間、項目保護空間等數據隔離機制,可以把來自不同警種的數據隔離和保護起來。大數據云平臺提供安全可靠的數據安全策略和訪問權限體系,不僅能夠控制數據的訪問權限、各警種的數據訪問權限,還能夠對數據訪問進行多粒度的權限訪問。
在公安大數據平臺基礎之上,公安部第三研究所規劃建設了公安業務數據開放加速引擎,該引擎可用來提供上層公安業務系統對大數據平臺的授權訪問權限。在數據加速引擎的支撐下,各類公安業務都可以基于大數據平臺進行數據訪問、數據分析、數據挖掘、數據創新。數據加速引擎還能支撐各個公安業務開發商的大數據業務系統,形成公安業務的應用超市。基于大數據強大的分布式計算能力,該引擎能對公安多警種復雜數據進行大規模數據加工、處理和計算,建設公安各類數據庫,對人際關系網絡進行深度分析,利用數據挖掘和機器學習技術,引領公安領域大數據創新。