宋祥斌
(江蘇警官學院,南京 210000)
隨著大數據、移動互聯、云計算等技術的蓬勃發展,公安信息網、視頻網、衛星通訊網實現連通,互聯網、公安專網形成的警務數據信息正迅猛增長。大力實施公安大數據戰略,需要把握時代發展大勢,著力打造數據警務、建設智慧公安,堅持實戰引領,充分運用大數據等新技術手段,積極構建以大數據智能應用為核心的智慧警務新模式,著力提高預測預警能力、精確打擊能力和動態管理能力,不斷提升公安工作智能化水平[1]。因此,警務部門要主動擁抱大數據、開發利用大數據、治理管控大數據,深入實施科技強警戰略,推動警務實戰轉型升級。
在大數據環境下,“萬物皆數”特征更加明顯,警務戰場的實時情報信息、警務指揮與控制命令、治安監控管理信息等,都以數據形式生成、傳輸、存儲和處理。公安大數據已經成為構建公安戰斗力的核心要素。在警務大數據中,案件構成要素以及人、事、物、空間等一系列的信息都可以全方位、多角度地與案件進行關聯。例如,犯罪分子在通信聯絡、瀏覽網頁、刷卡消費、游戲娛樂、交通出行、金融交易等等方面都會生成業務數據和行為數據并被記錄下來,而這些數據就有可能隱藏著犯罪行為的蛛絲馬跡,通過數據挖掘、關聯分析、智能處理等技術,就能為發現犯罪、揭示犯罪、證實犯罪提供線索或證據。
大數據正對犯罪預防、調查取證、案件研判、偵查決策等環節進行全方位滲透,以大數據為支撐的公安信息資源的廣泛搜集、深度分析和智能應用,將使警務形態發生質的變化,推動智慧公安的發展。在大數據戰略從頂層設計到底層實現的“落地”過程中,技術是載體,分析是手段,應用是目的,而治理是基礎[2]。大數據信息資源在警務實戰中起到基礎性、驅動性、戰略性的作用。警務大數據的有效治理,是為了解決警務實戰部門清楚“有哪些數據?怎么獲取數據?如何更好應用數據?”加快傳統警務偵查模式向從人到案、從物到案、從案到案的多元模式轉型,從而提高預防犯罪能力,降低破案成本,縮短打擊周期,對推進公安大數據戰略和提升警務實戰效能具有重要的理論意義和應用價值。
警務大數據涉及公安內部和外部社會不同來源的復雜數據,倘若缺乏科學的數據治理,那就很難正確整合和管理數據,很難開發滿足實戰需求的警務應用。目前警務大數據運用仍處于起步階段,大數據實戰應用的場景還不夠豐富,大數據廣泛服務于實戰的態勢還未形成,需要對警務大數據進行有效治理,促進公安系統大數據資產在警務實戰中的價值變現。目前,開展警務大數據治理時面臨的主要問題有以下方面。
隨著各類信息系統的建設和運用,數據分散在公安內外,數據量高速膨脹,導致了數據資源利用的復雜性和管理的高難度。主要表現在,數據多頭采集和標準不統一,使數據整合、數據轉換、數據清洗變得非常復雜和難以處理,難以建立全面、準確、完整地反映犯罪態勢的單一數據視圖,難以實現數據的邏輯整合[2]。用戶不知道大數據平臺中有哪些數據,也不知道這些數據和公安業務的關系是什么,雖然意識到了大數據的重要性,但不知道該到哪里尋找這些數據,不清楚平臺中有沒有能解決當前警務問題的關鍵數據。
由于公安內部的部門區隔和行政分化,不斷地制造著數據交互的斷層,公安外部其他社會部門的“體外數據”與公安的核心數據體系不能自然地融合。這種數據的異構化,影響數據獲取,導致數據資源接入混亂,增加數據資源管理成本和處理難度。數據不可控是從傳統數據平臺開始就一直存在的問題,在大數據時代表現得更為明顯。沒有統一的數據標準,數據就難以集成和統一,沒有質量控制,大數據就會因質量過低而難以被利用,難以建立有效管理大數據平臺的管理流程,制約警務大數據的管控和跨庫共享[3]。
大數據時代,公安系統是社會治理部門中的數據大戶,在警務實戰中積累了海量數據,但缺少對數據的知識管理,沒有建立起警務數據的知識圖譜,數據與知識之間難以快速轉換,缺乏對數據進行自助探索和挖掘的工具和手段,數據的深層價值難以體現[3]。由于缺乏規范的數據質量治理流程和審核機制,數據歸口不一,查詢的信息不完整,存在一定程度的“時差”,致使數據供給與警務實戰需求不匹配,甚至脫節。用戶即使知道自己業務所需要的是哪些數據,也不能便捷自助地拿到數據;相反,獲取數據需要很長的開發過程,導致情報研判分析的需求難以被快速滿足,而在大數據時代,警務實戰追求的是對案情的快速分析,漫長的需求響應時間難以滿足實戰需求。另外,相關警務大數據規范機制不完善,影響隱私保護和授權訪問,在數據使用的時效、范圍、次數、層級、程序等環節上缺乏規范,數據應用隱患多,成為大數據環境下一大執法隱患。
如何以大數據為中心精確設計和指揮警務,已經成為改革和創新公安管理的制高點。對警務大數據資源進行源頭治理,必須緊緊圍繞“把大數據管起來、用起來,保證數據與警務實戰的融合”的目標,理清大數據治理的關鍵要素,構建警務大數據的治理框架。需要調研實戰部門大數據技術平臺的搭建、組織的變革、政策的制定、流程的重組、數據的管理,摸清大數據在偵查破案中的實際應用情況,切實理清公安內部和外部社會數據資源的種類,為構建警務大數據治理的框架打下扎實的基礎。
警務大數據的建立依賴于自頂向下的數據規劃和自底向上的數據治理,數據治理面向元數據,警務元數據及警務數據的標準化、規范化是重要基礎。根據警務大數據資源的種類、來源、內容等,制定統一的元數據標準和主數據標準,有效管理數據中的結構化、半結構化和非結構化數據,從基礎上保障數據的完整性、規范性和一致性,提高各層級警務信息系統間信息的共享水平和數據資源的利用率。基于數據標準的治理,可以通過自動化手段,自動識別數據資源并標明數據方位和屬性,建立辦案民警能理解的數據服務目錄,實現自我治理,并能夠實現對公安業務變化的自適應性。
大數據應用之前必須評估大數據質量,加強審計、監督和評價,以保證分析結果的準確性,提高數據的訪問效率,保證大數據的鮮活度,滿足偵查破案的實時性要求。大數據質量管理關注數據在清洗后的整合、分析和價值利用,旨在消除警務大數據的不一致性,建立規范的數據應用標準,提高組織數據質量,實現數據廣泛共享。數據質量對大數據的深度應用至關重要,認為大數據基數超大,可以忽視數據質量的觀點是不全面的,只有質量合格的大數據才能夠作為公安系統的寶貴資產應用于犯罪預防、偵查破案、管理決策中,發揮數據資產的警務實戰價值。
對警務大數據的挖掘分析、開放共享增強了數據的應用價值,同時也增加了數據的透明度,尤其是將數據集中和共享使用時,一些敏感隱私的數據就有可能被泄露或非法使用,這給警務大數據的安全與隱私保護帶來更加嚴峻的挑戰。大數據環境下的數據安全與隱私管理要求建立有效的大數據安全規范和策略,以確保警務大數據在使用過程中具有適當的認證、授權、訪問和審計等控制措施,從而滿足大數據利益相關者的隱私與合規要求。
合理、可靠的大數據架構是保證大數據警務應用正常運行的技術支撐。在警務大數據治理中,需要描述警務大數據應用的關鍵要素、技術架構和技術路線,對音視頻、案件卷宗等非結構化數據的存儲與挖掘提供支持,開發元數據管理、主數據管理、知識圖譜、數據可視化等功能,建立統一的警務大數據治理與評價平臺[4]。
警務大數據治理是專注于將大數據作為公安核心資源進行應用和管理的一套管理機制,實現對數據資源采集、傳輸、存儲、利用、開放的規范管理,促進數據在風險可控原則下最大程度開放共享,促進技術流、業務流、數據流的融合,并推進公安內外數據資源的對接,實現跨層級、跨地域、跨系統、跨部門、跨警種的協同管理和服務。大數據治理將幫助公安各級實戰部門更好地采集、使用和管理數據,為大數據時代的智慧警務帶來廣闊的發展空間。