杜藝卓 蔣靜
摘 要:公安邊防信息化建設存在方法陳舊效率低下,系統零散自動化程度不足,前沿技術應用不夠等現象。利用隱馬爾可夫模型可以實現檢測網絡入侵,監控信息化系統運行和開展視頻對象異常交互檢測等目標。在互聯網和人工智能技術不斷發展的今天,要實現公安邊防信息化水平的不斷提升,不能僅僅依靠不斷充實的硬件設備,更需要能與硬件相契合的軟件,這樣才能使信息化系統最大程度地發揮作用。
關鍵詞:公安邊防信息化 隱馬爾可夫模型 機器學習 人工智能
公安邊防信息化建設是國防信息化建設的重要組成部分,是保證國家對外開放和“一帶一路”倡議推進和實現強軍目標、維護邊境地區安全穩定的重要保證。在互聯網和人工智能技術不斷發展的今天,要實現公安邊防信息化水平的不斷提升,不能僅僅依靠不斷充實的硬件設備,更需要能與硬件相契合的軟件應用,這樣才能使信息化系統最大程度地發揮作用。
一、公安邊防工作信息化概念及現狀
公安邊防工作信息化,即依托互聯網、大數據和計算機技術,將傳統的公安邊防業務工作進行重新設計和規劃,使得這些工作能夠變成電子數據在電子設備上操作和分發,取代傳統的手寫和郵寄等低效率信息傳播方式,提高信息傳遞速度,并對數據進行整合分析,利用大數據分析等技術,完成過去靠人力無法勝任的工作;在某種程度上能夠實現“無紙化”辦公,節省資源,提高工作效率。
在互聯網技術飛速發展的今天,信息化技術已經成為公安邊防工作開展的一項基礎技術,支撐了大量的邊防業務工作開展。信息化建設已經成為了公安邊防工作中重要和不可或缺的一部分。得益于互聯網和大數據技術的發展,使得公安邊防工作依托信息化得以更進一步地開展,邊防業務工作的效率得到了極大提升。
目前在公安邊防領域,信息化技術的應用非常廣泛,已經深入到基層一線工作中,如辦公一體化平臺、各類數據分析查詢系統等。以內蒙古總隊為例,公安邊防部門已經實現大部分業務通過公安專網進行開展,使得跨地域跨部門合作的難度大幅下降;基層部隊全部配備超短波通信電臺,大量監控攝像頭,形成對轄區的全方位監控;部署各類信息平臺供記錄、查詢以及文書生成的需要,如戶籍平臺等。
但是,在人工智能迅猛發展的今天,公安邊防信息化建設在軟件方面仍然停留在“人工、手動”的程度,在提高了工作效率的同時也限制了進一步提升工作效率的潛力。
軟件對于搞好公安邊防信息化建設同樣重要,尤其是對人工智能,尤其是機器學習技術的應用,是進一步提升工作效率的有效途徑。隱馬爾可夫模型(HMM)作為存在時間比較長的模型,在計算和應用方面相比當下非常流行的人工神經網絡都有獨到的優勢。在本文中,作者將以HMM為手段,對公安邊防業務工作中的幾個內容的信息化進行探討,展現人工智能技術在公安邊防領域的應用前景。
二、當前公安信息化工作存在的問題
盡管如今公安信息化工作依托各類信息化技術得到了很大的提升,但是不可否認,公安信息化建設存在發展不平衡問題——在大力推進硬件采購升級的同時,對配套的軟件技術應用不足。在人工智能迅猛發展的今天,公安邊防信息化建設在軟件方面仍然停留在“人工、手動”的程度,在提高了工作效率的同時也限制了進一步提升工作效率的潛力。
(一)方法陳舊、效率低下
在當前的公安信息化工作中,普遍存在工作方式方法陳舊、效率低下的問題:雖然信息化設備在不斷更新換代升級,但是在內部業務指導中參考的依舊是“老辦法”,沒有充分利用現代信息化設備的優勢和特點,導致雖然信息化硬件條件與時俱進,但是沒有相應帶來信息化工作能力的整體提升。
(二)系統零散,整合自動化程度不足
以目前的情況來看,越來越多的信息化數據系統在公安日常工作中扮演重要角色。但是在如今“大數據”時代來臨的背景下,社會面數據的重要程度達到了史無前例的高度,然而受公安隊伍整體水平影響,部分工作人員對大數據重要性認識程度不足,對數據形式和內容不夠敏感等原因,公安機關所掌握的數據普遍存在內容殘缺、質量參差不齊、數據細致化程度不高、特定行業數據不足等問題。同時,由于公安工作的特殊性質以及當前社會日益嚴峻的維穩、治安、反恐形勢等問題,迫切需要更多更全更細致的社會數據支持。而當前公安信息化設施及系統對數據的處理能力依舊處于“割裂”狀態,多種數據系統“各自為政”,信息流轉不暢通,系統之間建立聯系困難,數據不能得到有效整合和使用,使得跨系統合作變得異常困難。
(三)高新技術缺位,對前沿技術應用不夠
信息化技術的應用能力跟不上技術進步的節奏。隨著建設系統越來越多,公安業務人員對系統的操作、使用間銜接又開始跟不上系統建設的步伐,有些單位對信息化技能的考核不能立足實際。在系統建設和運行維護上,能夠在掌握信息技術的同時也熟練掌握公安業務的復合型人才缺乏,核心技術掌握在公安系統的極少,信息技術人才有流失的趨勢。公安大數據應用不能緊跟形勢,理念落后、模型缺乏、研判能力不足。各級公安機關領導和民警對公安信息化的認識僅限于簡單增刪改查數據的層面,缺乏對業務信息化的更深層次的理解,沒有對信息化模型與應用進行進一步的探索。公安業務部門能夠獲取大量數據、懂公安業務,但是缺乏對數據模型算法的理論知識,缺乏對數據內在規律探索的方法和經驗[1]。
筆者將以隱馬爾可夫模型為例,結合公安邊防相關業務工作對模型算法進行應用,探討公安業務數據的更深層次應用方法及人工智能模型對業務工作的影響和幫助。
三、隱馬爾可夫模型
(一)概念
HMM(Hidden Markov Model)是一種用于預測隱含狀態,即不可觀測的馬爾可夫鏈的統計模型。其難點在于通過可觀測狀態推導出隱含狀態或者隱含參數。下圖所表示的便是隱馬爾可夫模型的簡易示意圖,其中x為馬爾可夫鏈、a為各個狀態之間的轉移概率、b為隱含狀態表現為顯狀態的發射概率、y則是可觀測到的狀態。
[KH*2][PS05.EPS;Z3;Y3,BP][TS(][HT5”H][STHZ] [JZ(]圖1 隱馬爾可夫模型結構示意[JZ)][TS)][KH-1][KH*2]
隱馬爾可夫模型所研究的問題雖然穿插于圖像識別、人像識別、聲音識別,機器學習等,但是總結起來可以概括為如下幾類。
1.馬爾可夫假設(隱含狀態可構成一階馬爾可夫鏈)
2.時間無關性假設
3.輸出獨立性假設
對于HMM來說,每個隱含狀態H和可觀測狀態O之間是有一定概率關系的,那么由于是概率關系,所以在進行計算時我們可以明確在進行計算時,當隱含狀態一定時,各個隱狀態H向可觀測狀態O轉移的概率相加一定是等于1的。
它作為馬爾可夫鏈的一種,其狀態不能被直接觀察到,而是通過對可以被觀察到的狀態進行測量,每個觀測狀態都是由隱含狀態通過某些概率密度分布表現出來,每一個觀測向量是由一個具有響應概率密度分布的狀態序列產生[2]。它是一種用參數表示的方式來描述隨機過程統計特性的概率模型,是一個雙重隨機過程,由兩個部分組成:馬爾可夫鏈和一般隨機過程。其中馬爾可夫鏈用來描述狀態的轉移,用轉移概率描述。一般隨機過程用來描述狀態與觀察序列間的關系,用觀察值概率描述[3]。對于HMM模型,其狀態轉換的過程是不可觀察、隱藏的,因此被稱為“隱”馬爾可夫模型。
假設現在已經有一個特定的隱馬爾科夫模型λ和一個可觀察狀態序列集。我們也許想知道在所有可能的隱藏狀態序列下,給定的可觀察狀態序列的概率。
假設當給定如下隱藏狀態序列:
Q=q1q2…qT
那么在HMM和這個已知序列H的條件下,序列O的概率為:
P O|Q,λ =bq1 O1 bq2 O2 …bqT OT
而序列H在HMM條件下的概率為:
P(Q|λ)=πq1αq2q2αq2q3…αqT-1qT
因此,序列H和序列O的聯合概率為:
P(O,Q|λ)=P(O|Q,λ)P(Q,λ)
于是在所有的序列H上,出現序列O的概率為:
P(O|λ)=∑ allQ P(O|Q,λ)P(Q,λ)
(二)適用領域
利用隱馬爾可夫模型,一般可以解決以下幾類經典的問題。
1.解碼問題。給定可觀察序列O和模型λ,計算在模型確定的條件下輸出可觀測序列最可能的隱含序列Q。該問題用于尋找符合觀測結果的情況下最可能的真實隱含狀態情況,如根據傳感器數據推斷最可能的天氣狀況[4]。
2.估值問題。給定可觀察序列O和模型λ,計算在模型確定的條件下輸出可觀測序列的概率P(O|λ)。該問題可以看作是評價一個模型與觀測結果的匹配程度。
3.學習問題。給定可觀察序列O,計算模型λ的各項參數,使得出現給定可觀察序列的概率,即P(O|λ)最大。該問題用于尋找對已經觀測到的結果的最佳描述,通常用于對現實數據進行擬合,以判斷模型參數是否能夠盡可能準確反映觀測結果。
文中筆者介紹的若干中應用將采用估值問題和學習問題算法相結合的方式,首先對模型參數進行尋找和調整,再利用估值算法對真正的業務目標進行預測并輸出結果。
四、模型在信息化工作中的應用
由于隱馬爾可夫模型在數學上形式簡單,計算量相比于當今比較流行的人工神經網絡等模型有明顯優勢,節省硬件計算能力,使得同等硬件條件下,隱馬爾可夫模型取得預期效果所需的成本較低,符合公安信息化工作中對節約資源的要求。本文將從公安信息化工作中選取四個方面進行分析,提出該模型在此類問題中的應用合理性及可能性。
(一)檢測網絡入侵
公安內部網絡與互聯網高度隔離,但是由于人為失誤等各種各樣的問題,公安網絡頻繁遭到網絡入侵,如2017年的“永恒之藍”事件,給公安業務工作造成了巨大損失。網絡安全防范是公安信息化工作中的核心任務之一,是保障公安業務各項工作順利開展的重要保證,維護網絡安全,防范網絡入侵,是當今公安系統乃至整個互聯網行業重點攻堅的課題。公安系統內部現有的網絡安全防范技術目前仍停留在購買外部現成方案的水平,主要依托硬件防火墻等措施,軟件建設不足,缺乏及時更新能力,對新型入侵缺乏防護,不能及時防御。
利用HMM進行網絡入侵檢測首先是由Juan M. Estevez Tapiador在他的一篇2011年發表的文章Das K. Protocol Anomaly Detection for Network-based intrusion Detection中提出的。他認為在網絡入侵領域雖然入侵方式多變,類型難以捕捉,但是TCP數據包在正常狀態下有唯一確定的值來加以標記識別,因此便可以將網絡狀態分為正常與不正常兩類,根據正常數據訓練得到協議模型,而后通過訓練模型進行檢測,凡是偏離該模型的序列都可以認為是異常狀態,即存在入侵行為。
根據HMM的基本原理,在知道觀測數據的情況下運用BW算法建立模型得到必要的λ=(N,M,A,B),然后運用Viterbi算法,通過已知的觀測狀態和算出來的λ=(N,M,A,B)進行推測,得出最有可能形成現有觀測狀態的隱含狀態,即是否為攻擊類型。
(二)監控信息化系統運行狀況
在公安信息化工作中,對信息化設備和系統的運行維護是所有工作中的重中之重,設備和系統的運行健康程度關系到系統是否正常運行,關系到相關業務能否正常開展?,F有公安系統運維技術主要依靠運維人員的經驗,在面對問題時難以及時發現問題真正所在,錯過最佳解決時間,對正常業務工作造成影響。本文中筆者提出一種利用隱馬爾可夫模型對系統運行進行自動化監測并及時發現判明問題的方案,實現運維工作部分自動化,減輕人員壓力,提高運維效率。
利用隱馬爾可夫模型對系統運行狀況進行監控同屬于異常檢測范疇。在計算機系統運行過程中,計算機程序運行時所處[HJ]的狀態千變萬化,難以采樣和捕捉。但是從操作系統層面上來看,操作系統在一段時間內所運行的程序數量是有限的,而應用程序在調用系統功能的時候所進行的操作(即系統調用)是相似的。通過對一系列或某個特定的應用進程的系統調用進行采樣處理,通過數據對HMM進行訓練,并對數據進行預測,就可以得知該應用程序是否處在非正常狀態下。
1.提取數據,將進程的系統調用記錄采樣,并由于進程狀態已知而建立標簽,該數據將作為模型的訓練集。
2.將系統調用序列視為可觀測序列O,將進程狀態視為隱含序列I,先對HMM模型進行預估,并利用梯度遞減算法和訓練數據對模型進行訓練學習。
3.在模型誤差小于一定閾值之后,將其對測試數據進行測試和實際使用。
對系統行為進行建模,可觀測序列O(O1O2O3…)為某個進程中的系統調用采樣,隱含狀態序列為被采樣應用程序所處的運行狀態,由此對模型參數λ=(A,B,π)進行估值,在經過反復訓練后得到準確率相對較高的模型,并用此模型對后續狀態進行預測。
(三)視頻對象異常交互檢測
在公安各項業務工作中,視頻監控都扮演著重要角色,因為視頻監控圖像能夠為案件偵破等工作提供大量信息,幫助人員進行決策。但經過多年的發展,視頻監控的作用僅僅停留在由工作人員逐條觀看的層次,幾乎沒有更多的應用方式被發掘。由于人本身的先天不足,在面對大量的監控錄像需要查看的時候,工作人員的查看速度成為了效率的瓶頸,由于警力有限,在面對大量的監控資料時,監控查看的效率無法有效得到提升。因此要想提高監控錄像的利用效率,就要從效率的關鍵處下手,將部分原本只能由人來做的工作交給計算機來做,從而提高效率,例如這里討論的利用計算機算法自動識別視頻中的異常行為。
檢測人體的異常行為需要能夠理解人體單個部位的微動作,因此我們需要將人體分割成有意義的各個部位。成功將人體分割成有意義的各個部位之后,我們就可以將視頻中人體的異常動作分解為不同部位、不同時間點姿態序列[5]。
根據隱馬爾可夫模型定義,姿態序列是可知的、可觀測的,因此將姿態序列作為可觀測序列,而姿態序列背后的人體行為是我們要檢測的目標,是未知的,因此作為隱藏狀態序列。通過設定姿態序列的長度,對模型進行訓練。模型的隱含狀態數即行為種類數,是根據預先設定的目標得出的,在確定訓練樣本之前,首先要確定,該模型預期能夠識別多少種行為,如推搡、擊打、擁抱等。
確定訓練樣本之后,我們首先使用最大似然估計求出模型λ=(A,B,π)的參數,再利用模型計算每種行為的概率,即根據可觀測序列O和模型λ,計算可觀測序列的最大概率P(O|λ)。每種人體行為都對應一個模型,整個系統最后的分類判別是通過對所有種類模型的概率P(O|λi)進行計算,最終選出概率最高的模型,所對應的行為種類即為最終預測結果。
以上筆者提供了若干種將HMM模型應用到公安信息化工作中的方案,但將人工智能技術運用于公安業務工作的潛力和價值遠不止于此。人工智能技術的核心目標在于模仿人類可以做的,并達到人類做不到的高度,從而在這些領域中為人類工作提供前所未有的效率提升。不論是本文中提到的隱馬爾可夫模型,還是當前最熱門的人工神經網絡模型,都能夠解決語音圖像識別、趨勢預測、推薦系統等領域的大量實際問題,在許多大型互聯網公司都有著大量的生產實踐經驗,在技術層面已經足夠成熟,現在缺少的就是和實際工作的有效結合。筆者在此提出了隱馬爾可夫模型在公安信息化工作中的幾種可行方案,以期為未來的公安系統信息化工作發展方向提供參考和借鑒,幫助信息化工作在未來能夠充分利用人工智能技術帶來的便利,使得信息化工作能夠向著更高端、更可靠、更有效的方向不斷發展。
參考文獻:
[1]劉向榮,農忠海,侯文雷.公安信息化發展及現狀概述[J].數字通信世界,2018(07):31-32.
[2]羅宇,杜利民.基于隱馬爾可夫模型局部最優狀態路徑的數據重建算法[J].電子與信息學報,2004(5):722-726.
[3]何彥斌,楊志義,馬薈,等.一種基于HMM的場景識別方法[J].計算機科學,2011(4):254-256.
[4]黃崗.馬爾可夫及隱馬爾可夫模型的應用[J].電子設計工程,2013,21(17):60-62.
[5]蘇野.視頻場景中人體異常交互行為檢測[D].南京郵電大學,2017.