段開宇 徐漫琳


摘 要:BP神經網絡是重要的分類預測方法之一,該文一方面在考察與分析單一因素預測警情的基礎上,探討了一種由多個因素作為神經網絡的輸入層的預測模型,另一方面,通過合理部署警力、強化重點區域管控等相關防控措施,重新進行引導預測,為維護社會治安提供動態監控和科學決策。
關鍵詞:人工神經網絡 警情預測 決策支持
中圖分類號:TP311 文獻標識碼:A 文章編號:1672-3791(2015)06(c)-0230-02
對于公安來說,要保證社會治安穩定良好,就必須在接處警工作中降低轄區內警情,從而針對性的按照案件發生轄區對所有案件發生數量進行預測,根據預測結果分析出哪些轄區的警情會增加,從而可以適當增強這些轄區的警力配置。而警情的產生是一個復雜的非線性動態系統,利用傳統的時間序列預測技術很難揭示其內在的規律。該文在利用神經網絡技術的基礎上,探討了一種面向公安警情分析、預測和決策的的預測模型。
1 BP神經網絡的理論研究
1.1 BP神經網絡結構及處理單元模型
BP 神經網絡結構如圖1,由輸入層、隱含層、輸出層共三層網絡組建而成,為了不失一般性,選取BP神經網絡任意兩層介紹其處理單元的數學模型。BP神經網絡處理單元的結構,如圖1-1右上所示,其中L1層的n個處理單元與L2層的p個處理單元全連接,連接權向量;L1層的n個處理單元的輸出構成了L2層各個處理單元的輸入列變量,L2層各個處理單元的閾值為,因此,L2層各個處理單元接收的輸入加權和為[1]:
(1.1)
L2層各個處理單元的輸出由轉移函數決定。BP神經網絡通常采用Sigmoid函數作為轉移函數(在實際應用中,也可以采用雙曲正切函數作為轉移函數)。
BP神經網絡選取Sigmoid函數作為轉移函數是因為Sigmoid函數的輸出接近生物神經元的信號輸出形式,能夠模擬生物神經元的非線性特征。同時,Sigmoid函數具有的非線性特征也能夠增強神經網絡的非線性映射能力。
1.2 誤差反向傳播學習算法
BP神經網絡采用BP算法進行學習,其學習過程分為四個階段[2]:
(1)學習模式是由輸入層(不做處理)經過隱含層然后,向輸出層逐層傳播的“順傳播”過程;(2)網絡的輸出層得期望輸出與實際學習模式的輸出之差,即誤差信號,是由輸出層經隱含層向輸入層逐層修正連接權值的“誤差逆傳播”過程;(3)由“模式順傳播”過程和“誤差逆傳播”過程反復交替進行的網絡“記憶訓練”過程;(4)網絡趨向收斂,即網絡的全局誤差趨向極小值的“學習收斂”過程[2]。
前人已經對這方面內容有了深入的研究,這里就不在詳述。
2 基于BP神經網絡的警情預測模型分析
2.1 單因素預測建模過程
在傳統的神經網絡警情短期預測中,大部分采用的是滑動窗口時間段內的警情數量,作為神經網絡的輸入,即網絡的輸入層,選取的是一段連續時間內連續的警情數,未來的預測值作為輸出,然后通過樣本訓練進行權值的學習。在現實生活中,警情的發生因素很多,這種預測方法中對預測因素的分析是明顯不足的。上述這種預測方法叫做現狀外推預測,即通過對歷史警情數的提取,在當前客觀狀態下,對未來警情數的預測;在實際生活中,警情的發生有很多因素,諸如由于警力部署、季節性流動人口的不同,會導致轄區某地區發生的警情數也不同。另外,警情數預測的目的是通過調整警力或者有針對的預防措施減少轄區某區域的發案數。
2.2 改進的警情預測建模過程
介于上節所述原因,我們嘗試在使用神經網絡預測過程中,加入了環比警情數、部署警力數、該地區常住人口數、暫住人口數及重點防控區域數燈相關參數,使用神經網絡做預測分類是,首先要確定網絡輸入層、隱含層和輸出層神經元節點的數量,輸入層,節點主要選取影響預測目標的各個因素,即上述包含的相關參數。輸出層節點,主要選取要預測的未來警情數。所以,在實際仿真中選擇三層前饋式的神經網絡網絡,包含了7個輸入節點和1個輸出節點,具體如圖2所示。
從圖中我們可以看出該文所使用的模型相比單因素的神經網絡預測模型具有較大的改進,由于加入了幾個影響警情發生的要素,我們可以在外推預測階段結束后,根據實際情況作出調整,諸如由于放假造成的流動人口增多或減少。根據防控要求作出的警力調整等各方面條件之后,再次進行預測,形成了有目的的預測。
3 樣本訓練及預測結果分析
建立預測模型,至少需要2組數據樣本,前一組數據用來構成訓練樣本,對神經網絡單元的權重、閾值進行訓練,后一組數據作為檢驗樣本對預測結果進行檢驗。該例子中選擇了某派出所2014年4月到2015年4月的實際數據作為樣本。對樣本進行歸一化處理,勢必導致數值大的分量絕對誤差變大,一般而言,樣本的輸入和輸出值都限定在0.1至0.9之間。在訓練ANN時,應根據情況確定輸入輸出層的各神經元所代表實際量的最小、最大值Xmin,Xmax,通過代入逆變換公式換算出的真實量。
故,對原始數據按照BP人工神經網絡的具體算法的第一步,歸一化處理原始數據,可將原始數據轉化為[0.1,0.9]上的無量綱指標屬性值,如表2所示。
利用訓練完成后神經網絡的結構和權值參數,我們首先將剩余的其他沒有參與訓練的測試數據,作為神經網絡的輸入,進行警情數的預測,然后通過網絡的輸出值與實際值比較,以此來驗證預測模型的準確度和泛化能力。
4 結語
該文從預測結果比較所示可以得到的結論有:(1)預測數據與真實數據在數值上盡管存在一些差距,但是在升降的趨勢方向上是較為準確的。(2)改進的多因素BP神經網絡預測模型采用了8個影響警情發生因素指標作為神經網絡結構中的輸入,利用神經網絡的自適應、自學習能力對歷史樣本數據進行訓練,通過網絡的輸出獲得了與真實數據趨勢一致的預測值。根據預測的趨勢情況,可通過強化巡邏、不同區域配置不停警力等方式進行引導預測,這樣可以如實的反應出變更防控措施后的優勢與不足。
參考文獻
[1] 劉莉,徐玉生,馬志新.數據挖掘中數據預處理技術綜述[J].甘肅科學學報, 2003,15(1):117-119.
[2] 馬銳,人工神經網絡原理[D].北京:機械工業出版社,2010.
[3] 焦李成.神經網絡系統理論[M].西安:西安電子科技大學出版社,1996.