宋華明
(湖北省咸寧市公安局,湖北 咸寧 437000)
基于傳感網絡對公共安全風險的數據融合及預測
宋華明
(湖北省咸寧市公安局,湖北 咸寧 437000)
利用傳感網絡對公共安全進行實時監測與風險預警,已成為公安信息化重要的一環。圍繞公共交通網絡中的諸多傳感器,收集了海量的監測數據,并將其上傳到服務器端進行監測及公共安全風險預測。但其傳感數據龐大且密度低,對傳輸網絡帶寬及服務器端造成了不小的壓力。本文在傳感網絡的節點端及中繼處分別利用加權局部融合和約簡融合,消除數據噪聲,提高數據密度,剔除冗余屬性;在服務器端利用基于遺傳算法的BP神經網絡進行分析預測,加速收斂速度,降低預測誤差6%以上。
傳感網絡;OWA算子;加權融合;基于遺傳算法的BP神經網絡
隨著城市化戰略格局的部署,城市內部的交通網絡越發密集。在交通網絡上密布的眾多傳感器收集包括煙霧,溫度,聲音,人流等諸多屬性的數據,構建了傳感網絡進行實時監控。密集的傳感網絡作為公安信息化[1]的一部分,不僅保證了對各大交通樞紐中公共安全的實時監控,也提供來海量的數據供公安部門預測不同地區的公共安全風險態勢。但隨著部署的節點越來越密集,監控數據的信息量不斷提升,將節點數據全部上傳到云端,集中式分析預測,對現有的帶寬,機房造成了不小的壓力。而且現有各類傳感器數據,規模龐大但價值不高,整體信息密度低,且會因為監測地區廣而導致不同程度的噪聲數據。另外現有的預測算法如神經網絡等,在處理這些數據時,因運算量過大,導致收斂時間過長,預測誤差大等。對此本文提出了以下創新點:
(1)在傳感網絡的節點端進行局部數據融合,將同類型的傳感數據進行加權融合,降低數據噪聲。再利用模糊集的知識,在中繼節點處,定義不同類型傳感數據的重要程度。配合OWA算子約簡掉部分與預測對象無關的數據屬性,提高數據密度。
(2)在傳感網絡的終端進行數據預測,將已被約簡的傳感數據利用BP神經網絡進行預測,配合遺傳算法“優勝劣汰”加快其算法的收斂速度,提高預測的精準度。通過實驗證明經約簡之后的數據預測相對誤差在2%以內,相比原有的BP神經網絡,預測精度提高了6%。
傳感器網絡由眾多的傳感器節點組成的,各個節點實時檢測收集多維度,多種類的數據[2],在整個網絡中利用分步路由將數據匯總上傳。為了減少帶寬占用,消除單個傳感器的不穩定,提高整體性能。我們將眾多監測數據按時間序列進行收集匯總[3],按一定規則拼合使用。這就是傳感器的數據融合。傳感器融合技術不僅提升了同源數據的共性優勢,還從綜合信息的角度提高了多種信息的觀測精度[4],現已被廣泛應用于智能監測和自動化控制等專業領域[5]。
現有的傳感器融合技術或依賴于證據推理、統計決策理論的統計學理論知識[6];或利用加權平均、貝葉斯估計等數學原理上的知識。近來也有利用人工智能的神經網絡,利用神經網絡的權值協作,過濾冗余數據等[7]。本文首先利用基礎的數學理論進行同組數據的局部融合,再利用模糊集約簡屬性,配合OWA算子進行數據融合。
將經過融合之后的傳感數據傳到云端的數據中心來進行數據挖掘,提取其中的價值,分析潛在的公共安全風險并及時進行預警。BP神經網絡作為人工智能的優秀算法之一,被廣泛應用于數據壓縮、模式識別、數據挖掘之中。BP神經網絡一般具有三層或者三層以上的網絡結構。利用輸出誤差反傳,即將輸出后一層的誤差來估計輸出前一層的誤差,按照網絡層級,一層層的反傳回去[8],并由此獲得所有層的誤差估計。通過不斷修正和訓練,達到較好的預測效果。
在利用BP神經網絡進行數據挖掘的過程中,會因為隱層節點過多,造成預測效果不好,學習時間長,或因節點數量過少造成整體網絡難以收斂。為此有對BP神經網絡引入訓練函數,例如比例梯度共軛減少搜索時間,提高訓練精度[9];或利用Fletcher-Reeves算法降低訓練時間[10]。或將BP神經網絡與其他算法結合,如模擬退火算法用于緩解選擇壓力[11]。本文中利用遺傳算法,對BP神經網絡中連接權進行改進調優。
3.1傳感器數據的局部融合
將整個傳感網絡的數據全部傳輸到云端,除了大量的帶寬能耗的消耗,也可能導致后一步預測過程中較長的收斂時間。我們選擇在節點端對傳感數據先進行局部融合,將同組傳感器中的數據通過簡單的加權方式進行合并。這可使得傳感數據被進一步的優化,有效地屏蔽掉環境中的噪聲污染,節約帶寬與能耗。
傳感數據的局部融合是將根據同組傳感器中的數據方差大小來分配權數的。數據變化程度低的方差小,分配的權數小,傳感數據變化差值大表明數據存在異樣,分配權數較大[12]。

(1)
因為某時間段內,同一類型的傳感器測值方差不大,證明這段時間內無明顯情況變化,數據顯示趨同性,證明其公共安全風險較低[13]。所以可以合并對應測量數據,提高數據密度。同時也能降低噪聲,方便之后我們在中繼節點對傳感數據進行約簡融合。
3.2傳感器數據的約簡融合
在中繼節點中,我們獲得經局部融合的同組傳感器監測數據。首先假設整個傳感網絡中一共有若干種傳感器,這若干種傳感器總計收集回m種不同的數據屬性,定義傳感器中數據屬性A包含m種不同屬性,表示為{a1,a2,…,am}。針對每個不同的數據屬性,我們會根據其對于后期預測對象的重要程度,來進行約簡。
這里我們根據模糊集的知識定義:該屬性在預測對象中出現的次數越多,說明該屬性在知識表達系統中越重要[14]。定義屬性a對于預測對象的重要程度T。并利用OWA算子[15―16](Ordered Weighted Averaging operator)來聚合屬性,表達其對象的重要度。則OWA算子描述如下:

為了獲得屬性aj對于預測對象的重要度的加權向量,我們定義模糊量詞Q來獲取:

(2)
其中Q(l)會根據參數α和β,有多種不同的取值。當l小于α時,Q(l)為0;當l大于β時,Q(l)為1。α和β∈[0,1],對應不同取值時可以表示這是模糊量詞的多寡范圍,比如,當(α,β)取(0.5,1)表示,盡可能多的意思。對應的我們就能定義經過有序加權之后的向量h
(3)
根據上述的公式,我們可以定義預測對象的重要度IM:在經局部融合后的數據,其中每個屬性A{a1,a2,…,an}對應為:
(4)
其中j的取值[1,m],Tj表示屬性aj對所有對象的重要度的由大到小的排列,V是OWA算子;Hj是根據公式2,3來確定的加權后n維向量h。
之后根據IM來對重要度進行從小到大的排序,根據預測對象的要求,篩掉較小的IM。若IMj=0,證明該屬性對于預測對象重要程度為空,屬于冗余屬性,即可約簡該屬性。
我們利用BP神經網絡對傳感器數據,進行公共安全的風險預測,提取公共安全風險因子。但是由于原有的BP神經網絡在確定學習速率和記憶因子時,會因規則的好壞造成學習速率選擇過大或過小。這會導致訓練中出現跳躍現象或收斂速度較慢。其次在利用BP神經網絡進行挖掘分析時,如果選擇不合適的初值權重,則可能在訓練中出現跳躍現象,或陷入局部最優。為解決上述問題,我們引入遺傳算法的“優勝劣汰”思想對BP神經網絡進行優化,使其更適合傳感數據的進行預測。其具體操作步驟如下:
步驟1:對閾值進行編碼,用隨機生成的一組分布對應一組閾值。
步驟2:將訓練樣本的誤差平方和倒數定義為適應度,令適應度與誤差負相關,并以此評判閾值好壞。
步驟3:在訓練樣本內挑選出適應度大的個體,遺傳至下一代,保留優質屬性。
步驟4:利用交叉、變異令群體完成進化,得到下一代群體。
步驟5:重復步驟2—4,令閾值不斷進化直到滿足預設條件。
在參數初始階段,我們首先對神經網絡的網絡層數進行設置。嘗試隱層數目為一層或三層,因為單隱層網絡可以對任一非線性函數進行擬合;而三層遺傳學習更優。
之后,定義各層神經元數目,輸入層神經元數根據所預測的屬性種類設定,輸出層神經元數由預測對象決定。然后利用“試湊法”來確定隱層神經元數的大致范圍,計算公式如下:
(5)
其中,k為隱層神經元數,m、n分別為輸入輸出神經元數,a為1到10間常數。之后各層神經元數目按經驗公式設定:
(6)
其中m為輸入層神經元數,n為輸出層神經元數。
之后我們定義遺傳算法的種群規模及迭代次數。種群規模過大將加大計算量進而降低學習效率,規模過小將容易導致遺產算法收斂于局部極小點。同理,迭代次數過小將有可能導致算法無法找出最優解,多大將擴大計算時間。經過反復測試,我們將迭代次數和種群規模都設置為50。
在遺傳算法中的交叉概率過大將導致個體充分交叉從而生成不必要的解空間,過小將導致算法搜索能力的降低,我們定義好交叉概率設置為0.3。對于變異概覽來說,過大的變異概率有可能破壞種群模式,過小則會降低種群進化速度。故最終設定變異概率設置為0.1。
在BP神經網絡訓練樣本的數目選擇上,若樣本數過少,BP神經網絡難以捕獲其中包含的信息,導致較大的預測誤差。而過大的樣本數量則會延長訓練時間,預測代價高。考慮到其直接影響模型預測的準確度,為保證訓練效果,本節選取了600個樣本作為訓練樣本。原有的傳感器屬性種類有14種,這里我們使用了經過降噪局部融合,和約簡融合之后的6個屬性,故輸入層神經元可以設置為4個。預測對象設定為單一的風險因子,故輸出層神經元設置為1個。則根據公式(5)(6)隱含層神經元為2或更多。
我們通過實驗,分別對比在隱含層數為1,3時,計算整體預測對象的均方誤差mse,利用設定好的參數對模型進行訓練和預測。
(7)
其中,n為總體的預測樣本數量,這里我們選取約簡數據的中30個為預測樣本。由圖1可以看出,隱含層數為1時在訓練到14次時即達到收斂,隱含層數為3時在11次時達到收斂。兩者的訓練曲線如下:

Figure2 The mean square error of the hidden layer number is 3
圖2 隱含層數為3時的均方誤差
由圖可以發現,在處理約簡后的傳感器數據時,隱含層選為3層時,預測的收斂速度更快。在第十次訓練之后可以認為其收斂。所以我們之后我們用隱含層數為3的基于遺傳算法的BP神經網絡與原有的BP神經網絡進行對比。驗證在數據融合之后,在公共安全的預測上精準程度。我們利用相對誤差Rerror和來判定預測后的誤差大小,公式如下:
(8)
其中xi為預測數據,xj為真實數據。
對比兩者預測結果,按公式(8)計算出相對誤差,如圖3。

Figure3 The comparison of the relative error of two kinds of BP neural network prediction
由圖3可以看出基于遺傳算法的BP神經網絡預測的傳感器數據,總體的相對誤差在±2%內,充分說明利用該模型預測經約簡后的傳感器數據是可行的。而原有的BP神經相對誤差在±8%內,可以證明經遺傳算法優化的BP神經網絡預測效果更加精準。
龐大的傳感網絡所帶來的海量傳感數據,已給網絡傳輸造成了不小壓力。本文在傳感網末端節點利用局部融合消除噪聲,提高數據密度;在中繼節點利用模糊集知識,配合OWA算子進行約簡融合,簡化無關數據屬性,降低傳輸數據量,減緩網絡帶寬壓力。在分析傳感數據,預測公共安全風險上,本文利用遺傳算法優化了BP神經網絡中連接權,進行數據預測,加快了收斂速度;經實驗證明,經優化后的BP神經網絡預測的相對誤差在2%以內,相比原有的BP神經網絡提高了6%。
[1] Liu A H, Bunn J J, Chandy K M. Sensor Networks for the Detection and Tracking of Radiation and Other Threats in Cities[C]// International Conference on Information Processing in Sensor Networks. 2011:1―12.
[2]楊李博.基于Wi-Fi的無線傳感器網絡節點設計與實現[D].上海:上海交通大學碩士學位論文, 2014.
[3]孔繁強.基于傳感網的大樓火源定位及預警算法的研究[D].哈爾濱:黑龍江大學碩士學位論文, 2012.
[4] Song Guo, Chen Zhang, Liu Xihui. Software development and data processing of tool wear based on mapping measurement[J].AdvancedMaterialsResearch, 2012,(383―390):4971―4976.
[5]郭鍵.一種模糊神經網絡在礦井膠帶機火災探測中的應用[J].蘭州理工大學學報,2007,33(3):88―91.
[6]涂國平,鄧群釗.多傳感器數據的統計融合方法[J].傳感器與微系統,2001,20(3):28―29.
[7]王萌萌.氯氣無線傳感網監測的數據挖掘與融合研究[D].哈爾濱:哈爾濱理工大學碩士學位論文,2014.
[8] Wu W, Wang J, Cheng M, et al. Convergence analysis of online gradient method for BP Neural Networks[J].NeuralNetworks, 2011, 24(1):91―98.
[9]史春朝,張國山.基于改進BP神經網絡的PID控制方法研究[J].計算機仿真,2006,23(12):156―159.
[10] Jiang M, Gielen G, Bo Z, et al. Fast Learning Algorithms for Feedforward Neural Networks[J].AppliedIntelligence, 2003, 18(1):37―54.
[11]郭曉婷,朱巖.基于遺傳算法的進化神經網絡[J].清華大學學報(自然科學版),2000,40(10):116―119.
[12]楊萬海.多傳感器數據融合及其應用[M].西安:西安電子科技大學出版社,2006
[13]司鵠,賈文梅.城市公共安全風險評估指標敏感性分析[J].中國安全生產科學技術,2014(11):71―76.
[14]苗奪謙.粗糙集理論、算法與應用[M].北京:清華大學出版社,2008.
[15] Yager R.On ordered weighted averaging aggregation operators in multicriteria decisionmaking[J].IEEETransactionsonSystems,Man,andCybernetics,1988,8(1):183―190.
[16] Ronald R.Families of OWA operators[J].FuzzySetsandSystems,1993,59(1):125―148.
(責任編輯 李志虹)
Data Fusion and Forecast of Public Safety Risks Based on Sensor Network
SONG Huaming
(PublicSecurityBureau,Xianning, 437000,HubeiProvince)
The application of sensor network to monitor and forecast public safety risks has become an important part of public security informationization. The large quantities of sensors of public transportation are used to collect data, and then upload to the servers to monitor and forecast public safety risks. However, problems do exist, such as large data with lower density on the sensors. As a result, great pressure is imposed on both bandwidth and the servers of the network. This paper is devoted to the application of local weighted fusion and leaning fusion at the node ends and the trunk offices to reduce noise, increase data density and eliminate redundancy. Meanwhile, the application of the BP neural network based on the genetic algorithm at the server ends can increase convergence rate and lower the forecast error rate by 6%.
sense network, OWA (ordered weighted averaging) operator, weighted fusion, BP neural network based on the genetic algorithm
2017 - 03 - 04
宋華明(1978―),男,湖北省咸寧市公安局網絡工程師,研究方向:計算機網絡。
TP212
A
1671 - 7406(2017)03 - 0063 - 05