周 靜 ,趙魯陽 ,羅炬鋒 ,2
1.中國科學院 上海微系統與信息技術研究所 無線傳感網與通信重點實驗室,上海 200050 2.上海物聯網有限公司,上海 200050
基于時域特征提取的圍欄入侵模式分類方法
周 靜1,趙魯陽1,羅炬鋒1,2
1.中國科學院 上海微系統與信息技術研究所 無線傳感網與通信重點實驗室,上海 200050 2.上海物聯網有限公司,上海 200050
基于無線傳感網的防入侵應用領域中行為分類問題,提出一種基于時域特征提取的電子圍欄入侵檢測及異常入侵模式識別系統。由于頻域處理方法計算量大、復雜度高、傳感器采樣率高,為減輕系統的傳輸負擔并減少時延,首先對原始信號預處理提取時域特征,然后通過一個三層的BP神經網絡對目標事件進行分類,最后對比了多種典型的分類器方法的準確率。仿真結果表明:相比于頻域處理方法,該方法復雜度低、易于實現,多種分類器準確率達86%以上,其中BP神經網絡測試集的準確率能夠達到94%,并且訓練集和測試集的準確率偏差較小。
無線傳感網;時域特征提??;圍欄入侵;BP神經網絡;模式分類
安全問題涉及人們工作和生活的各個領域,是關乎國計民生的重大問題,學校周邊、居民小區、軍事區域、機場、大型變電站、儲油基地、南水北調工程沿線等等重要區域都需要切實有效的安全防范設施。近年來傳感器網絡技術也逐漸開始應用于安全監控領域,聲音、震動傳感器可用于周界防入侵以及禁區管理RFID技術中,在識別、定位、追跡和溯源等的應用有其獨到之處。而在基于傳感器網絡的防入侵系統研究中,對入侵的異常模式進行正確的分類識別是完成智能化防入侵處理的前提,因此對入侵的異常模式分類研究具有非常重要的意義。
目前常用的電子圍欄檢測系統主要基于傳感器的方法,例如電學傳感器、振動傳感器、光纖傳感器等。吳庥偉等人提出了一種多個小波分解進行綜合判決的分布式光纖圍欄入侵系統,主要根據多種小波分解得到不同層次的突變細節信息[1]。謝鑫等人提出了一種光纖圍欄入侵監測系統,利用三層BP神經網絡對傳感器信號訓練分類器檢測識別攀爬行為[2]。田曉鳳等人利用一種滾珠式振動傳感器,設計了一款基于振動傳感器的周界圍欄報警監控系統,實現對異常入侵行為的檢測[3]。通過傳感器和模式識別相結合,能夠對多種異常行為進行分類(包括攀爬行為),但是,該方法存在定位精度不高、計算復雜和時延大等缺點。本文提出了一種基于時域特征提取的電子圍欄入侵檢測及異常入侵模式識別系統,相比較于傅里葉變換、小波包分解等傳統頻域處理方法,該方法能夠降低計算量和復雜度可以對入侵異常事件進行智能識別,而且具有較高的識別率,在實際的工程應用中具有極大的應用價值。
基于傳感網的防入侵系統主要包括:前端傳感器探測模塊、數據傳輸模塊、后臺數據處理模塊。其中前端傳感探測模塊主要由具有物理信息探測能力的振動、傾角等傳感器組成,該模塊安裝在圍欄上,用于探測圍欄的振動情況;數據傳輸模塊主要通過無線或者有線傳輸,經過專網或者公網將前端探測信息采集的數據傳輸到后臺處理平臺,在實際應用中由于傳感器的采樣速率比較高,當圍欄有異常振動時,附近多個節點同時上傳數據,傳輸模塊使用CAN總線其最高數據傳輸速率為1 Mbit/s,當有大量數據上傳時會造成擁塞和超出傳輸負荷等現象,模塊中包含一個數據預處理單元,緩解數據上傳壓力;后臺數據處理模塊對采集到的數據進行實時處理,實現異常行為的模式分類,對判斷類別和節點號等進行信息融合,再將結果通過GUI界面或者log日志顯示供進一步處理。

圖1 防入侵系統的流程圖
模式識別是指利用計算機或其他裝置對物體、圖像、語音、字形等信息進行自動識別。模式識別誕生于20世紀50年代,并于20世紀60年代逐漸發展為一門學科。經過多年的研究和發展,模式識別技術已被廣泛應用,具體有語音識別、圖像識別、手寫體字符識別、工業故障檢測、精確制導等[4-5]。完整的模式識別系統由數據獲取、預處理、特征提取與選擇、分類決策等部分組成,如圖2所示[6],常采用的方法有判別函數法、神經網絡[7]、支持向量機[8-9]、近鄰法、主分量分析法等。

圖2 模式識別系統
在模式識別系統中,其中前面三部分信息獲取、預處理和特征提取和選擇可以概括為特征表達。良好的特征表達,對最終識別效果起著非常關鍵的作用,并且好的特征應該具有不變性(大小、尺度和旋轉等)和可區分性。因而模式識別系統中,重點在于特征表達和分類器設計,文中將從以下兩個方面進行展開?;跁r域提取特征,選擇BP神經網絡作為分類器,并使用支持向量機(Support Vector Machine)對比分類效果,其中所使用的SVM算法為一種改進的網格搜索最優參數的SVM算法[10]。
時域分析中,由于信號的特征信息比較簡單直觀,常見特征量有均值、極值、方差、斜度、峰度等統計量,以及自相關,過零點數等[11]。在實際的應用中,由于每個加速度傳感器的采樣率較高,當圍欄上有比較多的節點時,有大量的信息進行傳輸不但會給網絡帶來很大的負擔,而且會造成堵塞。采樣率較高的情況下,數據必然會有冗余,因此極大地增加了系統的處理負擔,故對數據進行預處理,本文采用基于時域提取特征的方法,公式如(1)所示。

其中Zdata為三軸加速度傳感器采集到的Z軸的信號,以n個數為一組進行處理,通常來說n的設定根據具體情況而定,一般可以取256、512等,這里n取512,將 X、Y、Z的幅值歸一化到0~255之間,由此得到峰峰值(Zpeak)和能量值(Zenergy)的信息。
BP(Back Propagation)神經網絡是一種采用誤差反向傳播算法來調整多層前饋神經網絡,是目前應用最廣泛的神經網絡模型之一[12]。BP算法是一種代價函數(cost function)按照梯度下降的學習方法,通過反向傳播來不斷調整網絡的權值和閾值,使得網絡的代價函數最小。典型的BP神經網絡具有三層或者三層以上,層內無連接,前后分別為輸入層(input layer)、輸出層(output layer),中間為隱含層(hidden layer),BP神經網絡的一般網絡結構如圖3所示[13]。

圖3 BP神經網絡結構圖
定義 BP神經網絡模型中共三層,其中L1表示輸入層共n個輸入單元,L2表示隱含層h個隱含單元,L3表示輸出層共m個輸出單元,k為數據樣本的個數,k=1,2,…,K。
Xk=(x1,x2,…,xn)T表示網絡的輸入向量;
Yk=(y1,y2,…,ym)T表示網絡的實際輸出向量;
Tk=(t1,t2,…,tm)T表示網絡的期望輸出向量;
α表示學習速率;
其中神經元作為最基本的運算單元,單個神經元的輸入-輸出映射關系為一個邏輯回歸(logistic regression),通過激活函數 f(?)將特征保留并映射出來,一般選取能夠逼近任意函數并且可微的非線性函數。常用的有sigmoid-S形函數、tanh-雙曲正切函數、ReLU等。BP神經網絡主要包括數據前向傳播和誤差反向傳播更新參數的過程。
3.2.1 前向傳播
(1)假設一組輸入樣本為Xk、目標樣本為Tk;
(2)正向計算每層神經元的輸出
當l=1時,即輸入層:

當l=2時,即隱含層:

當l=3時,即輸出層:

令zli表示第l層中第i個單元的輸入加權和,則有:

則上面的表達式可簡化為:

(3)計算樣本的輸出誤差
對于單個樣本,損失函數為:

假設樣本集中包含N個樣例,其整體代價函數為:

根據前向傳播的過程,Y是參數為w和b,自變量為X的非線性函數,即Y=f(w,b;X),因而損失函數J(w,b;X,T)可以看成參數是w和b的函數。
3.2.2 反向傳播
神經網絡中對目標函數實現最佳的擬合的過程,實際上是對參數為w和b的J(w,b)求最小值。通常采用梯度下降法對參數w和b進行更新。
(1)反向傳導
設第l層的每一個節點i,其殘差表示為δli。則輸出層第3層的殘差δnli,公式如下所示:

第l=nl-1,…,2層,第l層的第i個節點的殘差為:

將上式中nl-1和nl的關系替代為l和l+1的,可得:

由此可以看出l層可以由l+1層求出,這也是反向傳導的思想所在。
J(w,b;X,T)對w和b的偏導數:

當激勵函數是sigmoid函數,有:

(2)梯度下降法更新權值

重復梯度下降法的迭代步驟來減小代價函數J(w,b)的值。
BP神經網絡算法過程如下:
(1)選取一個輸入樣本Xk、目標樣本Tk。
(2)前向傳播得到Yk。
(3)計算代價函數J(w,b;X,T)。
(4)修正各層中所有的w和b。
(5)判斷是否訓練完所有的N組樣本,若不滿足則選取下一個樣本供樣本學習,返回步驟(2),否則轉至(6)。
(6)計算 N個樣本的總誤差 J(w,b),判斷 J(w,b)是否小于預設的誤差精度ε,若滿足則結束。
(7)判斷是否達到預定訓練次數,若滿足則結束訓練,若不滿足則返回到步驟(2)繼續訓練[14]。
3.2.3 影響因素分析
權值初始值設置的影響分析:在正向傳播求解神經網絡時,需要先將w和b初始化為一個較小的、接近零的隨機量,一般使用正態分布Normal(0,ε2)生成隨機值,防止進入飽和區或者局部極小值,加快訓練速度。
輸入向量歸一化影響分析:歸一化旨在歸納同意樣本的統計分布性,改善其分布規律,一般采用去均值,去相關性以及均方差均衡,歸一化可以防止輸入信號數據絕對值過大進入飽和區。一般采用合理的變換將輸入的數據變換為[0,1]或[-1,1]之間。
學習速率α影響分析:根據公式(14)可以發現,學習率α越大權值的變化越大,則BP學習收斂速度越快,當α過大時會引起網絡的振蕩,導致網絡的不穩定性以及性能低下。當α過小時,能夠避免網絡的振蕩,但是會導致學習收斂速度的下降。
激活函數、代價函數、允許誤差ε的選擇等對神經網絡的性能都有影響。
現場采集數據,如圖4所示,實驗場景為南水北調中線易縣段。在常溫及周圍無干擾的環境下進行數據采集[15],實驗中的圍欄為軟質網狀鐵絲圍欄,間隔2 m將加速度傳感器串聯起來,采集數據時在節點的-0.5~0.5 m范圍內。

圖4 實驗現場的圍欄
本文采用三軸向模擬輸出加速度傳感器(MMA7360L),采樣率為1 024 Hz,實際安裝使用中,芯片是貼著圍欄豎直放置,而Z軸是垂直圍欄方向,即水平面方向。如圖5所示為實際節點安裝情況中方位圖,根據圖可知當圍欄振動的時候Z軸所受的加速度最大,Zout引腳的電壓讀數有較大波動,因而文中的數據以Z軸的振動情況為參考,其中加速度傳感器的量程為2 g(g表示重力加速度,其中1 g=9.8 m/s2)。

圖5 加速度傳感器的安裝方位
模擬拍、攀爬、搖、倚靠圍欄,每次事件發生時不僅附近2、3個傳感器會有振動,相比較于背景噪聲時,較遠的節點也將采集到振動信號進行上傳,通過設置合適的閾值將非鄰近的振動節點過濾掉。原始數據經過預處理,當只有背景噪聲時,數據傳輸模塊以0.2 Hz發送心跳包給后臺處理模塊,當有異常入侵行為時,后臺處理模塊以2 Hz接收信號。實驗中一次完整事件持續時間為5 s,其中攀爬持續時間比較長,每次事件持續時間大概為10 s,從系統的實時性考慮,選取一次事件從開始后7.5 s內后臺接收的信號作為特征向量,共15個點,其中每個點包含峰峰值和能量值。
實驗中以攀爬為例,傳感器采集的原始Z軸的振動情況如圖6所示,橫軸表示動作持續的時間,縱軸為傳感器Z軸的原始振動幅值。

圖6 攀爬時Z軸的原始振動情況
在采集到的幅值信號中,將一次事件從開始到結束的完整包絡作為特征向量。后臺處理模塊中對幅值求微分,求微分后信號的最大連續子段和、最小連續子段和,其中最大連續子段表示幅值連續上升的部分,最小連續子段表示幅值連續下降的部分,若最大連續子段的終點和最小連續子段的起點為相鄰點時,則表明兩個子段和組成了一個完整波峰的包絡,其中最大連續子段和的終點也為振動波峰的峰值點。4種事件的波形圖如圖7所示,其中橫軸表示動作持續的時間,左邊縱軸表示Z軸的峰峰值,右邊縱軸表示Z軸的能量值。

圖7 4種模式的時域圖
特征向量中包含峰峰值和能量值,其物理意義和量綱并不相同,因而需要對輸入向量歸一化,保證各個輸入向量以同等的權值。如果所有樣本的輸入信號都為正值或者負值,隱含層的神經元權值只能同時增加或減小,從而導致學習速度很慢[11]。分別對峰峰值和能量值進行歸一化,峰峰值其最大值為定值255,因而同時除以255歸一化到0~1之間;能量值的最大值為非定值,將能量值除以其最大值進行歸一化,最后將幅值和能量值統一進行歸一化,使其均值接近0或者其標準方差比較小。
文中使用三層BP神經網絡,神經網絡的輸入信號為特征向量提取得到的信號,輸出層為異常入侵的模式類別,隱含層個數由經驗公式確定[13],如下所示:

其中h為隱含層單元數,n為輸入單元數,m為輸出單元數,a為[1,10]之間的常數。輸入單元數n為30,h設置為11,輸出單元數m為4。文中選擇激活函數為Sigmoid函數,對于多分類問題,只有輸入對應類的輸出節點輸出為正,其他類的位或者節點為0,當激活函數為tanh時則設為-1。以拍為例,其樣本的標記(輸出)為1 000。
實驗中共采樣500組數據,根據特征向量提取方法得到472組樣本并進行標記,文中選擇其中352組為訓練樣本,120組為測試樣本。對352組樣本進行多次訓練,將識別率較高的網絡保存,使用120組樣本對保存的網絡進行測試,根據混淆矩陣得到結果如表1所示。

表1 基于時域特征的BP神經網絡分類效果
將時域提取的特征作為其他典型分類器的特征輸入,以SVM為例,基于訓練集多次訓練,得到訓練效果最好時的懲罰系數C和gamma,使用測試樣本對最優參數下的SVM測試,其混淆矩陣所得的結果如表2所示。

表2 基于時域特征的SVM分類效果
同時對比了機器學習中其他典型的分類器隨機森林和樸素貝葉斯,如表3所示,包括訓練集和測試集的分類效果。

表3 分類器的訓練和測試準確率%
由表3可以看出,時域特征作為分類器的輸入,平均準確率能夠達到86%以上,其中BP神經網絡的分類效果最好。如表1所示,其拍和搖兩種事件的正確識別率為100%,并且各個模式下的識別率相對比較高,比較其他的分類器效果更好。采用有監督的學習訓練分類器,基于訓練樣本得到最優的網絡和參數顯得尤為重要,但每次訓練的結果有偏差,在實際中選取效果較好的網絡和參數進行保存。從表3可以看出,測試集的準確率要比訓練時的低,其中BP神經網絡對于訓練集和測試集準確率的偏差相比于以下幾種方法最小,具有更強的魯棒性。
本文主要提出一種振動信號的時域特征,使用一個三層的BP神經網絡的分類器進行分類,特征向量提取和分類器設計對分類結果有著很大的影響,文中著重介紹這兩方面。從仿真結果可以發現,基于時域提取特征,多種分類器都能取得較好的效果,模式分類系統中采用分類效果最好的BP神經網絡作為分類器。從實際應用中,文中使用的方法相比較于傳統的頻域或者時頻域的方法大大減少算法的復雜度和計算量;從時效性上的角度考慮,當圍欄異常入侵時能夠保證10 s內將提取的特征信號上傳到后臺處理模塊,經過訓練好的網絡及時判斷出異常類別,因而在中短距離范圍內的防入侵系統具有較大的應用價值。由于現實中的安防問題比較復雜,怎樣甄別和提取有用節點的信號,以及強魯棒性的分類器模型[15-16]將是下一步的研究重點。
[1]吳庥偉,吳慧娟,饒云江,等.基于多種小波分解方法綜合判決的低誤報率分布式光纖圍欄入侵監測系統[J].光子學報,2011,40(11):1692-1696.
[2]謝鑫,吳慧娟,饒云江.一種基于光纖布喇格光柵振動傳感器的光纖圍欄入侵監測系統及其模式識別[J].光子學報,2014,43(5):32-37.
[3]田曉鳳,于春和.基于振動傳感器的周界圍欄報警監控系統設計[J].沈陽航空航天大學學報,2012,29(5):44-47.
[4]張舒.模式識別并行算法與GPU高速實現研究[D].成都:電子科技大學,2009.
[5]范會敏,王浩.模式識別方法概述[J].電子設計工程,2012,20(19):48-51.
[6]王剛,黃星元,施明智,等.光纖圍欄擾動事件模式識別研究[J].光通信技術,2011(7):51-53.
[7]周鐵軍,顧曉輝,呂艷新.基于BP神經網絡的地震動信號識別[J].現代電子技術,2012,35(10):100-102.
[8]Chen P W,Wang J Y,Lee H.Model selection of SVMs using GA approach[C]//Proc of 2004 IEEE International Joint Conference on Neural Networks,Piscataway,USA,2004:2035-2040.
[9]Chapelle O,Vapnik V,Bousquet O.Choosing multiple parameters for support vector machines[J].Machine Learning,2002,46(1/3):131-159.
[10]王健峰,張磊,陳國興,等.基于改進的網格搜索法的SVM參數優化[J].應用科技,2012(3):28-31.
[11]楊國安,鐘秉林,黃仁,等.機械故障信號小波包分解的時域特征提取方法研究[J].振動與沖擊,2001,20(2):25-28.
[12]高鵬毅.BP神經網絡分類器優化技術研究[D].武漢:華中科技大學,2012.
[13]任謝楠.基于遺傳算法的BP神經網絡的優化研究及MATLAB仿真[D].天津:天津師范大學,2014.
[14]Ng A,Ngiam J,Yu-Foo C,et al.UFLDL tutorial[EB/OL].[2013-04-07].http://deeplearning.standford.edu/wiki/imdex.php/UFLDL_Tutorial.
[15]Eberhart R,Kenney J.A new optimizer using particle swarm theory[C]//Proc of the Sixth International Symposium on Micro Machine and Human Science,Piscataway,USA,1995:39-43.
[16]Castejo’n C,Garc?’a-Prada J C,Go’mez M J,et al.Automatic detection of cracked rotors combining multiresolution analysis and artificial neural networks[J].Journal of Vibration and Control November,2015,21(15):3047-3060.
ZHOU Jing1,ZHAO Luyang1,LUO Jufeng1,2
1.Key Laboratory of Wireless Sensor Networkamp;Communication,Shanghai Institute of Microsystem and Information Technology,Chinese Academy of Sciences,Shanghai 200050,China 2.Shanghai Internet of Things Co.,Ltd.,Shanghai 200050,China
Fence intrusion pattern classification method based on time domain feature extraction.Computer Engineering and Applications,2017,53(21):98-102.
Focused on the issue of behavior classification in the field of security application based on wireless sensor networks,an electronic fence intrusion detection and abnormal pattern classification system is proposed using time domain feature extraction.The method of frequency domain’s feature extraction contains massive computation with expensive complexity,and the sensors’sampling rate is high.In order to reduce the system’s transmission burden and time delay,firstly,the raw data is preprocessed to extract time domain features.Then a three-layer BP neural networks classifier is used to classify the target events.Lastly,the accuracy rate of several kinds of typical classifiers are compared.Simulation results indicate that,compared with the method of feature extraction in frequency domain,this method is low in complexity and easy to implement,and the accuracy rate can reach more than 86%.What’s more,for the BP neural networks,the accuracy deviation between the training and testing set is relatively small,while the accuracy is reaching 94%for the testing data set which is higher than others.
wireless sensor networks;time domain feature extraction;fence intrusion;BP neural networks;pattern classification
A
TP319
10.3778/j.issn.1002-8331.1605-0261
國家科技重大專項(No.2014ZX03005001-002);上海市青年科技英才揚帆計劃資助(No.15YF141450)。
周靜(1992—),女,碩士研究生,研究領域為機器學習;趙魯陽(1970—),博士,副研究員,研究領域為無線傳感網絡應用,圍界防入侵等領域;羅炬鋒(1983—),博士,副研究員,研究領域為通信,數字信號處理,E-mail:ljufeng@mail.sim.ac.cn。
2016-05-10
2016-10-17
1002-8331(2017)21-0098-05
CNKI網絡優先出版:2016-12-07,http://www.cnki.net/kcms/detail/11.2127.TP.20161207.0947.024.html