蘇國棟
(福建師范大學福清分校 電子與信息工程學院,福建 福清 350300)
無線傳感網絡多傳感器數據融合方法研究
蘇國棟
(福建師范大學福清分校 電子與信息工程學院,福建 福清 350300)
無線傳感器網絡部署的成功取決于是否能夠在其諸如數據的精確性、數據聚類程度以及網絡生命周期最大化等問題上,提供一個高質量可靠的性能服務。其中,數據融合機制就特別具有挑戰性。如果將一小部分低質量的數據作為數據融合輸入,那么極可能對整個數據融合結果產生負面影響。該文提出了改進型分批估計和BP神經網絡相結合的多傳感器數據融合方法,旨在提高網絡的服務質量并減少整個網絡的能量消耗。該方法能夠辨別和剔除低質量的終端數據,提高數據的精確性;同時,它還能夠融合冗余的數據,以減少各站點之間的數據通信消耗,使網絡生命周期最大化。通過MATLAB實驗仿真,表明該文提出的方法具有良好的數據融合性能;相比于LEACH,有效減少轉發數據包量,提高了網絡生命期。
無線傳感器網絡;數據融合;分批估計;BP神經網絡
無線傳感器網絡一直以來都是國內外研究的熱點領域,比如軍事監視[1]、工業控制和野生動物監測[2-3]等。一般地,大量傳感器節點被部署在監測感知區域內,根據特定的應用采集數據,這些傳感器節點具有良好的數據采集能力,各自之間以及中繼節點和基站能夠進行數據處理和傳輸通訊。其中,能量消耗是大部分無線傳感器網絡傳感器節點首要考慮的問題;此外,傳感器節點測量的準確性也是WSNs的關鍵問題,如果測量值與其真實值不一致,那么就要對測量值進行適當處理[4]。
無線傳感器網絡中,監測區域內的壓力變化、溫度變化、輻射、電磁噪音等都可能干涉到傳感器節點的測量精度,從而產生不精確不可靠的測量數據。甚者導致采集失敗而產生誤差極大的測量數據。另外,監測感知區域內的相鄰節點之間經常會采集產生重復性數據,而這些數據如果具有很高的相關性,那么勢必會降低整個網絡的服務質量。為了克服上述問題,采用合適的數據融合機制能夠有效地剔除不精確、不可靠、重復冗余的測量數據,從而提供強有力的數據保障。特別是對于多傳感器網絡,引入數據融合機制對多傳感器數據進行處理,必然能夠獲得更有意義的數據信息。事實上,數據融合機制不僅提升了數據的可靠性和服務質量,而且還能夠剔除冗余信息,減少數據傳輸量,降低網絡能量消耗。
目前,國內外針對如何減少無線傳感器網絡能量損耗提出了很多數據融合機制[5-6]。概括起來,這些機制使用了如下幾項技術手段:貝葉斯判定理論[7]、模糊集理論[8]、模糊神經網絡[9]以及DS證據理論[10]等。這些解決方法在融合過程中能夠剔除重復性數據。然而,他們沒有考慮到無線傳感器網絡的局限性。比如,假設傳感器節點在整個過程中總是能夠正常運轉以及獲取準確的數據。很明顯,這不是一個不切實際的假設,傳感器所處環境易發生變化。例如,溫度的變化直接影響著傳感器的精確性能,從而影響終端數據的可靠性。此外,我們知道無線傳感器網絡的主要能量消耗在于數據無線傳輸,那么無論傳輸的數據是否可靠或者是否需要都機械性地傳送給中繼節點或處理中心,結果就是造成過度的能量損耗。
本文提出了基于改進型分批估計和BP神經網絡相結合的數據融合機制。通過改進型分批估計解決傳感器節點測量值的不準確性問題,從而獲得具有代表性的測量數據。而采用BP神經網絡對重復冗余數據進行融合,并且通過融合多傳感器數據,得到正確的決策結果,減少整個網絡能量損耗,提高服務質量,使生命周期最大化。
如上所述,受多因素的影響,每個傳感器節點的少部分采樣測量值有可能存在較大誤差,盡管它的發生是小概率事件,但一旦發生將無法準確地反映實際情況??梢?,作為最原始的傳感器節點測量值的精度和準確度對于整個無線傳感器網絡來說是至關重要的,因此,有必要對傳感器的測量值進行適當處理。最常見的,對于一個傳感器節點測量目標,在某一個周期內,有n測量值。如果將這n個數據按照某種結構方式(時間順序等)分成兩組[11],再根據最大最小平均值方法和分批估計理論對數據進行處理,即可得到該傳感器的決策值。不妨假設,將某傳感器在一個周期內采集到的n個數據測量值分為A組和B組,A組為x1,x2,…,xp,B組為y1,y2,…,yq,其中,p+q=n。那么,我們可以分別計算出這兩組的平均值和方差:


兩組的方差分別為:




然而,在實際應用中,由于不可預測因素的存在,總是不可避免地出現誤差極大的少數數據測量值,這些數據也將出現在數據信息序列中。在數理統計理論中,有一種去除最大最小值和平均值分析法可以解決這個問題,即剔除樣本集中的極端數據(最大值和最小值),再求剩余數據的平均值。該方法可以在很大程度上消除極端數據對結果精確度的影響。依此方法,對A組和B組重新計算平均值:


同時對上式進行優化,融合結果可表示為:

經過分批估計數據融合之后,既提高了每個傳感器節點監測目標的測量值的精度和可靠性,同時也減少了部分重復且沒有必要的數據傳輸。但在某報警場合下,客戶所關注的并不一定是數據的具體數值而只需要知道警情。那么,可以利用BP神經網絡直接得到報警結果,從而再次減少了數據通信的信息量。
圖1為BP神經網絡結構。其包含一個輸入層、多個隱含層和一個輸出層,隱含層數目較為靈活。每一層都是由許多可并行計算的神經元構成。BP神經網絡訓練過程可分為兩個階段,即信息正向傳播和誤差反向傳播。數據依次按照輸入層、隱含側、輸出層順序計算傳播,但每層神經元的結果僅僅只會影響下一層神經元。若一次正向傳播的輸出值與期望值之間的誤差不在預設可接受的誤差范圍之內,則進行誤差反向傳播。通過上述兩個過程的相互交替,不斷驗證更新各層之間的權值,直至滿足誤差最小化。

圖1 BP神經網絡結構(三層)
假設輸入層、隱含層和輸出層的神經元節點數目分別為m,n,l。網絡輸入向量X={x1,x2,…,xm};網絡實際輸出向量Z={z1,z2,…,zl};對于樣本X,網絡期望輸出向量D={d1,d2,…,dl};wij代表輸入層與隱含層之間的權值,1<=i<=m,1<=j<=n;vjk代表隱含層與輸出層之間的權值,1<=j<=n, 1<=k<=l;θj代表隱含層各神經元的輸出閾值,1<=j<=n;γk代表輸出層各神經元的輸出閾值,1<=k<=l;f(x)為激勵函數。
那么,隱含層某神經元的輸出可表示為:

輸出層相應神經元的輸出可表示為:

則該神經元的誤差可表示為:
在學習和詢量過程中,BP神經網絡采用梯度下降法,通過反向傳播來不斷調整網絡的權值和閾值,使網絡的誤差函數最小。權值和閾值的修正量是通過下列公式來確定的:

其中:η是由使用者自行設定的學習速率。假設,對于第r次迭代,當前的wij,vjk,θj,γk的值分別為wij(r),vjk(r),θj(r),γk(r)。那么,在第r+1次迭代,各層的權值和閾值依據下列式子來更新:

接下來,當完成一個樣本的學習和訓練之后,如果經過誤差函數計算出來的值沒有小于設定的誤差限,那么網絡將繼續學習,直至網絡收斂。由此確定的網絡權值和閾值將用來擬合預測目標樣本。
對于誤差函數,BP神經網絡在訓練過程采用均方誤差,其式子如下:

其中,dij表示預期輸出值,p表示相應訓練樣本數。
為了更好地了解和分析本文提出的基于改進型分批估計和BP神經網絡相結合的數據融合方法,通過MATLAB工具進行仿真,我們以火災報警為例,通過采集到的130個樣本進行學習訓練。將火災較為重要的參數依據——溫度、煙霧濃度和CO濃度作為BP神經網絡的輸入數據。
下頁圖2為BP神經網絡訓練結果性能示意圖。由圖可見,經過161次訓練后,網絡的性能還沒有為0,但是輸出均方誤差已經很小,MSE值為9.95*10-7,小于設定的誤差限。網絡的驗證性能誤差值為3.0255*10-6,并且測試組性能誤差值也很小。其表明,該神經網絡的非線性映射關系的擬合是較為精確的,可以預見經該神經網絡擬合的預測結果應該能夠達到預期。

圖2 BP神經網絡訓練結果-MSE
接著,通過130組數據樣本學習訓練之后,利用35組數據樣本作為測試數據,以測試系統預警結果的準確性。其中,表BP神經網絡的3個輸入數據已經過分批估計和歸一化處理。測試結果如表1所示。
表1 測試數據

期望狀態溫度煙霧濃度CO濃度期望輸出實際輸出預測狀態誤差(10-5)誤差百分比(10-5)失火0.656250.16750.363750.65750.657555失火5.4575788.29981無火0.21250.411250.33750.173750.174582無火83.21686476.663失火0.8950.1850.13750.7950.795184失火18.4462523.19745無火0.328750.511250.726250.141250.139481無火-176.862-1268無火0.370.560.760.030.029653無火-34.6675-1169.09不明確0.430.430.550.510.508109不明確-189.078-372.12無火0.248750.510.680.271250.272498無火124.7598457.8383無火0.220.580.60.2750.275089無火8.89425632.33229失火0.70.180.470.670.670295失火29.4866543.99056無火0.340.5950.7550.1850.185585無火58.49253315.1793失火0.64750.1650.34250.6550.656164失火116.4476177.4671失火0.920.190.450.820.819638失火-36.2016-44.1678無火0.220.580.60.2750.275089無火8.89425632.33229無火0.410.670.750.030.031074無火107.40893456.542失火0.880.20.010.780.779951失火-4.89544-6.27659無火0.340.59250.75750.18750.187886無火38.5929205.406失火0.68250.1750.42750.6650.663802失火-119.831-180.522無火0.34750.5750.76750.15750.156037無火-146.256-937.311無火0.19750.28750.110.0750.074776無火-22.4331-300.005無火0.25750.490.680.24250.244048無火154.8391634.4608失火0.910.1850.3150.810.809515失火-48.4704-59.8759失火0.9050.18250.24750.8050.801569失火-343.111-428.049
續表

期望狀態溫度煙霧濃度CO濃度期望輸出實際輸出預測狀態誤差(10-5)誤差百分比(10-5)無火0.2150.46750.4250.20750.206499無火-100.115-484.82無火0.23250.61250.7250.318750.319226無火47.59398149.0918失火0.88250.19750.031250.78250.782801失火30.1203338.47762無火0.180.20.180.040.045548無火554.784812180.26失火0.691250.17750.448750.66750.667215失火-28.4571-42.6505失火0.880.20.010.780.779951失火-4.89544-6.27659無火0.340.590.760.190.189844無火-15.5964-82.154無火0.1850.2250.160.050.05011無火11.03056220.1256失火0.630.160.30.650.648732失火-126.849-195.534無火0.2250.6950.770.33750.336873無火-62.6559-185.992失火0.9250.1950.4650.8250.825383失火38.3158346.42187不明確0.42750.460.5750.450.449478不明確-52.1992-116.133無火0.4050.656250.751250.030.030616無火61.55642010.624
由表1可以看出,該算法對火災的預警具有很好的準確性。從作為測試的35組數據樣本分析,系統沒有誤報,準確率達到100%。另外,本組數據的實際輸出與期望輸出的誤差都很小,誤差百分比很低,絕對誤差總和為0.030109。盡管如此,預警結果依然存在著“不明確”以及某些邊界判斷爭議,但是本算法依然具有較高的實用價值。
由圖2和表1可知,本文所提出的基于改進型分批估計和BP神經網絡的數據融合算法能夠區別和剔除低質量的終端數據,提高數據的精確性,準確預測預警結果。圖3為無線傳感器網絡轉發數據包量示意圖。相比于經典的LEACH算法,本文所提出的算法具有一個較低的數據包轉發量。因為,該算法對終端數據進行了數據一致性驗證,并且做出數據融合,減少了成員節點向簇首、簇首向基站節點轉發的數據包量??梢姡摲椒軌蛉诤先哂嗟臄祿?,以減少各站點之間的數據通信消耗,使網絡生命周期最大化。

圖3 WSN內轉發數據包量示意圖
實際應用和路由設計中,尋求網絡生命周期最大化的同時,如何獲取精確可靠感知數據是一個非常值得解決的問題。本文提出了一種分批估計理論與神經網絡結合的數據融合方法。通過實驗仿真,表明該方法能夠區別和剔除低質量的終端數據,提高數據的精確性;同時它還能夠融合冗余的數據,以減少各站點之間的數據通信消耗,使網絡生命周期最大化。通過分析仿真結果,該方法確實能夠獲得較好的服務質量,并且有效進行數據融合,具有良好的性能。
[1]韓紅彥, 張西紅, 王衛國, 等. WSN 的關鍵問題及軍事應用[J]. 科學技術與工程, 2007, 7(7): 1465-1467.
[2]周一南, 周運森. 無線傳感器網絡 WSN 在工業生產實時監控中的應用[J]. 工業控制計算機, 2008, 21(8): 24-25.
[3]P. Medagliani, M. Martalò, G. Ferrari.Clustered Zigbee networks with data fusion: Characterization and performance analysis[J]. Ad Hoc Networks,2011(9):1083-1103.
[4]A.R. Pinto, C. Montez, G. Araújo, F. Vasques, P. Portugal. An approach to implement data fusion techniques in wireless sensor networks using genetic machine learning algorithms[J]. Information Fusion,2014(15): 90-101.
[5]Abdelgawad, A.; Bayoumi, M. Data Fusion in WSN. In Resource-Aware Data Fusion Algorithms for Wireless Sensor Networks; Lecture Notes in Electrical Engineering Series 118; Springer: Berlin/Heidelberg, Germany, 2012:17-35.
[6]Dhasian, H.R.; Balasubramanian, P. Survey of data aggregation techniques using soft computing in wireless sensor networks[J]. Inf. Secur, 2013, 7:336-342.
[7]張書奎, 崔志明, 龔聲蓉, 等. 基于 Bayes 序貫估計的無線傳感器網絡數據融合算法[J]. 電子與信息學報, 2009, 31(3): 716-721.
[8]Collotta M, Pau G, Scatá G. A fuzzy system to reduce power consumption in Wireless Sensor Networks: A comparison between WirelessHART and IEEE 802.15. 4[C]//Energy Conference (ENERGYCON), 2014 IEEE International. IEEE, 2014: 766-771.
[9]Collotta, M.; Messineo, A.; Nicolosi, G.; Pau, G.A Dynamic Fuzzy Controller to Meet Thermal Comfort by Using Neural Network Forecasted Parameters as the Input[J]. Energies,2014, 7:4727-4756.
[10]Feng R, Xu X, Zhou X, et al. A trust evaluation algorithm for wireless sensor networks based on node behaviors and ds evidence theory[J]. Sensors, 2011, 11(2): 1345-1360.
[11]王海濤. 基于信任度的二次數據融合的研究[D]. 昆明:昆明理工大學, 2015.
(責任編輯:覃華巧)
Research of Multi-Sensor Data Fusion in Wireless Sensor Network
Su Guodong
(School of Electronic and Information Engineering, Fuqing Branch of Fujian Normal University, Fuqing 350300, China)
The success of a Wireless Sensor Network deployment strongly depends on the high-quality of service and reliable performance it provides regarding such issues as data accuracy, data fusion and network lifetime maximization. Especially, data fusion mechanism is a challenging field. If a little number of low-quality data is taken as part of the fusion input, it is likely to have a negative impact on the entire data fusion results. In this paper, with the aim of increasing high-quality of service and reducing the energy consumption of the sensor network, the author presents a data fusion mechanism combined with the improved batch estimation with Back Propagation Neural Network (BP). The proposed approach is able to distinguish and eliminate the low-quality data and improve data accuracy. It is also able to eliminate redundant data and consequently reduce energy consumption, thus increasing the network lifetime. Finally, simulation with Matlab shows that the proposed approach has a better performance of data fusion. Moreover, compared to LEACH, it can reduce transferred packets and increasing the network lifetime.
Wireless sensor network; Data fusion; Batch estimation; BP Neural Network
2017-03-30
福建省教育廳科技類一般項目(JAT160574)
TN929.5;TP212.9
A
1673-8535(2017)03-0017-08
蘇國棟(1989-),男,福建泉州人,福建師范大學福清分校電子與信息工程學院教師,主要研究方向:無線傳感器網絡、物聯網技術。