陳 莎 ,高紅菊,劉艷哲,梁 棟,伍 丹
(1.中國農業大學 信息與電氣工程學院,北京 100083;2. 農業部信息中心 數據資源處,北京 100125;3.農業部干部管理學院,北京 102208)
?
基于JN5139的農田無線傳感器網內數據融合研究
陳莎1,高紅菊1,劉艷哲1,梁棟2,伍丹3
(1.中國農業大學 信息與電氣工程學院,北京100083;2. 農業部信息中心 數據資源處,北京100125;3.農業部干部管理學院,北京102208)
摘要:在無線傳感器網絡中,各個節點的存儲能力、通信能力、計算能力及能源的供給都十分有限,因而運用網內數據融合算法消除冗余數據,減小數據傳輸量,從而達到節省功耗、延長節點生命周期、提高數據采集效率和準確度的目的。介紹了系統結構及主要模塊JN5139,采用簡單滑動平均法、指數平滑法及自回歸滑動平均模型(ARMA),在分析大量WSN數據的基礎上,利用時間序列對數據進行建模預測,提出了適合WSN的數據處理模型并用MatLab進行仿真,之后將程序燒寫到節點中進行試驗。試驗表明:該方法在保證采集數據可靠性的前提下有效地減少了網絡的耗能,延長了網絡的生命周期。
關鍵詞:無線傳感器網絡;數據融合;時間序列預測模型;能量消耗
0引言
隨著無線傳感器網絡WSN(Wireless Sensor Network)的發展,無線傳感器網絡[1]成為了當前國際研究熱點。無線傳感器網絡節點數目龐大,其節點一般攜帶有限的、不可替代的能源,在沒有長期可供能源的情況下,工作壽命十分有限[2],其能源的有限性成為其發展的瓶頸。感知節點主要在數據傳輸、信號處理及硬件操作上消耗能量,其中數據傳輸消耗能量最多,因此,需要首先解決的是如何實現傳感器網絡在能量有限的情況下實現復雜的數據監測和信息報告。
數據融合(Data Fusion)是WSN中一項十分重要的技術,將傳感器采集到的原始數據通過該技術進行模型融合運算處理,從而減少冗余數據[3],只將有價值的、變化的數據傳送到網關節點,不僅提高了數據收集的效率,同時還節省了傳輸數據所消耗的能量,有效地減少了能源的開銷,達到延長了網絡節點的使用壽命的目的。
1無線傳感器網絡系統架構機構
具有代表性的無線傳感器網絡的系統由分布式無線傳感器節點、 匯聚節點、通信衛星或互聯網以及任務管理節點[4]組成,如圖1所示。其中,A-E代表隨機部署在感知區域內部的分布式無線傳感器節點群,這些節點群對本地信息進行采集與處理。節點之間可通過自組織方式構成網絡,并由無線方式采用多跳路由將采集的數據傳輸至匯聚節點。匯聚節點直接與傳感器網絡、Internet等外部網絡相連,通過GPRS網絡將收集的數據轉發至外部網絡。用戶即可訪問農田信息監測平臺,查詢相關信息進行分析處理,從而指導農業生產。

圖1 無線傳感器網絡系統架構
本文節點系統的主體選用Jennic公司生產的JN5139模塊,節點及模塊如圖2所示。JN5139系列模塊是基于Jennic第二代無線微控制器的低功耗無線通訊模塊,其存儲能力、運算能力有限[5],使得很多計算復雜的模型都不適用。若采用的融合算法復雜度過高,不但不能節省能量,可能會加大能量的開銷,故采用算法較簡單的模型,在確保預測結果準確性的情況下,盡可能減小算法的復雜度。傳感器采集的數據以平穩性、周期性數據為主,時間序列模型能有效地描述其特征。運用基于時間序列的數據融合算法進行網內數據融合可減少數據冗余,提高其采集效率,延長整個網絡的使用壽命。

圖2 節點電路板圖
2網內數據融合算法設計
時間序列數據一般都為季節型、水平型、周期型、線性趨勢型和非線性趨勢型其中之一[6],可根據數據類型的不同,合理靈活選擇預測分析模型。在無線傳感器網絡感知節點進行網內數據融合,系統首先設定一個容忍閾值,在一個采樣周期內,在獲取充分的歷史數據之后,根據預測模型對即將要采集的數據進行初步預測,計算采集的真實數據與預測數據之間的差值。當預測值與真實值的差值小于容忍閾值時,表明預測合理,系統不傳輸數據,遠端平臺直接進行同樣的預測模型,將該預測值顯示在服務器中;當預測值與真實值的差值大于容忍閾值時,表明預測不合理,系統將進一步發送該數據。系統的主要思想即為根據歷史數據預測未來數據,若預測合理,該數據不傳輸,減少了無線傳感器網絡節點數據的傳輸量,從而可減少感知節點能量的消耗,延長整個網絡的使用壽命。
在一個采樣周期的節點的工作流程如圖3所示。這種融合方法在滿足觀測者對于數據準確性要求的前提下,盡可能地減少感知節點與網關節點之間的數據發送量,同時具有實時監測數據變化并自適應調節的能力,使得該系統不會漏檢突發事件。

圖3 感知節點數據融合流程圖
2.1簡單滑動平均法
簡單滑動平均法基本原理為把大量歷史時期所統計的數據作為觀察值,求出算術平均數作為預測值。該方法適用于數據變化范圍小、方差小變化趨勢不大的數據類型,該模型假設“過去這樣,今后也將這樣”。預測值為
(1)
式中Ft+1—對下一周期數據的預測值;
n—滑動平均個體樣本;
xt—t時刻感知節點采集的真實值;
xt-1、xt-n+1—分別表示t-1時刻采集的真實值和前t-n+1時刻采集的真實值。
隨著樣本n的增加,平滑作用將加強。若數據出現大的波動性,預測數據將出現大的誤差。
2.2指數平滑法
指數平滑法基于歷史實際采集值和預測值,要求的數據量小,只要求上一周期的實際采集值以及上期的預測值,便可預測下一周期的估計值,同時該模型不舍棄往日的歷史數據;歷史數據賦予逐步減小的影響因子,給予不同時期的數據不同的權重,減少了較遠時期數據對模型的影響程度。模型通過2個數據的計算進行預測,減少了數據的處理時間、能量消耗及存儲量,十分適合短期預測。指數平滑公式為
Ft+1=αxt(1-α)Ft
(2)
式中Ft+1—t+1時刻指數平滑值;
α—平滑系數,0<α<1;
Ft—t時刻指數平滑值。
運用該模型可預測t+1時刻的預測值Ft+1,指數平滑法的關鍵在于平滑系數α的選取,其選取的大小直接影響預測值的準確度。在實際應用中,一般α的選取依靠預測研究人員反復測試及研究人員對數據屬性變化特性來確定。根據目前研究現狀來看,若序列比較平穩,無大的波動,α的取值一般較小,如0.1~0.3之間;若時間序列數據有明顯的變動傾向,α一般取0.6~0.9之間[7]。
2.3自回歸移動平均模型
在實際的時間序列分析系統中,ARMA時間序列分析模型被廣泛應用,它將隨時間變化的預測對象時間序列看作一串隨機數字序列,用相應的模型對這一串隨時間變化又相互關聯的數字進行近似描述。在實際應用中,首先利用感知節點采集的歷史數據進行建模,建模完畢之后即可進行未來數據的預測。該模型利用節點采集數據之間的相關性進行設計,其更容易識別異常數據,并將之剔除[8]。公式為
xt=α0+α1xt-1+…+αpxt-p+εt-
φ1εt-1-…-φqεt-q
(3)
E(εt)=0
E(εsεt)=0
s≠t
E(Xsεt)=0
?s 式中p—自回歸部分的階數; q—滑動部分的階數; αt—自回歸系數; φj—滑動平均系數。 其中,xt和xt-1,xt-2,…,xt-p為具有一定相關性的時間序列變量。 ARMA(p,q)模型含有p+q+1個未知參數,在實際應用中,一般考慮到實時檢測,如果階數p取值太大,將會產生很大的計算量。若要采用ARMA模型進行預測,則在建模之前需判定時間序列{xt}是否具有正態、平穩和零均值的特性。在時間序列中,要檢驗{xt}是否滿足正態曲線,一般只需檢驗{xt}的三階矩和四階矩是否滿足正態隨機變量的特性;之后用最小信息準則對ARMA模型進行定階。對原始數據進行預處理后再對{yt}進行建模,有 (4) 本仿真數據基于2012年11月-2013年4月為期6個月在涿州實驗地采集的土壤濕度值,以下介紹ARMA(p,q)土壤濕度擬合模型建模過程。 1)圖4(a)為傳感器感知節點采集的原始數據。首先利用公式(4)對原始數據進行零化處理得到圖4(b),可看到數據在零附件上下波動,滿足了ARMA模型建立的數據零均值特性。 (a) 原始數據 (b) 零化處理后 2)圖5(a)為原始數據的自相關和偏相關仿真結果圖,圖5(b)為零化處理之后的自相關和偏相關仿真結果圖。從自相關圖中可知:MA(q)有截尾特性,從偏相關函數圖中可看出在滯后期p之后也有截尾特征;根據自相關圖可進一步估算MA過程的階數q,根據偏相關圖可特征識別AR(p)過程的階數。 (a) 原始數據 (b) 零化處理后 3)進行殘差分析,主要分析檢驗過程是否為白噪聲,圖6為該數據的擬合殘差分析圖。 圖6 擬合殘差分析圖 由圖6可知:除了個別數據外,所擬合的模型滿足有關假設。圖7的全部數據都在置信水平0.95內,表明建立了合適的回歸方程。進一步找到合理的階數使得AIC值最小,對于土壤濕度數據,當p=2,q=1時,AIC=-2.610 3為最小值,故建立預測土壤濕度的ARMA(2,1)模型。 圖7 殘差自相關和偏相關函數圖 3網內數據融合算法實現 3.1仿真實現 3.1.1土壤濕度仿真實現 本研究采用3 975個土壤濕度數據中的3 825個數據預測150個數據,進行模型的建立,對以上介紹的3種算法分別進行模型的建立與驗證。 運用簡單滑動平均算法時,考慮到結果的準確性以及計算量的大小,本研究采用n=10,進行滑動預測。根據涿州采集土壤濕度進行仿真驗證,其效果如圖8所示。從圖8可看出:預測結果與真實結果較接近,但不能很好預測數據突變情況。 圖8 簡單滑動平均法預測土壤濕度效果圖 運用指數平滑法對土壤濕度進行預測,本研究中,數據的波動起伏較大,經過MatLab仿真及推導最終采用α=0.6的參數進行模型構造,預測值與真實值如圖9所示。該預測模型運用少量的數據,預測效果較好,與真實值較接近,可較大程度上預測土壤濕度值。 圖9 指數平滑法預測土壤濕度效果圖 圖10 ARMA土壤濕度預測效果圖 3.1.2空氣溫度仿真實現 本研究采用在涿州試驗采集的3 482個數據進行模型的建立。由于空氣溫度成周期性實時變化,數據變化較快,下午2:00左右溫度最低,凌晨4時左右溫度最高,數據實時變化較快,因此采用n=2的簡單滑動平均模型,預測效果較好,如圖11所示。 圖11 簡單滑動平法預測空氣溫度效果圖 由于溫度變化較快,故指數預測模型中選用α=0.8的參數進行數據預測,預測效果如圖12所示。 圖12 指數滑動平法預測空氣溫度效果圖 3.1.3空氣濕度仿真實現 本研究采用在涿州試驗田感知節點采集的3 482個數據進行模型的建立。由于空氣濕度成周期性實時變化,數據變化較快,與溫度差不多相反,下午2:00左右濕度最低,凌晨4時左右濕度最高,數據實時變化較快。因此,采用n=2的簡單滑動平均模型,預測效果較好,如圖14所示。 圖13 指數ARMA預測空氣溫度效果圖 圖14 簡單滑動平法預測空氣濕度度效果圖 由于濕度變化較快,故指數預測模型中選用α=0.8的參數進行數據預測,預測效果如圖15所示。 圖15 指數滑動平法預測空氣濕度度效果圖 圖16 ARMA預測空氣濕度度效果圖 3.1.4CO2濃度仿真實現 本實驗根據自己在實驗室進行長達3個月采集的3 486個數據,根據其中3 336個數據進行建模,對剩下150個數據進行模擬。簡單滑動平均法采用n=3,預測效果如圖17所示。 圖17 簡單滑動平法預測CO2濃度效果圖 在CO2濃度數據中,CO2濃度每天都有規律的變化,在夏季,下午2時左右CO2濃度最低,晚上3:30左右CO2濃度最高,其數據波動性大。通過分析計算,在指數滑動平均算法中采用α=0.8進行數據的預測,其預測效果圖如圖18所示。 圖18 指數滑動平法預測CO2效果圖 圖19 ARMA預測CO2濃度效果圖 3.2實地實驗 為驗證仿真預測模型理論預測效果、預測模型是否能運用于實地環境,以及是否節省了感知節點能量的消耗、延長了整個網絡的使用壽命,基于JN5139主要模塊的硬件平臺,將模型在Jennic平臺CodeBlocks環境下運用C語言進行編寫,完成之后運行生成bin文件,再運用Flash Programmer1.8.9將bin文件燒寫至JN5139,從而進行實地實驗。 本研究對土壤濕度、空氣溫濕度及CO2濃度進行模型編寫與試驗,采用以上介紹的3種模型,同時進行實地驗證。本實驗采用4個感知節點傳感器,其中1號感知節點燒寫沒有數據融合的示例程序,30min發送1次數據的程序;2號燒寫簡單滑動平均算法程序;3號燒寫指數滑動平均算法程序;4號燒寫ARMA模型算法程序。 為避免外界環境因素的干擾,保證數據融合預測模型的有效性與正確性,本實驗將土壤濕度傳感器放置同一環境中,感知節點放置同一地理位置,保證其所處外界環境一致,土壤濕度、空氣溫濕度實驗地點為中國農業大學信息與電氣工程學院樓頂,CO2濃度實驗地點為實驗室內(另一個置于支架背后),實地效果如圖20所示。 圖20 實地實驗圖 節點持續運行3個月,選取1個星期的實驗數據結果進行分析對比得出結果,如表1所示。從表1可知:有數據融合的2、3、4號節點明顯比沒有融合的1號節點發送次數少;4號節點燒寫ARMA模型融合效果最好。為了驗證融合模型的可靠性,本實驗結束后,在接收平臺用對應的模型對未發送的數據進行恢復,恢復的數據再與1號節點的數據進行比較,得出90%以上恢復的數據與1號節點采集的真實數據相差小于等于設定的相應閾值,從而驗證了上述3種模型的可靠性。因此,運用數據融合可有效減少數據的發送,從而減少了發送數據所需能量,增加了無線傳感器網絡的使用壽命。 表1 數據融合實地結果分析 4節點使用壽命的估計 在整個無線傳感器網絡中,數據傳輸消耗的能量最多;但增加算法的復雜度及能量的消耗。因此,需要找到一個平衡點在一個周期內使系統自身算法消耗的能量小于數據傳輸所消耗的能量。本研究中在JN5139模塊中采用了3組融合算法,對比1個周期(30min)內有傳輸與無傳輸能量的消耗情況。感知節點中能量主要的消耗為 E=EWake+ERead+ECCA+ETransmte+Esteep(5) 其中,EWake+代表從睡眠中喚醒所消耗的能量,ERead代表從傳感器讀取數據所消耗的能量,ECCA代表對空閑信道評估所消耗的能量,ETransmte代表傳輸含64字節的數據幀至網關節點所消耗的能量,Esteep為1周期內所消耗的能量。 在應用程序與PAN Coordinator相關聯的情況下,應用程序代碼還需要16字節的存儲空間,系統運行的所消耗的電量可通過每個模塊的電流與每個模塊循環周期所需要的時間的乘積進行計算。在1個周期內發送數據,并且沒有數據融合算法系統所消耗的總能量為2 403.72μC,其計算詳細過程如表2所示。 從表2中可以看出:傳輸數據消耗的能量遠遠大于其它階段。如果在系統中增加算法,那么從休眠中喚醒所消耗的能量將會增加,但數據傳輸所消耗的能量會減少。用ARMA預測模型為例來計算能量的消耗情況,從睡眠中喚醒所需的時間增加到14.75ms,從而增加78.902 5μC電量消耗,同時減少數據傳輸所消耗的96.064μC。因此,總體看來ARMA預測模型的運用1個周期內能量大約減少了17.159μC。由此計算,若傳感器部署于大田6個月,運用預測模型之后所傳輸的數據少于原來數據的50%。因此,運用本文研究的簡單滑動平均算法、指數滑動平均算法、ARMA在很大程度上節省了感知節點能量的消耗,為整個無線傳感器網絡延長了使用壽命。 表2 能量消耗詳細分析表 5結論 本研究基于JN5139的網內數據融合算法,通過減少冗余信息的發送,傳輸有價值的信息,減少了能量的消耗,從而延長其生命周期。通過模型的選取、MatLab仿真和算法程序進行C語言編寫,最后燒寫到節點進行實地實驗。結果表明:簡單滑動平均算法、指數滑動算法和ARMA算法模型在保證采集數據可靠性前提下減少了節點能量的消耗,延長了整個網絡的壽命。 無線傳感器網絡在精細農業以及農業現代化中運用十分廣泛,感知節點對農田環境信息實時、長期地采集有助于農戶長期掌握農田環境信息,對農業的生產實施提供參考依據,對實施精細耕作有著重要意義。 參考文獻: [1]孔鵬,余鎮危.無線傳感器執行器網絡關鍵技術綜述[J].傳感器與微系統,2014,33(2):4-8. [2]張永梅,楊沖,馬禮,等.一種低功耗的無線傳感器網絡節點設計方法[J].計算機工程, 2012, 38(3):71-73. [3]何受倩.現代優化技術在無線傳感器網絡中的應用[J].計算機科學,2014, 41(6A):329-330. [4]Akyildiz L F, W Su Y Sankarasubramaniam, E Cayirci. Wireless Sensor Networks: A Survey[J]. Computer Networks,2002,38(4):393-422. [5]梁棟,高紅菊,李偲鈺,等.無線傳感器網絡終端節點設計與實現[J].農業網絡信息,2012(4):91-98. [6]史浩山,楊俊剛,李田.無線傳感器網絡時間序列流量預估算法[J].中國電子科學研究院學報,2010,5(2):120-125. [7]齊馳,侯忠生.自適應單指數平滑法在短期交通流預測中的應用[J].控制理論與應用,2012,29(4):465-469. [8]文軒,蔣文賢.無線傳感器網絡中一種ARMA流量預測的擁塞控制算法[J].小型微型計算機系統,2012,33(5): 1098-1103. In Network Data Fusion for Agricultural Information on Wireless Sensor Nodes Based on JN5139 Chen Sha1, Gao Hongju1, Liu Yanzhe1, Liang Dong2, Wu Dan3 (1.College of Information and Electrical Engineering, China Agricultural University, Beijing 100083,China; 2.Ministry of Agriculture Information Center,Beijing 100125,China; 3.Agricultural Management Institute of Ministry of Agriculture, Beijing 102208,China) Abstract:In wireless sensor networks, the storage capacity of each node, communication capabilities, computing power and the supply of energy are very limited.By in network data fusion algorithm to eliminate redundant data, reduce the amount of data transferred,so as to achieve the purpose of saving power,prolong the life cycle of the nodes and improving the efficiency of data collection and accuracy. This paper describes the system structure and the main module JN5139, using a simple moving average,exponential smoothing and autoregressive moving average model (ARMA).On the basis of analyzing large data of WSN, proposed data processing model which fit for WSN and to simulate with Matlab.Field experiments conducted after verifying the simulation model.Experiments show that under the premise of ensuring the correctness of the data,the method is effective in reducing the energy consumption of the network, thus extending the network lifetime. Key words:wireless sensor networks; data Fusion; time series forecasting model; energy consumption 文章編號:1003-188X(2016)05-0006-09 中圖分類號:S159-3;S126 文獻標識碼:A 作者簡介:陳莎(1991-),女,湖北當陽人,碩士研究生,(E-mail)chenshacau@126.com。通訊作者:高紅菊(1972-),女,河南鹿邑人,副教授,博士生導師,(E-mail)hjgao@cau.edu.cn。 基金項目:國家自然科學基金項目(31371531) 收稿日期:2015-04-27
























