劉 宏,何鴻燊,何 江
(1.江西理工大學 電氣工程與自動化學院,江西 贛州 341000; 2.安徽農業大學 經濟管理學院,安徽 合肥 230036)
無線傳感器網絡中傳感器節點體積微小,自身電池容量以及處理數據的能力均有限,網絡可以根據傳感器節點的能量水平被劃分為同構和異構[1]。在異構無線傳感器網絡(HWSN)的數據融合算法中,如何最小化冗余數據,減少數據傳輸總量,提高數據準確性,已經成為目前研究的核心問題。由于節點在連續周期內產生數據通常具有較高的時間相關性,基于預測的數據融合方案可以有效地降低冗余數據[2]。
文獻[3]提出基于無偏灰色馬爾科夫的預測模型,對具有時間相關性的井下溫度數據進行預測,但其數據融合效率仍需進行改善;文獻[4]針對溫室環境建立利用歷史樣本建立極限學習機模型對溫室數據進行預測,但極限學習機的參數隨機初始化,將導致模型預測的不穩定。針對以上問題,本文提出一種基于獅群優化極限學習機的數據融合算法(lion swarm optimization-extreme learning machine for data aggregation,LSO-ELMDA),該算法在區域內進行雙簇首選舉時,綜合考慮剩余能量、鄰居節點密度以及與匯聚節點之間的距離對融合簇首進行選舉,融合簇首選擇距離最近且能量充足的節點作為傳輸簇首,分散簇間數據融合與簇內通信工作能耗;在匯聚節點處建立LSO-ELM預測模型,對歷史樣本序列進行預測,傳輸簇首處通過對比預測值與真實值,決定是否傳輸數據,以延長異構網絡生命周期。
在異構無線傳感器網絡(HWSNs)中大部分的能量都被數據通信部分所消耗的情況下,需要一種既關注能量高效又能夠緩解網絡能量空洞問題的分簇技術,讓數據傳輸效率得以提升。二級異構網絡中根據能量級別將節點分為兩種類型,普通節點和高級節點。普通節點的初始能量為Enorm=E0; 高級節點在網絡中占比為m,初始能量為Eadvan=E0(1+α), 其中α為高級節點的初始能量高于普通節點的倍數;n為節點總數,網絡的總能量為
n·E0(1-m)+n·m·E0(1+α)=nE0(1+αm)
(1)
本文針對兩級能量異構模型設置雙簇首機制,將數據融合與通信傳輸工作分散于簇內不同兩個簇首節點,達到均衡網絡能量消耗的效果。為了減輕節點負載,對SEP協議中簇首選擇概率以及閾值公式進行改進,以選舉融合簇首,然后分析簇內節點的能量信息與傳輸代價對傳輸簇首進行選舉。融合簇頭負責融合來自簇內各個節點所感知的物理量數據;傳輸簇頭則負責將經過融合簇頭融合后的數據發送給Sink節點。首先由剩余能量、地理位置和節點密度對閾值公式進行改進,綜合確定融合簇首[5]。普通節點與高級節點當選融合簇首的概率分別為
(2)
(3)
對SEP中閾值公式進行改進,增加權重因子
(4)

改進后的閾值公式分別為
(5)
(6)
所有節點隨機分配0到1之間的值,如果小于給定的閾值,則選定該節點成為融合簇首。在融合簇頭選取完畢之后,各個融合簇頭將根據收到報文消息中的信息,選擇剩余能量值最大、距離自己最近的成員節點作為自己的傳輸簇頭。
獅群算法(LSO)中一共包括3種角色:獅王、母獅和幼年獅[6]。獅群進行分工協作捕獵,不同角色的獅子進行不同方式的位置更新:母獅在捕獵過程中會相互配合,一旦發現最佳食物,該位置就會立刻被獅王占領,幼年獅子成年后會受到驅逐,被驅逐的獅子需要朝最佳位置靠近。獅群算法之中的多種更新方式使得其對于高維復雜函數問題求解都具有良好的全局收斂速度,最終輸出獅王的位置,得到最優解。

(7)
(8)
(9)

擾動因子αf、αc與最大活動步長step分別表示為
(10)
(11)

(12)
極限學習機(ELM)是一種特殊的前饋神經網絡,同時也是一種具備單隱層的學習算法。相較于傳統的前饋神經網絡需要設置大量訓練參數的繁雜,極限學習機只需要設定網絡的結構,在隱含層節點的輸入權重ωi和偏差bi隨機初始化之后,不需要再做更新改變[7]。極限學習機具有設定參數少,不涉及迭代操作,泛化能力較強和預測精度高的優點,其網絡結構如圖1所示。

圖1 極限學習機網絡結構
假設樣本集大小為N個,訓練樣本表示為(xi,ti),i=1,2,…,N; ELM模型的輸出表達式為
(13)
(14)
(15)
其中,L為隱含層節點個數;ωi為第i個隱含層節點和輸出層之間的輸入權重;βi為第i個隱含層節點和輸出層之間的輸出權重;令β=[β1,β2,…,βL]L×mT,T=[t1,t2,…,tN]N×mT式(15)可以直接表示為:Hβ=Y, 其中H為隱含層的神經元輸出陣;g(x) 為無限可微的激活函數。輸出權值可以通過最小二乘法解來得到
β*=H+T
(16)
其中,H+為廣義逆矩陣,H+=(HHT)-1HT。
雖然ELM相比傳統前饋神經網絡在概念上更為簡單、計算效率更高,但在使用ELM的過程中隱藏層的輸入權重ωi和偏差bi的隨機生成會導致人為設置的輸入權重和偏差次優,這使得系統輸出具有不穩定和精度下降的缺陷。為了改善預測模型的性能,提高精度,引入獅群算法對極限學習機的輸入權重與偏差參數進行迭代尋優。算法流程如下:
(1)確定輸入權重和偏置的范圍,隨機初始化ELM輸入權重與偏置的初值;設定獅子總數、成年獅比例、最大迭代次數。
(2)輸入訓練樣本,選擇RMSE作為適應度函數,保證在迭代過程中產生的參數能夠使得極限學習機預測結果的均方根誤差最小。
(3)以輸入權重與偏置作為獅子的個體位置向量,維度為 (n+1)L, 其中n為輸入層節點數、L為隱含層節點數。
(4)按照獅王、母獅和幼年獅的位置更新公式分別更新獅群的個體位置并重復5次,更新獅王的個體位置為最優位置,每間隔5次代數后重新排序確定各角色獅子的個體位置。
(5)計算適應度值,確定均方誤差是否滿足要求或迭代次數達到所設最大迭代次數,不滿足則回到第(4)步;滿足則進行第(6)步。
(6)對最優個體進行輸出,獲得最優的輸入權重和偏差。
LSO-ELM算法流程如圖2所示。

圖2 LSO-ELM算法流程
由于傳感器精度誤差以及隨機故障等因素影響,每個傳感器節點采集到的數據序列中難以避免會出現帶噪聲或不完全的誤差問題。這些被采集的測量數據中一旦出現由誤差導致的異常數據,將對所設預測模型的精度產生不良影響,會導致預測結果誤差變大,最終使數據融合算法的可靠性下降。考慮到多數實際應用如溫室、農田的監控中節點所感知物理量(如種植園中溫度、濕度、光照等)數據時間序列均呈現為周期性規律變化,具有二次多項式的趨勢,為了消除異常數據、減少噪聲及誤差對最終融合結果的影響,匯聚節點在根據歷史數據序列建立預測模型之前需要對歷史數據進行預處理:首先采用拉依達準則去除異常數據,然后采用三次指數平滑對數據進行處理[8]。
使用拉依達準則對不合理數據進行判斷并剔除:分別計算匯聚節點存儲的歷史序列樣本數據的均值與標準差,滿足式(17)的輸入樣本為合理數據
μ-3σ (17) 第二步引入三次指數平滑模型對輸入數據進行處理,遞推如下 (18) (19) (20) 在實際應用中,大量部署無線傳感器節點會使得監控場地中節點密度過大,數據采集的過程中出現大量冗余信息,在無線傳感器網絡中節點的無線收發大約消耗占比九成的能量。為了降低無線收發部分的能量消耗,在測量比如溫度、相對濕度這類時間相關性很大的無線傳感器網絡應用場景中可以針對歷史時間序列數據建立基于預測的數據融合機制,避免冗余數據的傳輸,以達到降低傳輸數據包總數的目的,在保證數據準確性的同時,節省數據傳輸的能耗,延長網絡的存活時間。所以,本文引入一種基于獅群優化極限學習機的數據融合算法(data aggregation algorithm based on extreme learning machine with lion swarm optimization,LSO-ELMDA),達到降低二級異構無線傳感器網絡通信成本、減少冗余數據傳輸的效果。 為了節約能量,在成簇階段分別選舉兩枚功能不同的簇首:傳輸簇首與融合簇首。對監測區域的傳感器節點進行雙簇首分簇,成簇穩定之后,簇內的成員節點將感知的數據發送給融合簇首,而傳輸簇首則只負責與匯聚節點的通信,不進行物理量的感知,融合簇首對簇成員數據做出簡單融合,由傳輸簇首將數據包傳輸至Sink節點,同時向Sink節點發送簇內成員節點信息表。Sink節點處將構建LSO-ELM預測模型,通過訓練樣本數據獲得最佳輸入權值和閾值參數,在對存儲的歷史數據進行不合理數據剔除與三次指數平滑預處理后,應用獅群算法進行參數調校的極限學習機對歷史時間序列數據進行預測,由Sink節點將預測值返還給傳輸簇首節點。傳輸簇首通過判斷預測數據與真實數據之間的誤差大小是否超過設定閾值,決定是否需要將感知的新數據發送至Sink節點進行數據更新,在預測誤差允許的范圍內,能夠減少數據的傳輸總量,保持數據精度,同時節約下重復發送冗余數據的能量。LSO-ELMDA算法將數據的融合和與匯聚節點之間的通信兩個環節分開在兩個簇首節點,達到延長壽命的效果。 算法流程如圖3所示。 圖3 Sink節點與傳輸簇首節點工作流程 本文實驗在MATLAB平臺運行,實驗分為兩個部分。第一部分利用已有數據集對LSO-ELM模型進行訓練與測試,驗證預測模型的可行性。考慮異構無線傳感器網絡在現實諸如溫室大棚、農田等方面的應用,實驗數據集選用安徽農業大學實習基地,位于安徽合肥的長豐國家級現代農業產業園之中的“紅顏1983”草莓種植棚監測的數據集,在驗證二級異構網絡的情況下選擇草莓種植棚中的實時溫度數據與實時相對濕度數據,提取1000個連續采樣點,以前800組數據作為訓練集,后200組數據則用于測試集。首先對樣本數據中異常數據進行刪除、然后進行三次指數平滑以及歸一化等預處理。為了使獅群算法優化極限學習機模型預測精度與收斂情況達到均衡的最佳狀態,隱含層根據試湊法設置100個節點,激活函數選用sigmoid函數。 實驗第二部分則針對二級異構無線傳感網絡進行LSO-ELMDA算法模擬仿真,實時的數據經過源源不斷的周期采集,初始時間序列數據的個數設定為50,誤差閾值設定為0.25個單位值。仿真實驗LSO-ELMDA算法與異構M-SEP算法[9]、P-SEP算法[10]、DEEC-2算法[11]以及BPNNDA算法進行對比,在MATLAB平臺上通過對比觀察二級異構無線傳感器網絡的死亡節點數目、傳遞數據包總數目兩方面情況,驗證基于獅群優化極限學習機的數據融合算法在二級異構網絡中的性能。仿真參數設定見表1。 表1 仿真參數設置 為了更好評價LSO-ELM模型的性能,將LSO-ELM模型與BPNN模型[12]在同一數據集訓練下進行測試比較,溫度與相對濕度的預測結果對比如圖4所示。其中圖4(a)顯示“紅顏1983”草莓種植園內的溫度實際值、BPNN預測模型與LSO-ELM預測模型對比曲線。在獅群算法的參數調校下,LSO-ELM模型擬合結果逼近真實值,在前100個樣本點預測曲線的情況基本與真實值重合,而BPNN模型的預測結果前160個樣本點波動較大,且在樣本點真實數值發生變化時,預測結果的跳動幅度相對LSO-ELM模型過大即預測誤差更大,可以得出LSO-ELM模型總體溫度的預測效果優于BPNN預測模型;圖4(b)則表示為草莓種植園內相對濕度實際值、BPNN預測模型與LSO-ELM預測模型的對比曲線,其中LSO-ELM預測結果與實際相對濕度曲線吻合度較好,但BPNN模型精度較低,前150個樣本點預測結果誤差較大,預測結果無法滿足高精度的數據收集場景,對比顯示LSO-ELM模型相對濕度預測效果要優于BPNN模型。 圖4 預測值與真實值對比 圖5表示兩種預測方案下的預測誤差對比曲線。草莓種植園中溫度預測與真實值的誤差如圖5(a)所示,相對濕度與真實值的誤差對比如圖5(b)所示,能夠更為直觀表示獅群算法進行參數調校的ELM預測模型的預測結果優于BPNN預測模型,可以看出LSO-ELM模型的預測結果誤差曲線相對BPNN更接近零值,波動幅度較小。在第二部分仿真中,當誤差超過所設定的閾值0.25個單位時,將使用傳感器節點感知的真實值數據對預測時間序列樣本進行重構、更新模型,重新計算下一周期預測值,避免對二級異構無線傳感器網絡中LSO-ELMDA算法的數據可靠性產生影響。 圖5 預測誤差對比 圖6為5種針對二級異構設計的算法隨著網絡運行死亡節點數目的變化趨勢對比情況。由于LSO-ELMDA算法在二級異構網絡中采用雙簇首機制,對閾值公式增加剩余能量、節點密度與傳輸距離權重因子進行改進,成簇之后融合簇首進行簇內數據初步融合,傳輸簇首只負責進行數據傳輸不進行物理量感知,而M-SEP、P-SEP、DEEC-2這3種算法均未設計節能的數據融合方案,未針對冗余數據進行處理,數據無線收發的能耗過大所以網絡壽命相對較短;而BPNNDA算法中由于BPNN模型的預測誤差較大,在設定閾值為0.25時大于誤差閾值的樣本點數目較LSO-ELM模型多,發送感知的真實值數據的次數比LSO-ELMDA算法多,通訊能耗大于后者,所以網絡壽命相對LSO-ELMDA算法較短。通過對比,LSO-ELMDA算法由于傳輸簇首根據閾值判斷每個簇數據包傳輸與否,在誤差閾值設定為0.25的情況下能夠有效地避免重復數據的傳輸,節省冗余數據被傳輸時所消耗的能量,能夠大幅度提高能量效率,延長整個二級異構網絡的壽命。 圖6 死亡節點對比 圖7反映5種二級異構無線傳感器網絡算法在同等條件下匯聚節點所接受數據包數量的對比情況。二級異構M-SEP算法、P-SEP算法與DEEC-2算法在數據傳輸中未針對冗余數據進行改進,匯聚節點接受數據包總數分別為4.09×104、4.22×104與6.87×104。在對比下可以直觀地顯示LSO-ELMDA算法所減少的傳輸冗余數據包數量;實驗中BPNNDA算法由于預測精度較低,與設定誤差閾值的對比顯示預測誤差較大,在與LSO-ELMDA算法同等條件時數據包需不斷地向匯聚節點傳輸以對預測模型進行重構更新,接收的數據總量較LSO-ELMDA算法高,匯聚節點接受數據包總量約為3.47×104。通過對比顯示,LSO-ELMDA算法能夠大幅降低數據包的傳送,匯聚節點接受數據包總量約為2.66×104,因為算法在匯聚節點處引入LSO-ELM預測模型后,當預測數據與感知數據的誤差不超過閾值時,傳輸簇首將不發送數據包至匯聚節點,減少網絡冗余數據包的傳遞,直接將預測值作為下一周期的數據使用,能夠降低各簇與匯聚節點之間數據包傳輸總量,整體網絡所傳輸的數據包總數目被削減。 圖7 接收數據對比 數據融合算法是無線傳感器網絡中對多個傳感器節點采集的數據去除信息冗余,提高采集效率,使數據更加簡潔、準確的重要解決方案。針對草莓種植園場景下的二級異構無線傳感器網絡,考慮將HWSNs雙簇首數據傳輸機制與基于預測的數據融合方案相結合,對融合簇首的選舉閾值公式針對剩余能量、鄰居節點密度和與匯聚節點的距離3個因素增加權重因子,同時設定傳輸簇首分擔與匯聚節點之間通信的負載,并引入一種基于獅群優化極限學習機的數據融合算法,采用獅群算法對極限學習機進行參數尋優,提高預測模型的性能,在對歷史時間序列數據進行剔除異常值以及三次指數平滑預處理之后,對數據進行預測,設定誤差閾值使用預測值代替真實值,避免冗余數據的傳輸,達到降低通信能耗的目的。仿真結果表明:該算法能夠保證數據可靠性,有效降低網絡冗余數據的傳輸,使網絡數據傳輸量大幅降低,降低節點傳輸功耗,并具有較強的容錯能力。

3.2 數據融合算法流程

4 實驗仿真
4.1 實驗參數選擇

4.2 仿真結果




5 結束語