劉 芳,馬爭先
(1.廣西財經學院 實驗教學中心,廣西 南寧 530003;2.格力電器股份有限公司,廣東 珠海 519070)
基于馬爾可夫博弈的WSN功率控制研究
劉 芳1,馬爭先2
(1.廣西財經學院 實驗教學中心,廣西 南寧 530003;2.格力電器股份有限公司,廣東 珠海 519070)
無線傳感器網絡中的節點能量有限、工作環境復雜,易導致節點能量消耗不均,節點耗能不均將極大地縮短網絡生命周期。針對無線傳感器網絡中節點能量有限和耗能不均問題,建立了一種基于馬爾可夫博弈的功率控制模型。該模型引用分簇結構,確定研究對象為簇頭節點;引入多信道技術,不同信道使用不同概率調節各自簇頭節點的發射功率來降低節點之間的相互干擾,進行節點功率優化;通過迭代方式進行功率和概率補償,求解功率控制模型中的納什均衡,使節點發射功率達到最優,達到整個網絡節點能量的均衡消耗,延長網絡生命周期。仿真結果表明,該模型在網絡節點能量消耗的均勻程度、加強節點之間的合作、減少節點間信道競爭和延長網絡生命周期上都有顯著效果。
馬爾可夫博弈;功率控制;納什均衡;無線傳感器網絡
綜合無線通信、傳感器和分布式信息處理技術的無線傳感器網絡(Wireless Sensor Network,WSN)已經成為當前涉及多學科高度交叉、知識高度集成的前沿熱點研究領域。其在環境檢測、戰場監視以及交通流量監測等方面應用廣泛[1-2]。然而,無線傳感器網絡由大量微型傳感器組成,傳感器節點不僅能量有限、成本高、體積小,而且節點繁多、工作環境復雜,更換電池或電池充電較難。如何在有限能量的條件下最大化網絡生命周期是傳感器網絡面臨的首要挑戰。
功率控制技術能夠有效降低能量消耗,是延長傳感器網絡使用壽命的有效手段[3]。CLUSTERPOW路由協議[4]使用不同的傳輸功率對不同的目的節點能夠保證通信的最小發射功率,但節點要維護路由表,增加網絡能量的消耗。CLUSTERPOW-DSDV路由協議[5]對CLUSTERPOW路由協議進行改進,降低路由開銷。Chaturvedi A等[6]對標準協議進行改進,提高了網絡吞吐量。Harold S等[7]提出的協議以最大傳輸功率計算發送數據需要的最小發射功率,以最小發射功率進行通信,但最大功率會使能量消耗過多并增加信道相互干擾的概率。Vejarano G等[8]提出了一種分布式最優化吞吐量的功率分配算法,增加網絡吞吐量。
上述算法和協議從節點單方面進行能量優化,不能優化整個網絡能量消耗。針對無線傳感器網絡中的耗能問題,在現有功率控制算法和協議的基礎上,引入馬爾可夫博弈,給出了基于馬爾可夫博弈的功率控制模型(MGTPC)。該模型能夠有效調節能量的均衡消耗。
無線傳感器網絡不同于傳統的無線網絡,其所有節點都向匯聚節點傳輸數據,屬于多對一的通信網絡。到匯聚節點距離不同可能導致能量使用不均,從而使局部節點過早死亡,引起網絡拓撲結構的變化[9]。在傳感器網絡中,為保證原有覆蓋范圍內的數據通信,節省節點能量,使用分簇式體系結構[10]。網絡節點包括簇頭節點和簇內節點(普通節點),簇頭節點對簇內節點進行管轄,如圖1所示。

圖1 簇結構
傳感器網絡中研究的對象即為簇節點,簇內節點把數據傳輸給簇節點,簇節點收集數據并直接或間接地向匯聚節點發送,簇節點之間的通訊是雙向的。無線傳輸過程存在噪音干擾,為抑制信噪比,節點會提高發射功率。當所有節點都提高發射功率,將占有很大范圍的頻率,浪費節點能量,并出現干擾現象。為了避免數據擁塞和相互干擾現象,假設每個簇被劃分為n個數據傳輸信道(數據傳輸)和1個控制信道(確定簇節點工作狀態)。
節點啟動后,若在一段時間內沒有接收到其他節點發送的控制信號,節點將向其他節點發送控制信號,成為簇頭;節點若接收到控制信號,則不成為簇頭。簇頭形成后,其他節點向簇頭節點發送信息確定節點所在的簇。簇節點會把簇內節點的相關信息保存到自己的節點列表中。簇形成后,簇內節點必須通過單跳的形式給簇頭節點傳遞信息,簇頭節點向匯聚節點傳遞數據根據能量消耗的最優方式來選擇單跳或多跳。若簇頭節點的能量消耗過多,簇頭節點將自動成為普通節點,其他節點根據自身的能量情況,成為新的簇頭節點并進行通信。簇內的通信都是固定的單跳通信,如簇頭能量不多時可以自行調整。研究重點是簇頭之間的通信,研究對象也是簇頭節點。
2.1 模 型
無線傳感器網絡的功率控制,引入多信道技術,采用不同功率進行通信。若功率過大,會浪費能量;反之會增加通信的信噪比,無法保證通信質量;功率相近會產生干擾[11]。為解決上述問題,通過建立馬爾可夫博弈模型進行功率控制。不同信道使用不同概率進行功率發送,從而避免能量浪費,增加通信信噪比,降低節點之間的相互干擾程度。假設有C個簇節點,每個節點有m個數據傳輸信道。馬爾可夫博弈模型為:
Γ=(A,S,P,G,R)
(1)
其中,A表示參與者的集合,研究的網絡場景中有n個簇節點,ai(ai∈A)表示第i(1≤i≤n)個參與者;S表示狀態集,S={0,1},0表示節點不參與數據的轉發過程,1表示節點參與數據的轉發過程;P表示節點的發射功率,針對m個數據傳輸信道,用Pj表示第j(1≤j≤m)個數據傳輸信道的發射功率;G表示節點發射功率對應的概率,Gj表示對應Pj發送功率的概率;R表示參與者參與博弈后的收益,Ri表示第i(1≤i≤n)個參與者的收益。
2.2 參數計算
2.2.1 功率計算
2.2.2 概率計算
由于整個網絡的節點幾乎都是分布在同一環境下,檢測相同對象,所以節點數據的重要程度也應該一樣。不同信道的發射功率的概率根據節點發送數據的大小來確定。用Byte-j表示第j(1≤j≤m)個信道中要傳輸數據的大小。信道j以功率Pj發送數據的概率為:
(2)

2.2.3 收益計算
收益R為衡量策略優劣和尋求納什均衡點的標準,它為節點剩余能量和節點發送數據大小的函數。則:
R=f(E_remain)+g(Byte_send)
(3)
由于能量的單位為J(焦耳),數據大小的單位是B(比特),所以兩者之間無法直接計算,要通過歸一化處理使二者都變成無量綱的數據,從而有利于數學上的直接計算。
f(E_remain)=E_remain/E
(4)
g(Byte_send)w+1=
(5)
其中,w為通信次數。
在基于馬爾可夫博弈的功率控制模型中,針對節點發射功率選擇,通過概率的調節,進行功率分配,采用迭代方法進行功率和概率補償,從而使網絡收益函數達到最大,實現網絡功率優化。
3.1 功率和概率的調節
節點的功率必須在保證通信質量的前提下進行討論,即Pmin≤P≤Pmax。發射功率不能太大,否則會對低發射功率的節點產生“壓制作用”,使公平性降低;發射功率如果太小,通信將不能更好地抑制噪聲,從而無法保證通信質量。
控制信道發現當前發射功率不適宜或者節點之間出現相互干擾的行為時,節點將自動進行發送功率和概率的補償。
P'=P+Δ(P)
(6)
G'=G+Δ(G)
(7)
其中,Δ(P)和Δ(G)分別為補償功率和補償概率。
(8)
(9)
節點發送功率和信道發射功率的概率通過上述公式依次迭代,直至最優。
3.2 總體收益
在n個簇頭節點的網絡中,每個節點有m個數據傳輸信道。節點i的功率矩陣為:
(10)
通信時間間隔矩陣為:
(11)
狀態矩陣為:
(12)
其中,sij∈{0,1}。
則節點i的耗能為:
E_consumei=Pi×Si×ti=
(13)
節點i發送數據大小為:
Byte-sendi=[Byte-send1,Byte-send2,…,
(14)
節點的剩余能量為:
E_remaini=E-E_consumei
(15)
將式(14)和式(15)帶入式(3)求出節點i的收益:
Ri=f(E_remain)+g(Byte_send)
(16)
則:
(17)
通過迭代求出(P*,G*),使之滿足R-all(P*,G*)≥R-all(P,G),即R-all最大,此時(P*,G*)為納什均衡點。
4.1 仿真環境
使用PRISM和MATLAB作為仿真工具,為評估基于馬爾可夫博弈的功率控制模型的性能,將已有的功率控制模型進行比較。
實驗參數如表1所示。
為了說明基于馬爾可夫博弈的功率控制模型更具一般性,在目標區域內采用隨機生成節點的方法,所研究的節點均為簇頭節點。隨機生成80個節點的分布圖,如圖2所示。
4.2 網絡吞吐量
不同算法下,網絡有效吞吐量的比較如圖3所示。LSC-RPC[12]是一種基于跨層設計的能動態適應網絡變化的分簇功率控制算法;SMAC-CRPC[13]是一種通過調整發射功率的概率,減少信道沖突,實現功率控制的算法,對硬件設備的要求較高。AODV-802.11協議[14]是一種網絡經典協議。由圖3可知,所有算法的吞吐量都是隨著網絡節點數的增加而減小,因為隨著節點的增加,節點信道之間競爭比較激烈,影響了節點間的通信。

表1 實驗參數

圖2 80個節點分布圖

圖3 網絡有效吞吐量對比
LSC-RPC從網絡跨層優化的角度出發,綜合考慮能量效率和節點通信的公平性,所以該算法的有效吞吐量趨向于平滑。SMAC-CRPC協議根據最優鄰居原則,采用調用機制維護節點調度信息,從而提高網絡吞吐量,但在節點數量少的情況下吞吐量變化波動大。由于引入基于馬爾可夫博弈,加強了節點之間的合作,減少了節點之間的信道競爭,而且隨著節點的增多變化趨勢趨于平穩。
4.3 剩余能量
當任意節點出現能量剩余低于40 J的時候,仿真實驗終止,比較這種情況下的節點剩余能量。圖4給出了四種協議下,節點ID號為5,10,…,80的節點能量剩余圖。

圖4 節點能量剩余對比
由圖4可知,MGTPC中節點能量剩余曲線較平穩,節點的能量剩余方差也相對較小,節點耗能更接近于均勻。MGTPC可以有效提高網絡節點能耗的均勻程度,有效延長網絡生命周期。
針對無線傳感器網絡節點耗能不均問題,定義了基于節點功率和信道控制的博弈模型,成功引入馬爾可夫博弈,建立了基于馬爾可夫博弈的功率控制模型。仿真實驗結果表明,與其他模型相比,所定義的模型有效地增加了網絡節點能耗的均勻程度,延長了網絡生命周期,并提高了網絡的有效吞吐量。
[1] 馬爭先,董榮勝,王玉斌,等.針對竊聽問題的馬爾可夫博弈路由模型的研究[J].計算機科學,2011,38(11):34-36.
[2] 張 法,Antonio Fernandez Anta,王 林,等.網絡能耗系統模型及能效算法[J].計算機學報,2012,35(3):603-615.
[3] 于 凱,謝志軍,金 光,等.基于功率控制的無線傳感器網絡MAC協議研究[J].傳感技術學報,2013,26(9):1297-1302.
[4] 張文彬,楊孝宗.改進的路由協議BLOCKING-COMPOW[J].計算機工程與應用,2011,47(16):89-92.
[5] Rahman J,Hasan M A M,Lslam M K B.Comparative analysis the performance of AODV,DSDV and DSR routing protocols in wireless sensor network[C]//Proceedings of the ICECE.[s.l.]:[s.n.],2012:283-286.
[6] Chaturvedi A,Tiwari D,Bhadoria R S,et al.Route discovery protocol for optimizing the power consumption in wireless ad-hoc network[C]//Proceedings of the CSNT.[s.l.]:[s.n.],2013:290-294.
[7] Harold S,Vijayalakshmi A.Enhanced power control MAC protocol for wireless ad hoc networks[C]//Proceedings of the ICCSP.[s.l.]:[s.n.],2012:6-11.
[8] Vejarano G,Wang Dexiang,Dubey R,et al.Distributed thro-ughput maximization in wireless networks using the stability region[J].IEEE Transactions on Parallel and Distributed Systems,2014,25(7):1713-1723.
[9] 董榮勝,馬爭先,郭云川,等.一種基于馬爾可夫博弈的能量均衡路由算法[J].計算機學報,2013,36(7):1500-1508.
[10] 劉新華,李方敏,方藝霖,等.一種基于鏈路級功率控制的分簇路由算法[J].計算機科學,2012,39(9):64-70.
[11] Azad A K M,Kamruzzaman J.Energy balanced transmission policies for wireless sensor networks[J].IEEE Transactions on Mobile Computing,2011,10(7):927-940.
[12] 劉 韜,李天瑞,談文蓉,等.基于分布式與聯合優化的無線傳感器網絡數據匯聚機制[J].通信學報,2015,36(7):18-30.
[13] 牛建軍,鄧志東,李 超.無線傳感器網絡分布式調度方法研究[J].自動化學報,2011,37(5):517-528.
[14] 沈 奔,秦 軍,萬 麗.無線Ad Hoc網絡中AODV路由算法的研究與改進[J].計算機技術與發展,2011,21(3):150-153.
Investigation on WSN Power Control with Markov Game
LIU Fang1,MA Zheng-xian2
(1.Experimental Teaching Center,Guangxi University of Finance and Economics,Nanning 530003,China;2.Gree Electric Appliances,Inc.,Zhuhai 519070,China)
It can result in imbalance of energy consuming and shortening of network life that limited energy and complex work environment of network nodes in wireless sensor network.Aiming at limited energy and imbalance of energy consuming in wireless sensor networks,the power control model is constructed based on Markov game.Referencing cluster structure,research object are cluster head nodes.Then introducing multi-channel technology,the node power can be optimized through using different probability to adjust transmit power with different channel to reduce mutual interference between nodes.Method of adopting iteration computation is used to compensate transmitting power and probability to obtain the Nash equilibrium,to optimize node transmitting power,to balance network nodes energy consumption and prolong left-time of the network.The experimental results show that the model can effectively improve the uniformity of energy consumption of network nodes,strengthen cooperation between nodes,reduce node channel competition and prolong left-time of the network.
Markov game;power control;Nash equilibrium;wireless sensor network
2016-05-17
2016-09-09
時間:2017-03-07
廣西高校中青年教師基礎能力提升項目(KY2016LX314);廣西教育科研項目(201106LX191);廣西財經學院校級課題(2016D101)
劉 芳(1984-),女,碩士研究生,講師,研究方向為網絡安全和電子商務。
http://kns.cnki.net/kcms/detail/61.1450.TP.20170307.0921.038.html
TP393
A
1673-629X(2017)04-0188-04
10.3969/j.issn.1673-629X.2017.04.042