王艷華 孫成啟 高洋等
摘要 針對無線傳感器網絡中的搭便車現象,基于博弈理論建立自私節點懲罰機制。將傳感器的可信度分為多個等級,對其進行多策略博弈,使其更加符合無線傳感器網絡的復雜性特點,從而激勵節點對可信合作策略的選取。結果表明,基于博弈理論的無線傳感器網絡中自私節點懲罰機制可以有效地解決網絡中的搭便車問題,從而驗證了該懲罰機制的有效性。
關鍵詞 無線傳感器網絡;搭便車;博弈;懲罰機制
中圖分類號 S126 文獻標識碼
無線傳感器網絡(Wireless Sensor Network,WSN)是由大量的傳感器節點構成的,其構成的方式多為自組織形式和多跳形式,這些傳感器節點可以協作地感知和處理被感知對象的相關信息,并且將所感知的信息發送給網絡的所有者[1-2]。WSN具有典型的復雜網絡特點,其應用也變得日趨復雜,因此,WSN的安全性成為一個亟待解決的問題。傳統的解決WSN的方法主要為基于密碼學的安全機制,該方法主要用來抵抗外部攻擊,然而基于密碼學的安全機制不能很好地抑制WSN內部傳感器節點的自私行為。
隨著WSN研究領域的逐漸成熟,其信任管理的研究也成為WSN領域的研究熱點。在WSN中,由于資源的有限性,傳感器節點為了獲取更多的資源而產生節點的自私行為,從而產生了WSN中的節點搭便車(Freeriding)問題。然而節點的這種自私行為嚴重影響了WSN的網絡性能以及正常運行。
因此,筆者針對無線傳感器網絡中的搭便車現象,基于博弈理論建立自私節點懲罰機制,將傳感器的可信度分為多個等級,對其進行多策略博弈,使其更加符合無線傳感器網絡的復雜性特點,從而制定更加有效的激勵懲罰機制,激勵節點對可信合作策略的選取。
1 激勵懲罰機制概述
為了解決WSN中的搭便車問題,需要引入信任管理來對傳感器節點的行為進行度量與管理,從而制定相應的激勵懲罰機制來抑制傳感器節點自私行為的產生。
調查顯示,在WSN、社會網絡以及P2P網絡中,幾乎70%的節點在交互過程中不分享任何的網絡資源,并且這些自私節點對分享信息的用戶進行搭便車。在網絡中,有很少的節點愿意分享信息或為其他節點提供服務。幾乎50%的文件查找響應是來自信息分享節點頂部的1%的文件。目前,有關激勵懲罰機制的研究已日趨成熟。激勵機制算法的基本流程如圖1所示。
圖1 激勵機制算法基本流程
目前,將已提出的激勵懲罰機制分為基于節點行為的激勵方法[3-4]、基于博弈論的方法[5-6]以及采用社會網絡或經濟模型的控制策略[5,7-9]3大類。
1.1 基于節點行為的激勵方法 最早有關Freeriding問題的抑制方法是基于節點行為的激勵方法,該方法得到了廣泛的應用。有關基于節點行為的激勵方法中的一些相關問題,如如何計算節點信譽度等,已經成為WSN等網絡的研究熱點。有關效用函數的定義、度量以及選擇等問題,是不同的基于節點行為激勵方法之間的差異[10]。該方法可以有效地防止自私節點的欺騙行為,并激勵節點遵守網絡中的相關協議。
然而,在實際應用中,由于分布式的測量和監視機制,節點之間相互監視而產生大量的開銷;并且網絡的高密度,使產生節點由于監視鄰接節點而增加其負擔等問題。
1.2 基于博弈論的方法 由于WSN的復雜性,因此可以將節點的行為建模為長期的博弈過程。節點有多個策略進行選擇,如為系統做貢獻,只接收信息不發送信息以及貢獻收益平衡等,從而使得自身獲得最大的收益?;诓┺恼摰姆椒ㄊ菍濣c策略的選擇進行分析,對網絡中節點的不同策略進行博弈,從而分析出它們之間的關系[11]。
然而在實際的WSN、社會網絡以及P2P等復雜網絡的激勵機制研究中,基于博弈論的方法存在以下兩大主要問題:①目前的基于博弈論的激勵機制,大多針對的是兩策略進行博弈,即完全合作和完全不合作,然而在真實的復雜網絡中,網絡中節點的策略存在復雜性,因此兩策略博弈不能滿足真實網絡中策略的復雜性特點;②現有的基于博弈論的激勵機制中,所提出的假設太嚴格,與真實的復雜網絡環境存在較大的差異,因此,所得到的納什均衡的準確性較低。
1.3 基于社會網絡或經濟模型的控制策略 在WSN、社會網絡以及P2P網絡等復雜網絡中,節點的自私行為是用戶個人心理因素的一種延伸,因此可以采用社會網絡或者經濟模型來研究個人在社會行為中的自私行為。
然而采用社會網絡或經濟模型的控制策略大多需要有一個集中式的第三方來對節點的可信行為進行審計。因此,該方法的可擴展性較差,從而制約了WSN、社會網絡以及P2P網絡等復雜網絡的發展,并且在可信度的計算方面很難得到網絡中所有節點的認同。因此,由于復雜網絡的動態性和復雜性特點,這種需要第三方來審計的方法難以實現。
針對以上激勵懲罰機制的不足,基于WSN的特點,該研究基于博弈理論研究WSN的自私節點懲罰機制,將傳感器的可信度分為多個等級,對其進行多策略博弈,使其更加符合WSN的復雜性特點,從而制定更加有效的激勵懲罰機制,激勵節點對可信合作策略的選取。
2 基于博弈理論的懲罰機制
傳統的基于博弈理論的激勵懲罰機制大多針對的是兩策略博弈理論,即將節點的行為分為兩類策略:自私策略和可信合作策略。則對稱博弈收益矩陣如表1所示,且滿足D>T>S>C,2T>C+D。也就是說,博弈雙方都選擇可信合作策略能夠獲得總體的最高收益。那么,不論對手采取哪種策略,選擇自私策略都是最佳選擇,也就是理性的個體最終會選擇自私的策略。這種自私的狀態就是系統的納什均衡狀態。
在WSN中,當自私節點與可信合作節點進行博弈時,自私節點通過損害可信合作節點的利益而使自己獲得利益,其行為違背了公平規范。因此,為了抑制WSN中傳感器自私節點的產生,該研究提出基于博弈理論的自私節點懲罰機制,從而提高可信合作策略的節點收益,降低自私節點的收益,激勵節點對可信合作策略的選擇。則自私節點的懲罰機制滿足下面3個特點:
①鼓勵傳感器節點分享信息和提供服務;
②為傳感器節點提供公平的差異化服務;
③最大化WSN的總體收益。
因此,如果博弈個體受到公平規范的影響,那么自私節點的效用收益就會因為破壞公平造成的“內疚”而降低,而可信合作節點的效用收益則會因為非信任個體違反公平造成額外的“不滿”而增加。
針對該懲罰機制的特點,基于表1中兩策略博弈的收益矩陣中的各個策略的收益值,該研究給出加入懲罰機制后的收益計算方法,如式(1)所示。其中,T*、C*、D*以及S
由于WSN具有復雜網絡特性,因此需要將傳感器的行為分為多個等級,需要在兩策略博弈的基礎上進行多策略博弈。該研究將傳感器節點的行為分為4個等級,假設當兩個節點進行博弈時,兩個傳感器節點的行為等級分別為i和j,且i,j∈(1,2,3,4)相應的收益分別為xi和xj,則加入懲罰機制的多策略收益值計算方法如式(2)所示,假設i 3 模擬試驗與結果分析 該研究通過模擬試驗來驗證該信息傳播模型的有效性。硬件試驗環境為Intel Core(TM) i5-3230M CPU @2.60GHz,12.0 GB內存,采用Windows 8操作系統,用Matlab 7.0編程平臺。 該研究模擬WSN中的1 000個不同策略的傳感器節點數量變化的演化趨勢,來驗證所提懲罰機制的有效性。圖2所示為沒有加入懲罰機制的多策略博弈演化結果。從圖2可以看出,在沒有加入懲罰機制時,自私節點主導了整個網絡的演化方向,也就是產生了搭便車現象。 加入該研究提出的懲罰機制后,模擬試驗結果如圖3所示。從圖3可以看出,加入基于博弈理論的無線傳感器網絡中自私節點的懲罰機制后,選擇可信合作策略的傳感器節點最終主導整個WSN的演化方向;并且選擇自私策略的傳感器節點在網絡中將最終消失。由此可見,該研究提出的懲罰機制可以有效地解決WSN中的搭便車問題,從而驗證了該懲罰機制的有效性。 4 結語 該研究針對WSN中的搭便車現象,基于博弈理論建立自私節點懲罰機制,將傳感器的可信度分為多個等級,對其進行多策略博弈,使其更加符合無線傳感器網絡的復雜性特點,從而制定更加有效的激勵懲罰機制,激勵節點對可信合 作策略的選取。試驗結果表明,基于博弈理論的WSN中自 私節點懲罰機制可以有效地解決網絡中的搭便車問題,從而 驗證了該懲罰機制的有效性。 在未來的工作中,將進一步研究WSN的復雜特征,建立更加有效的激勵懲罰機制來激勵節點對可信合作策略的選擇,從而提高WSN的整體性能。 參考文獻 [1] YICK J,MUKHERJEE B,GHOSAL D.Wireless sensor networks survey[J].Computer Networks,2008,52:2292-2330. [2] HAN G J,JIANG J F,SHU L,et al.Management and applications of trust in Wireless Sensor Networks:A survey[J].Journal of Computer and System Sciences,2014,80(3):602-617. [3] ZGHAIBEH M,ANAGNOSTAKIS K G.On The impact of P2P incentive mechanisms on user behavior[R].NetEcon + IBC,2007:1-6. [4] 謝曉蘭,劉亮,趙鵬.面向云計算基于雙層激勵和欺騙檢查的信任模型[J].電子與信息學報.2012,34(4):812-817. [5] MA R T B,LEE S C M,LUI J C S,et al.Incentive and service differentiation in P2P Networks:A game theoretic approach [J].IEEE/ACM Tranon Networking.2006:978-991. [6] 張煜,林莉,懷進鵬,等.網格環境中信任-激勵相容的資源分配機制[J].軟件學報,2006,17(11):2245-2254. [7]WANG Y,VASSILEVA J.Super-agent based reputation management with a practical reward mechanism in decentralized systems[C]//4th IFIP WG11.11 International Conference on Trust Management.Iwate,Japan,2010:33-40. [8]WANG Y,ZHANG J,VASSILEVA J.Effective web service selection via communities formed by superagents[C]// Proceedings of the IEEE/WIC/ACM International Conference on Web Intelligence.WI,Toronto,Canada,2010:444-451. [9] GHAFFARINEJAD A,AKBARI M K.An incentive compatible and distributed reputation mechanism based on context similarity for service oriented systems[J].Future Generation Computer Systems,2013,29(3):863-875. [10] 胡建理,周斌,吳泉源.P2P網絡中具有激勵機制的信任管理研究[J].通信學報,2011,32(5):22-32. [11] 張娓娓,陳綏陽,余洋.基于博弈論的P2P激勵機制[J].計算機工程,2011,37(15):89-102.