黎寶華



摘 要:研究物聯網環境下壟斷頻譜市場中兩個有限理性的服務提供商基于需求響應的價格競爭。服務提供商購買頻譜擁有者提供的頻譜,相互動態競爭提供給次用戶使用以謀求自身利益的最大化。引入動態頻譜接入,同時考慮次用戶對價格的反應,將服務提供商的動態價格策略選擇建模為演化博弈模型。通過復制動態,提出的算法收斂到演化穩定均衡(ESS)。仿真結果表明所該算法是收斂的,可以達到ESS,分析結果驗證了演化博弈算法的穩定性和有效性。
關鍵詞:動態頻譜接入;有限理性;演化穩定均衡;復制動態
中圖分類號:TP277 ? ? ? ? ?文獻標識碼:A ? ? ? ? ? ?文章編號:2095-1302(2015)01-00-03
0 ?引 ?言
在通信技術與計算機技術飛速發展的今天,智能化以超出想象的速度發展迅猛,使得信息技術對人的支撐擴展到了對物體的支撐,實現了物與物之間的通信與協作,物聯網就是在互聯網的基礎上,將其用戶端延伸和擴展到任何物品,進行信息交換和通信的一種網絡[1]。目前業界普遍認為,物聯網將會在未來得到更大規模的應用,將會引起繼計算機、Internet之后,世界信息產業的第三次浪潮。物聯網將物體攜帶信息實時采集上來,并進行信息共享和交互,實現時時、處處的“物物相連”[2,3]。物聯網最早起源于1999年美國MIT“自動識別中心”提出的“萬物皆可通過網絡進行互聯”的觀念[4]。2005年, 國際電信聯盟(ITU)在當年的ITU互聯網報告中正式對物聯網做出了定義[5]。隨后,各個國家與地區都相繼開啟了物聯網的發展之路,其中包括IBM“智慧地球”的理念,日本的“u-Japan”戰略、韓國為期十年的“u-Korea”戰略規劃以及中國的“感知中國”等,成為各國國家級發展規劃中的重要一環[6]。
在物聯網存在與發展的諸多資源要素中,無線電頻譜是當之無愧的基礎性支撐資源[7-9]。認知無線電是一種提高無線通信頻譜利用率的技術,為解決物聯網頻譜資源短缺與頻譜需求旺盛之間的矛盾提供了有效的解決途徑。由于涉及競爭問題,物聯網的頻譜資源管理屬于策略的對抗,運用博弈論來解決是一種非常奏效的辦法。借助博弈論,物聯網和現有的無線系統之間的頻譜共享在提高頻譜利用率的同時也為現有的無線系統獲得了更高的收益[10]。
本文考慮物聯網環境下兩個有限理性的無線網絡服務提供商和次用戶之間的動態頻譜接入。無線網絡服務提供商向頻譜擁有者(如美國聯邦通訊委員會FCC)租借頻譜,再將未使用的頻譜提供給次用戶共享以最大化自己的利益[11]。我們假設這兩個服務提供商可以通過價格策略動態競爭潛在的次用戶。次用戶的響應通過接受概率建模,反應其購買服務商提供的服務的意愿。同時引入演化穩定策略從動態的角度研究服務提供商的價格選擇過程,并且考慮了次用戶的響應;此外,有限理性的服務提供商可以根據我們提出的演化算法動態調整他們的策略達到演化穩定均衡。
1 ?系統模型
考慮含有兩個有限理性認知移動服務提供商的壟斷無線通信系統,兩個服務提供商向同一個頻譜擁有者租借頻譜,并且在有限區域內相互進行價格競爭提供服務給終端的次用戶。假設次用戶都具有認知功能,模型如圖1所示。在競爭過程中,兩個服務提供商都最大化各自的收益,因而兩者是非合作博弈。此外,假設次用戶可以自由選擇任一個虛擬服務提供商。
圖 1 ?系統模型
考慮次用戶對服務提供商定價策略的反應十分重要。因此,引入接受概率B(v,p),其中v為次用戶的效用函數,p是服務提供商公布的價格。接受概率應具有以下屬性:即隨效用的增加或價格的減少而增加[12]:
(1)
因此,次用戶的接受概率可以定義如下:
(2)
其中β為次用戶對價格的敏感度, γ表示次用戶對效用的敏感度, α是常數。
而次用戶的效用函數定義為:
(3)
其中R為服務提供商提供的速率,p是服務提供商發布給次用戶的價格,K,ε和δ是確定上述效用函數精確形狀的正常數。
為了便于分析,我們假設α=1,β=γ=4,ε=10和δ=12。所以,接受概率可以改寫為:
B(v,p)=e-p/v ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (4)
對應次用戶的效用函數為:
(5)
2 ?基于價格的演化博弈算法和策略分析
我們假設兩個有限理性服務提供商同時宣布他們的價格,并且互相不知道對方的價格。具有較高的接受概率的服務提供商將獲得利潤,而另一個服務提供商將沒有利潤。此外,如果兩個供應商的接受概率是相同的,則他們都能獲得利潤。因此,服務提供商的效用函數定義為:
(6)
其中:Ci是服務提供商產生的固定成本。
在這個動態頻譜接入的過程中, 每一個服務提供商都有兩種價格策略的選擇:高價策略ph或者低價策略pl。由于接受概率是價格的減函數,因此低價策略的接受概率Bl的值高于高價策略的接受概率Bh的值。
根據式(6)計算出的不同價格策略的收益,上述對稱的博弈過程可由表1的2×2矩陣來表示。其中Bh是服務提供商選擇高價策略ph的接受概率,Bl是服務提供商選擇低價策略pl的接受概率,C是服務提供商產生的固定成本。
表 1 ?服務提供商的收益矩陣
服務提供商 2
服務提供商 1 ph pl
ph 1/2(ph-C)Bh,1/2(ph-C)Bh 0, (pl-C)Bl
pl (pl-C)Bl,0 1/2(pl-C)Bl,
1/2(pl-C)Bl
如表1所示,若兩個服務提供商都選擇高價策略ph,他們獲得的收益為1/2(ph-C)Bh,否則,若同時選擇低價策略pl,他們將分別獲得收益1/2(pl-C)Bl;若一方服務提供商選擇低價策略,而另一方選擇高價策略,則選擇低價策略的服務提供商將獲得收益(pl-C)Bl,選擇高價策略的服務提供商將獲得零收益,反之亦然。
3 ?演化穩定均衡解
在動態頻譜接入的競爭博弈中,博弈雙方都以最大化自己的利益為目標,每個博弈者的均衡策略都是為了達到自己期望收益的最大值,與此同時,其他所有博弈者也遵循這樣的策略,則這樣的策略組合被稱為納什均衡[13]。
定義服務提供商選擇高價策略ph的概率為x(0≤x≤1),則選擇低價策略pl的概率為1-x。利用上述演化博弈模型,服務提供商選擇高價策略和低價策略的期望收益分別為:
v(ph,x)=vh=1/2x(ph-C)Bh ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (7)
v(pl,l-x)=vl=1/2(1+x)(pl-C)Bl ? ? ? ? ? ? ? ? ? ? ?(8)
因此服務提供商的平均收益為:
(9)
根據vh=vl,即式(7)等于式(8),可以得到完全理性條件下的納什均衡解:
(10)
然而在有限理性條件下,如果選擇高價策略的收益高于平均收益,則根據復制動態定義,選擇高價策略的概率x將會增長。所以依照復制動態方程,有限理性的服務提供商選擇高價策略的變化率可以表示為:
(11)
基于復制動態,演化均衡定義為復制動態穩定的不動點集。演化均衡是演化博弈的理想解,因為博弈者的種群隨著時間的演化會收斂到演化均衡。此外,當博弈者的收益等于平均收益,他們都不會再改變自己的策略,從而達到演化均衡時。
令式(11)等于0,從而可以得到穩定均衡點:
x=0,x=1或 ? ? ? ? ? ? ?(12)
其中x=0表示服務提供商在博弈中最終會選擇低價策略, x=1表示服務提供商在博弈中最終會選擇高價策略,而是動態頻譜接入博弈的混合策略均衡,即按一定的比例選擇高價策略和低價策略。
有限理性服務提供商的策略是根據他們的當前收益和平均收益進行選擇的。所以基于演化博弈的動態頻譜接入算法可以描述如下:
(1)有限理性服務提供商隨機地選擇高價策略和低價策略。
(2)迭代: t = 1, 2, 3, ……
①服務提供商根據式(1)在時刻t計算選擇策略后所獲得的收益v(ph,x)以及平均收益
②if v(ph,x)<
if rand ( ) < [-v(ph,x)] /
選擇低價策略
end
end
③結束。選擇低價策略的比例達到穩定,即進化均衡。其中rand()∈[0,1]在這里表示一個隨機數。
4 ?仿真結果
考慮動態頻譜共享的認知無線系統包含兩個有限理性移動虛擬服務提供商,其中仿真參數設置如下:服務提供商的固定成本為0.1,提供的速率為20 Mb/s,參數K為5×106。為了不失一般性,服務提供商的高價和低價分別假設為5和1。
本算法在不同初始策略選擇概率條件下的收斂情況如圖2所示。可以看出,本文所提出的演化算法是收斂的,并且最終收斂到0,這表示服務提供商最終選擇低價策略,即不論初始選擇低價策略還是高價策略,隨著時間的迭代,有限理性的服務提供商最終會選擇低價策略以吸引潛在的次用戶,所以低價策略是收斂點。
圖2 ?策略選擇的收斂過程
圖3給出了不同初始策略選擇概率條件下服務提供商的收益演化情況。服務提供商選擇低價策略的收益等于平均收益,此時博弈達到演化均衡,一旦達到演化均衡,博弈者都不會再改變此時的選擇,而選擇高價策略的服務提供商最終將會獲得零收益。這表示服務提供商在初始公布的價格越低,次用戶的接受概率則越高,即更多的次用戶會選擇低價策略的服務提供商,因此服務提供商獲得的收益更多;相反,選擇高價策略的服務提供商最終不會獲得收益。
6 ?結 ?語
本文研究了物聯網環境下雙寡頭壟斷市場中兩個有限理性的服務提供商的需求響應價格競爭。為了實現利益最大化,服務提供商動態的相互競爭以吸引次用戶。我們提出了演化博弈理論來建模服務提供商的動態價格策略選擇,利用接受概率B(v,p)映射次用戶對服務提供商提供服務和公布價格的反應,通過復制動態,算法達到演化均衡。仿真結果表明,本文所提出的算法是收斂的,并且可以達到演化均衡,這可能為物聯網環境下的無線網絡供應商提供一些見解。
圖3 ?服務提供商的收益演化過程
參考文獻
[1] 李會平. 物聯網:實現中國飛躍的一次機會[J]. 創新科技, 2010(5):10-12
[2] 劉愛軍. 物聯網技術現狀及應用前景展望[J]. 物聯網技術,2012,2(1):69-73.
[3] 楊博雄,倪玉華,劉琨,等. 現代物聯網體系架構中核心技術標準及其發展應用研究[J]. 物聯網技術, 2013,3(1):71-76.
[4] Gershenfeld N,Krikorian R,Cohen D. The Internet of Things[J]. Scientific American, 2004(4):76-81.
[5] International Telecommunication Union. ITU Internet Reports 2005: The Internet of Things[R]. 2005.
[6] 劉強,崔莉,陳海明. 物聯網關鍵技術與應用[J]. 計算機科學,2010, 37(6):1-4.
[7] Akyildiz I F,Su W,Sankars Y.Wireless sensor networks: a survey[J].Computer Networks,2002,38( 4) : 393-422.
[8] 孫其博,劉杰,黎羴.物聯網: 概念、架構與關鍵技術研究綜述[J].北京郵電大學學報,2010,33( 3) :43-47.
[9] 姚海鵬,張智江.異構環境下物聯網頻譜規劃研究[J].電信科學,2012, 35( 3) : 81-85.
[10] Lin Fuhong,Liu Qian,Zhou Xianwei,et al.Cooperative differential game for model energy-bandwidth efficiency tradeoff in the internet of things[J]. China Communications,2014(1):92-102.
[11] S. Sengupta, M. Chatterjee. An economic framework for dynamic spectrum access and service pricing[J]. IEEE/ACM Trans. on Networking, 2009, 17(4): 1200-1213.
[12] L. Badia, M. Lindstrom, J. Zander, et al. Demand and pricing effects on the radio resource allocation of multimedia communication systems[J]. IEEE Globecom,2003(7): 4116-4121.
[13] 朱·弗登博格,讓·梯若爾.博弈論[M].北京:中國人民大學出版社,1996.