董玉浩,趙學軍,袁修久,賀 剛,王明芳,李嘉林
(1.空軍工程大學 研究生院, 西安 710038; 2.中國人民解放軍9272部隊, 上海 210406)
在無人機協同作戰的過程中,機間需要高效手段來實現通信,而數據鏈(Data Link)可以為這些機間通信提供技術支持,提高數據鏈網絡的吞吐量,優化發射功率是主要選擇之一。
文獻[1]提出了一種新的功率控制手段,并給出了選擇信道的方法。為了可以在滿足QoS需求的同時提高網絡的吞吐量[2],各方面的研究都在進行,本文的研究基于功率優化。功率優化與節點的動態博弈緊密相關,為了得出各博弈方在信干比固定時所采用的發射功率的分布情形,Stefano Buzzi等[3]定義了一個效用函數,用來量化模型的優化結果。在文獻[4-5]中,Yun Zhu等選擇適當的發射功率來實現沖突的減少和網絡連通性的鞏固,改進了優化網絡的拓撲結構,整體增強了功率優化的互聯和相關性。Giacomo Bacci等在文獻[6-7]中提出自適應調整發射功率的方法實現吞吐量的最大化,以輕微的代價換取了算法的快速收斂。文獻[8]采用一個適當的方法改變代價因子的值。文獻[9]中的結論顯示,選擇合適的效用函數能使功率水平更低,同時達到更高的吞吐量。在文獻[10]中,賀剛采用組合代價函數的形式,提出了一種基于博弈論的功率控制方法,保證了無人機之間數據鏈系統的低截獲,并有效地提高了其抗干擾能力。
針對博弈方參與博弈進行功率更新時的次序,本文提出了基于動態博弈模型的功率控制方案,該算法在更新功率值時考慮了更新次序,以獲取的其他博弈方的當前信息,有效提高了算法的收斂速度,有利于提高數據鏈系統的公平性和穩定性。
在AWGN信道下建立無人機作戰編隊的信道模型,對于接收節點終端,其信干比SIR可表示為:
(1)
其中:擴頻增益G=W/Ri,W表示chip速率;Ri表示節點i的信息傳輸速率;N表示編隊中共享無線信道的節點數,hi表示節點i的信道增益,pi表示節點i的發射功率水平,σ2表示AWGN信道下的接收機背景噪聲。

(2)

當節點i的功率大于最優功率時,可以定義懲罰函數模型如下:
(3)
其中,未施加懲罰的效用函數為
ui(p)=uiarctan(1+γi)
(4)
式中,ci(p)是代價函數或稱懲罰函數。
采用鏈路增益代價函數:
ci(p)=δhipi
(5)
加入代價函數后的實際效用函數模型:
(6)
其中,δ為實比例系數,該模型將會主要懲罰功率大的節點。

(7)
(8)
由式(7)與式(8)可以看出,節點i在博弈過程中每次進行信息迭代更新時,采用的信息是上一輪迭代的信息,而不是當前最新的信息,故而最終結果不是當前的最佳值。
為解決這個問題,必須及時更新其他節點的功率干擾信息,因此,在這里提出基于動態博弈的功率控制,當節點更新自身功率時,可獲取其他節點對其最新的動態干擾信息,節點i第k+1次更新時掌握的動態信息可以被表示為:

(10)

(11)
由式(10)、式(11)可知,由于每個節點在更新當前功率值時,所采用的其他節點的信息值是離當前時間最近的干擾信息,效益函數的優化效果更好。
完美均衡的概念在文獻[11]中被提出,根據動態博弈理論,子博弈完美納什均衡是由完美信息動態博弈得到的均衡解。子博弈指每個當前需更新功率的節點與在它之后將更新的節點構成的一個博弈組合。換句話說,系統中的N個節點構成N個子博弈,若存在一組功率向量p′,它對每個節點構成的子博弈都達到納什均衡,p′即為該博弈的子博弈完美納什均衡。各個子博弈采用相同的效益函數時,所對應節點的策略空間也保持相同。

下面將通過仿真證明其具有更快的收斂速度,即在數據鏈的應用當中,能使戰機編隊的通信在更短的時間內達到穩定。
在動態博弈模型下,得到應用于數據鏈系統的分布式功率控制算法,其流程如下:
步驟2:當k=k+1時,每個節點依次計算兩式的值:

步驟3:判決是否終止迭代。終止的條件是p(tk)=p(tk-1),此時的發射功率為p(tk)不滿足終止條件則令k=k+1,并返回步驟2,直至滿足終止條件。


圖1 靜態博弈與動態博弈不同距離節點達到均衡時的功率曲線

圖2 靜態博弈與動態博弈功率控制收斂曲線

圖3 靜態博弈與動態博弈SIR(信干比)收斂曲線
圖1所示為不同距離的節點達到均衡時的發射功率,其中圖1 (a)為靜態博弈功率控制下用戶達到均衡時的最終發射功率,圖1 (b)為動態博弈功率控制下用戶達到均衡時的最終發射功率,由圖所示可知,兩種博弈情形的均衡狀態下,動態博弈無需犧牲發射功率。
圖2、圖3所示分別為各節點發射功率和信干比SIR(歸一化)收斂到穩定值時的迭代次數曲線,其中圖2 (a)與圖3(a)分別為靜態博弈情形下發射功率和信干比SIR達到穩定值時的迭代次數曲線,其中圖2 (b)與圖3(b)分別為動態博弈情形下發射功率和信干比SIR達到穩定值時的迭代次數曲線,比較圖2、圖3所示的兩種博弈模型,兩種情況下同一個節點發射功率和信干比SIR都能收斂到同樣的均衡值,與靜態博弈相比,動態博弈中功率從初始值達到收斂需要的迭代次數明顯減少,即功率的收斂速較快,原因在于動態博弈情形下,各節點所獲得的信息是最新更新的信息,所以能更快地達到均衡點。這對于要求快速、準確的數據鏈通信系統而言,是非常好的解決方案。
表1列出了每個節點達到收斂需要的迭代次數。由表可知,動態博弈算法達到均衡時所需迭代次數大幅減少,如節點1、節點2、節點3靜態博弈算法下需要的次數為15次,而在動態博弈算法下只需9次,節點4、節點5降低的次數近1/2,所有節點的平均迭代次數除低了42.5%。由此可知,動態博弈算法可以大幅度改善功率控制的收斂性能。

表1 動態博弈與靜態博弈模型性能對比
針對CDMA通信系統的功率控制問題,本研究在靜態博弈功率控制模型的基礎上,引入動態博弈,讓每個參與博弈的通信節點獲取最新的信息,使各節點更加理性。通過理論分析和仿真對比都表明,在不犧牲其他性能的情況下,基于動態博弈的功率控制算法比靜態博弈功率控制算法的平均收斂速度提升了42.5%,這對于要求快速、準確的數據鏈通信系統有一定的價值。