王 維
(四川師范大學 信息網絡服務中心,成都 610066)
5G的高速、低時延特點推助了車間通信(Vehicle-to Vehicle,V2V)的應用[1].除了對數據傳輸時延以及可靠性具有苛刻的要求外,V2V的安全應用對車輛的狀態更新信息的新鮮度具有一定要求.信息年齡(Age of Information,AoI)是評估信息新鮮度的有效指標.依據美國羅格斯大學的Kaul等[2]對信息年齡(Age of Information,AoI)的定義:對于任意系統,任意時刻的AoI表示目的端接收的最新更新信息自產生后所經過的時間[3].
考慮到V2V的安全應用,從AoI角度實現通信的可靠性是十分必要的.事實上,如果AoI能夠預先地可靠地估計,就可提前分配傳輸功率[4]和資源塊(Resource Block,RB),進而保證通信的可靠性.因此,可將AoI超過預定閾值的概率定義為通信的可靠性.
然而,為了準確地估計未來的AoI,需要掌握網絡動態知識,即無線信道、車間干擾以及拓撲變化等信息.最近,研究人員開始關注車載網絡的AoI的優化問題[5-7].
由于車載網絡動態變化,預先獲取網絡動態信息存在較大的挑戰.基于在線集中式策略實時學習網絡動態信息和分配資源是一個可行的辦法[8].文獻[9]采用了模型預測控制(Model Predictive Control,MPC)策略.在確保系統性能優化的同時,掌握動態系統的信息.然而,MPC需預先得到動態系統的準確數據模型,這在車載網絡中無法滿足.
基于高斯過程回歸(Gaussian Process Regression,GPR)是掌握動態系統信息的有效方法.GPR靈活,且對過度擬合[8]具有健壯性.與高斯混合模型(Gaussian Mixture Model,GMM)不同,GPR是非參數化的貝葉斯學習方法,其不受函數形式的約束[10].
為此,提出基于GPR的動態信息的捕獲算法GPR-PA.GPR-PA算法主動地學習系統的動態性,估計車輛的未來的AoI,優化所分配的傳輸功率.仿真結果表明,提出的GPR-PA算法降低了AoI超標概率,降低了平均AoI.
考慮如圖1(a)所示的網絡模型.網絡內有車、基站、行人和路邊單位(Roadside Unit,RSU)組成.由于本文只關注車間通信V2V,車與網絡(Vehicle to Network,V2N)、車與RSU(Vehicle-to-RSU,V2R)通信不在本文討論范圍內.
一對車輛的V2V稱為通信對模型,如圖1(b)所示.假定在一個RSU范圍的覆蓋范圍內有M個通信對.車輛遵照Manhattan移動模型移動.M個通信對共享R個正交的RBs資源,且帶寬為W.

圖1 網絡模型和通信對模型
將通信時間軸劃分為多個時隙,且每個時隙長為τ.用t表示時隙的索引.對于任意一個通信對k,定義一個R維的功率分配矢量:
(1)

此外,對通信對k所分配的功率上限進行限定,如式(2)所示:
(2)
式中:R表示R個正交的RBs資源集;Pmax為可預支的最大功率.
每個通信對k均有隊列緩沖區,用于緩存數據.用Qk(t+1)表述隊列的動態變化:
Qk(t+1)=max(Qk(t)-Ik(t),0)+A
(3)
式中:Qk(t)表示在時隙t通信對k的隊列長度;A表示每個時隙的周期的數據包到達率;Ik(t)表示在時隙t通信對k的傳輸率,單位為每個時隙傳輸的數據包數.
(4)

GPR-PA算法有兩個目標.第1個目標就是提高狀態信息更新的可靠性;第2個目標就是掌握動態系統的知識.先將這兩個目標進行數學表述,并聯立這兩個目標建立目標函數,再利用算法1求解,得到最優每個通信對的最優的功率分配值.GPR-PA算法的整個框架如圖2所示.

圖2 GPR-PA算法框架
用AoI評估信息的新鮮度.令Δk(t)表示通信對k在時隙t的開始時刻的AoI,其定義如式(5)所示:
Δk(t)=τt-γk(t)
(5)
式中:γk(t)表示通信對k接收最新信息的時刻.AoI與信道增益、干擾以及所分配的功率相關.因此,利用非線動態系統函數fk(·)估計下一時隙的AoI:
Δk(t+1)=fk(Δk(t),Pk(t))
(6)
在動態系統中,Δk(t)∈R+表示系統狀態.Pk(t)∈p表示在時隙t的控制動作.通過fk:R+×p→R+將控制動作映射到系統狀態[8].
利用歷史數據估計fk(·)是一個遞歸問題.采用GPR,對式(6)進行轉換.為了簡化符號,令yi=fk(xi),其中xi=[Δk(i),Pk(i)]表示第i個歷史數據輸入點;yi=Δk(i+1)表示對應的標量輸出.
GPR為非線性回歸量,其表述了輸入與輸出關系.為此,假定fk(·)的先驗分布服從高斯過程(Gaussian Processes,GP)[11].注意,此假定并不意味著其完全服從高斯分布,但是給定的協方差函數,GP仍可看作一個最大熵過程(Maximum Entropy Process).
C=[c(xi,xj)]ij,?xi,xj∈Dk
(7)

(8)
(9)
式中:c*=[c(x*,x1)…c(x*,xD)]T.y=[y1…yD]T[11].
GPR的計算復雜度隨D的增加呈線性快速增長[9].然而,由于車載網絡的動態特性,通過丟棄舊的數據使數據庫D固定,能夠應對計算GPR的復雜度,同時,也不影響GPR性能.
利用協方差函數c(xi,xj)可完備地定義一個GP.為了準確地估計未來的測量有及它們的分布,選擇一個協方差函數.為此,引用Matern類協方差函數[12]學習fk(·):
(10)
式中:Γ(·)表示標準的Gamma函數;B(·)表示二階的修正的Bessel函數;Matern類協方差函數包括當ν=0.5時的指數自校正函數和當ν→∞時高斯校正函數.


(11)

(12)

算法1.
輸入值:P,αc,αi,D;
初始化:Δk(0)=0,Dk=φ,selectPk(0)∈prandomly

endfor
如算法1所示,第1步,建立輸出入值:p、αc、αi和D;第2步,進行初始化:Δk(0)=0,Dk=φ,并從p中隨機一個值賦予Pk(0);第3步,進入循環運算.在每個時隙t,觀察Δk(t),并向數據庫里添加所觀察的數據,如式(13)所示:
Dk=Dk∪([Δk(t-1),Pk(t-1),Δk(t)])
(13)
再判斷Dk內的數據量是否超過D.若超過就去除最優的數據,進而保證Dk內的數據量不超過D.
考慮250m×250m區域大小的曼哈頓(Manhattan)移動模型[13,14].Manhattan模型由一定多條水平與豎直的街道組成,每條道為雙向道,如圖3所示.在每個車道的交叉口,移動點可直行、或者左拐、右拐.另外,節點的速度還受到同方節點速度的約束.

圖3 Manhattan模型
仿真參數如表1所示.車輛的平均速度為60 km/h.每個通信對間距離為15m[15].仿真的總時隙為5000 時隙.利用GPML 工具箱求解GPR[16].

表1 仿真參數
在仿真過程中,考慮不同的狀態更新到達率為500kbps、1Mbps.并選擇兩個基準(Baseline)為參照,分析GPR-PA算法的性能.Baseline1:每個通信對隨機分配功率,不進行系統動態信息的學習;Baseline 2:每個通信對主動學習動態信息,并基于αi=0求解式(11).
首先,分析不同的狀態更新達到率的輔助累加分布函數(Complementary Cumulative Distribution Function,CCDF),其反映了AoI超標概率,如圖4、圖5所示.

圖4 CCDF曲線(狀態更新到達率為500kbps)

圖5 CCDF曲線(狀態更新到達率為1Mbps)
圖4給出了AoI對CCDF的影響,其中狀態更新到達率為500kbps.從圖4可知,CCDF隨AoI的增加而下降.原因在于:AoI越大,超標概率越低.相比于Baseline1,Baseline2和Proposed的性能得到優化.
圖5給出了在狀態更新到達率為1Mbps時,CCDF曲線隨AoI的變化情況.相比于到達率500kbps時,到達率為1Mbps時的AoI的超標概率隨AoI增加而下降的速度更快.在AoI=10ms時,GPR-PA算法的CCDF已降至0.0001.
本小節分析不同數據庫容量D對下一個時隙的AoI估計的性能,并選用根均方誤差(Root Mean Square Error,RMSE)作為性能指標:
(14)
圖6給出不同數據庫容量D對估計性能和超標概率的性能影響,其中R=20,αc=1.從圖6(a)可知,當D≤200時,GPR-PA算法估計的根均方誤差RMSE隨數據庫容量D的增加而下降,并且下降速度較大.當D>200后,RMSE隨D的增加呈緩慢增長,估計的誤差開始增加.這說明,并非數據庫容量D越大,估計精度越高.原因在于:車載網絡動態變化,歷史觀察數據的不確定.

圖6 數據庫容量D對估計性能和超標概率的影響
圖6(b)給出概率Pr{Δ(t)>d}隨數據庫容量D的變化情況.該曲線趨勢與圖6(a)相類似.在D≤200時,概率Pr{Δ(t)>d}隨D的增加而快速下降.在D>200后,概率Pr{Δ(t)>d}隨D的增加反而上升,但上升速度變慢.
圖7(a)給出GPR-PA和Baseline2的超標概率Pr{Δ(t)>d}隨αi的變化情況.其中Baseline2表示每個通信對主動學習,但αi=0.結合式(11)可知,αi=0意味在功率分配時,不考慮AoI方差.
從圖7(a)可知,當權重系數αi達到100后,AoI的超標概率下降.而αi達到100后,超標概率上升,性能下降.原因在于:αi值越大,每個通信對就更傾向選擇控制動作,學習更多的系統知識,而不是降低AoI的超標概率.并且當αi大于200后,GPR-PA算法的超標概率大于Baseline2的超標概率.這表明,并非數據庫容量D越大,性能越優,需合理地選擇數據庫容量D.

圖7 αi對平均AoI和超標概率的影響
圖7(b)給出了平均AoI隨αi變化曲線,其與圖7(a)曲線類似.在αi小于100時,αi的增加,能夠降低平均AoI,提高了信息的保鮮度,并且優于Baseline2環境下的性能.當αi大于100后,平均AoI不再隨αi的增加而下降,反而上升.
本文針對動態的車載網絡,對傳輸功率和RB的分配進行了研究,其主要目的就是在下一時隙AoI超過閾值的概率與最大化學習動態系統知識間達到平衡.GPR-PA算法通過GPA主動學習網絡的動態信息,并估計下一時隙的AoI.仿真結果表明,相比于其他基準算法,提出的GPR-PA算法降低了AoI超過閾值的概率.