賀智敏,林育哲,程宇杰,閆實
(北京郵電大學網絡與交換技術國家重點實驗室,北京 100876)
車聯網(vehicle-to-everything,V2X)通過建立各車輛與路側設施以及網絡間的通信鏈路,不僅為車輛提供了超越單車傳感器視距限制的感知信息,還能為乘客提供車載娛樂業務[1]。然而,為了達到L4級以上高精度、廣范圍的感知性能并支撐車載娛樂業務,單個車輛需要從無線網絡獲得的下行數據將達到250 Mbit/s[2],而目前已部署的Sub-6G低頻5G 網絡在實際測試中車輛下行均值速率約為500 Mbit/s,資源利用率不高,難以支撐高密度場景的高精度地圖下載和車載娛樂業務[3]。
造成該問題的主要原因是城區的環境復雜性以及車輛的高速移動性,基站到車輛的通信鏈路難以一直保證較好的信道質量[4]。因此產業界提出通過車輛分簇使車輛對網絡(vehicle to network,V2N)鏈路質量較差的車輛形成由V2N鏈路和車輛對車輛(vehicle to vehicle,V2V)通信組成的高性能雙跳傳輸方案,能夠有效提升下行性能[5-7]。文獻[5]提出了一種公平的自適應分簇方法,基于車輛分布密度對道路路段進行自適應劃分,并選擇靠近中心的車輛成為簇頭,仿真結果證明了車輛分簇對下行性能提升的有效性。文獻[6]利用車輛間歐幾里得距離,建立了衡量車輛地理關系的相似性矩陣,并基于該矩陣提出了K均值(K-means)的分簇方法,與單層V2N相比,下行傳輸性能有了顯著提高。文獻[7]提出了基于迭代自組織數據分析技術與算法(iterative self-organizing 2ata analysis technique algorithm,ISODATA)的車輛分簇方法,該方法擴展了傳統的K-means算法,通過考慮車輛移動信息,自適應更新每次迭代的簇的個數,相比于傳統的基于分段和K-means聚類的方法獲得了更高的吞吐量。進一步地,基于分簇所得的V2N與V2V鏈路所組成的兩層網絡架構,產業界討論了基于圖著色[8]、圖論[9]、強化學習[10]等方法在通信鏈路資源分配的應用。文獻[8]基于用戶位置構建的干擾模型,建立了所有通信鏈路的干擾圖,從而確定了滿足鏈路通信需求的信干噪比約束下最多可復用的通信鏈路集,以提高通信資源利用率。文獻[9]利用圖劃分工具將高干擾的V2V鏈路劃分為不同的組,將頻譜共享問題建模為一個加權的三維匹配問題。同時提出了一套算法,包括基于基線圖的資源分配算法、貪婪資源分配算法和隨機資源分配算法,以解決性能和復雜性的權衡問題。文獻[10]提出了基于強化學習的資源分配算法,以網絡總吞吐量為獎勵,在V2V鏈路負載較低時擁有較好的性能增益。文獻[11]則聯合考慮了車輛通信模式選擇和資源分配問題,利用了基于深度Q網絡(2eep Q-network,DQN)的深度強化學習(2eep reinforcement learning,DRL)框架,為車輛選擇直接通信模式或通過基站通信的模式以及分配資源塊,在一定程度上提升了通信鏈路的可靠性和吞吐量。
然而,上述車輛分簇與資源分配算法大多需要車輛上報自身位置信息,當車輛處于不穩定的鏈路條件時,獲取車輛的移動信息往往存在較大誤差,導致傳統方法的性能下降。幸運的是,文獻[12]與文獻[13]總結的基站無線感知技術有望解決這個問題,該技術通過占用一部分通信帶寬資源,從基站主動發射感知信號,并基于接收的感知物體所反射的回波信號,估計車輛移動信息。其中,文獻[14]總結并分析了基站側感知帶寬資源分配與感知所估計的車輛移動信息的誤差之間的關系,即分配資源越多,感知誤差越小;反之,誤差則越大。文獻[15]則通過仿真證明了不同感知誤差會在不同程度上影響后續車輛分簇的準確性,從而造成不同程度的通信性能下降。因此,在進行資源分配的過程中需要考慮感知通信資源配比的影響,即考慮通信感知資源正交且兩者總資源不變的情況下,如何通過一定的資源配比方式達到通信性能增益的上限,從而真正發揮基站無線感知輔助通信增強的作用。針對上述問題,本文的主要貢獻如下。
(1)考慮上述感知通信資源配比對通信性能的影響,本文基于分配的感知帶寬資源,建立了感知估計的誤差模型,并構建了通信與感知資源正交下的通信模式選擇與無線資源分配聯合優化問題。
(2)為解決這一問題,本文提出基于Delaunay三角劃分的車輛分簇方法來為車輛選擇通信模式,以得到更多穩定視距傳輸的通信鏈路;之后,提出了一種改進的基于圖著色的資源分配策略,通過空間距離相隔較遠的通信鏈路間資源復用,實現下行吞吐量的提升。
(3)通過仿真分析了無線感知估計誤差、車輛數量對算法性能的影響。仿真結果表明,所提資源分配方法在相同感知帶寬資源占比下,相比傳統基于分簇和圖著色的資源分配算法可以獲得更優的下行通信性能增益,并能夠承受更大的感知誤差對性能的影響。
無線感知輔助的車聯網下行業務場景如圖1所示,其中1個通感一體化基站和N個車輛用戶終端(vehicle user equipment,VUE)分布在該二維平面中,基站感知與通信下行的頻譜資源共享,一共為Wtotal。同時考慮下行的兩種通信模式:直連模式和中繼模式。直連模式下基站將數據直接通過V2N鏈路傳輸至VUE;而中繼模式下基站將數據傳輸至指定的VUE,并由該VUE間接將數據傳輸至目標VUE。其中V2V采用資源專用(overlay)模式[16],即V2V鏈路與V2N鏈路共享資源池且資源正交。假設第k個VUE單位時間內需要的下行數據量為Dk。

圖1 無線感知輔助的車聯網下行業務場景
根據通感一體化中的分配的感知帶寬資源所能估計獲得的距離感知精度[14],VUE的距離感知精度與分配的感知資源的關系可表示為:

其中,c表示光速,為3×108m/s,γksense表示基站接收的通過VUE k反射回波的感知信號信噪比,W1表示分配給感知的頻譜資源,假設t時刻VUE k的 實 際 位 置 為 lk(t ) ?( xk(t ),yk(t )),其 中( xk(t ),yk(t))表示VUE k在t時刻的坐標。通常感知所得誤差為隨機的,而中心極限定理表明,大量獨立的隨機變量之和的極限趨向于高斯分布。因此,假設VUE k在t時刻的坐標感知誤差Δxk(t ,W1)、Δyk(t ,W1)服從均值為0、標準差為Δlk(W1)的高斯分布,則誤差表示為:

則感知估計出的VUE k位置可表示為:

通信模型包括兩種下行通信模型:直連通信模型和中繼通信模型。通信可分配的帶寬資源為W2= Wtotal-W1,可分配給通信資源塊(resource block,RB)的集合為 M ={1,…,m, …, M}。令M ×N的分配矩陣ρ中的元素 ρm,j∈ {0,1}表示總帶寬中第m個子頻段是否被分配給VUE j進行通信。N ×N維分簇結果矩陣C中的元素 Cj,k∈{0,1}表示是否選擇將VUE k作為VUE j的簇頭,則通信模型如下。
(1)直連通信模型。當基站選擇直接通過V2N鏈路將數據傳輸至VUE j時,由于采用overlay模式,V2N鏈路資源正交,分配RB m給VUE j進行V2N通信時,該鏈路信噪比可表示為:
其中,PB和2σ分別表示VUE j發射功率和噪聲功率, ,Bjg表示信道功率增益。考慮到車輛的高移動性,本文假設VUE與基站僅可獲得大尺度信道增益信息,包括路損與陰影衰落。當基站選擇直接通過V2N鏈路將數據傳輸至VUE j時,分配的RB m可達速率表示為:
其中,W表示單個RB占用的帶寬資源。
(2)中繼通信模型。當基站將數據通過中繼模式傳輸至VUE j,假設基站選擇將數據通過VUE k中繼傳輸至VUE j。首先,基站將數據通過V2N鏈路直接傳輸至VUE k,則由式(5)可知,分配RBm給VUE k進行V2N通信時可達速率為
之后,VUE k將感知數據通過V2V鏈路傳輸至VUE j,為了提高資源利用率,V2V鏈路之間可以進行資源復用,因此分配RBm給VUE k到VUE j進行V2V通信時,該鏈路的信干噪比可表示為:

其中,分母的第二項表示分配給其他V2V鏈路相同RB時帶來的干擾。因此,可達的V2V通信速率可表示為:
在此模式下,感知數據需要經過兩個鏈路的傳輸,因此通過中繼模式傳輸的最大速率為該兩個鏈路傳輸速率的最小值。假設分配給V2V的資源數為M1,則V2V鏈路可達速率為而分配給V2N的資源數為M2,V2N鏈路可達速率為,則基站將數據通過中繼模式傳輸至

VUE j的可達速率可表示為:

考慮到車輛的移動性會引起V2V和V2N鏈路建立的兩跳網絡不夠穩定,導致后續鏈路資源分配算法的性能增益受損。因此,本文利用無線感知所得的車輛位置估計車輛的速度信息,并基于預測的一定時間后的車輛位置進行分簇來考慮移動性問題,進而為車輛選擇通信模式,以建立穩定的通信鏈路;而后考慮鏈路的資源分配問題,使后續鏈路資源分配算法擁有更高的性能增益。
在基站通過無線感知估計得到具有一定誤差的VUE k位置信息(t ,W1)后,可通過與前一時刻的車輛感知估計位置信息(t -Δt ,W1)計算得到t時刻VUE k的估計速度,表示為:

假設車輛分簇時間間隔為T,則基站可以預測未來T/2時刻的車輛位置為:


其中,Cluster(·)表示分簇函數。輸出的分簇結果矩陣與分簇算法和輸入的車輛位置信息L(t ,W1)以及VUE到基站的接收功率Pr有關。
當分簇建立穩定的通信鏈路后,對各個鏈路進行通信帶寬資源的分配。由式(8)可知,當分配給V2V與V2N的資源固定時,調整配置比例可以使所達速率最大化,其條件是min函數內兩項數值的差值盡可能減小。由此推出,當分配RB m給VUE j的中繼模式傳輸時所達最大速率為:

為了能盡量提升系統所能支撐的業務數量,考慮優化目標是最大化系統吞吐量,車輛分簇與資源分配的優化問題建模如下。

其中,C1表示傳輸模式選擇約束,即車輛不能同時選擇進行V2N和分級傳輸模式,以及不能同時通過不同車輛進行傳輸;C2表示車輛overlay傳輸模式對V2N資源配置的約束,即分配給V2N車輛的通信資源不能同時分配給其他任何車輛。
目前車聯網車輛分簇方式主要分為兩類:(1)基于車輛間距離大小,將樣本集劃分為指定數量的簇,但難以處理城區車輛非均勻分布的散點成簇,成簇不穩定;(2)基于車輛密度進行分簇,可以有效應對不均勻散點車輛成簇問題,但未考慮車輛間鏈路影響,會導致較多非視距通信車輛聚為同一個簇。為了綜合兩種分簇方式的優勢,本文提出了一種基于Delaunay三角劃分的分簇策略,以解決所考慮的二維平面內車輛分簇問題,具體流程如下。
步驟1首先對已知所有車輛進行Delaunay三角劃分以確定與當前車輛直接視距相連的其他車輛。劃分過程利用了Delaunay三角的可擴展性質,即在已Delaunay三角化的網格中加入點P,只需要刪除所有外接圓包含此點的三角形,并連接P與所有可見的點(即連接后不會與其他邊相交),形成的網格仍是Delaunay三角網格。為了降低Delaunay三角劃分的計算復雜度,本文在傳統的增量算法上對所有節點增加了預排序的步驟,節點按序插入,從而可以在每次節點插入后刪除已確定的Delaunay三角,減少檢索外接圓包含此點的三角形的次數。
步驟2簇頭選擇。選擇直接相連的車輛數最多、接收功率最高的車輛成為簇頭。
步驟3分級網絡拓撲形成。選擇將與該簇頭j直接相連且兩者間曼哈頓距離M2is(,)i j小于2isth的其他車輛i歸為簇內。
步驟4重復步驟2和步驟3,直至所有車輛完成分簇,輸出車輛分簇結果矩陣C。具體基于Delaunay三角劃分的分簇算法如算法1所示。

遍歷邊集e2ge,將與簇頭相連的車輛e2gei,in2ex=1且 M2is(i, in2ex)≤ 2isth歸為簇成員Ci,in2ex=1
e2ge刪除歸簇的邊,2egree刪除歸簇點的度 return C
針對上述建立的資源分配問題,目前已有方法[8-11]通常僅考慮通信鏈路復用時每條通信鏈路分配的資源塊大小是一樣的,難以滿足雙跳傳輸下不同的傳輸需求。為此,本文基于復雜度較低的圖著色[8]的方法,在建立V2V鏈路資源復用的基礎上聯合考慮了車輛分簇結果與傳輸需求相關的調度因子,具體如下。
(1)為所有V2V鏈路構建干擾圖。首先,基于V2V鏈路彼此的干擾關系,構建干擾圖G=(V,E),其中集合V中的節點表示小區中的V2V鏈路,集合E表示連接節點的邊。節點之間的干擾值大小將決定兩者之間是否存在邊,若V2V鏈路i和V2V鏈路j之間存在不可容忍的干擾,則連接節點i和節點j,即e(i,j)=1。為了保證V2V鏈路的可靠性,可以通過鏈路的信干噪比約束來判斷兩者之間是否存在不可容忍的干擾,該約束定義如下。

當該約束不成立時,從干擾集K中去除最大干擾鏈路j,并建立節點i與節點j之間的邊,直到該約束成立。
(2)對干擾圖進行著色。圖著色的思想為先為邊最多的節點著色,然后考慮邊次多的節點,根據當前節點和已著色節點間是否存在邊來決定顏色,目的是使具有強干擾(存在邊)的兩個節點分別著上不同顏色,并使相同顏色的節點數量盡量相同,依此類推,直到所有節點著色。
(3)基于圖著色結果的V2V資源分配。假設每輛車初始下行需求為Dk=Dreq。考慮與傳輸需求相關的調度因子mη,該因子隨著分配給該車的資源塊增多而減小,從而實現分配的資源與傳輸需求相匹配。具體的改進的基于圖著色的資源分配算法如算法2所示。
算法2 改進的基于圖著色的資源分配算法
輸入 著色結果colour、傳輸需求D、車輛數N
輸出 資源分配結果矩陣ρ

本文基于MATLAB平臺,根據3GPP TR 37.885中對城區的描述搭建了場景模型[17]。其中車輛隨機分布在道路上,車速在[0,72] km/h隨機分布。仿真參數設置見表1。同時V2N和V2V鏈路信道模型參考3GPP TR 37.885中第6.2節描述的視距(line-of-sight,LOS)和非視距(non-line-of-sight,NLOS)信道模型。

表1 仿真參數設置
不同感知帶寬資源估計的平均距離誤差如圖2所示,仿真了車輛數為50的情況下,不同感知帶寬資源估計的平均距離誤差。仿真結果表明,隨著分配的感知帶寬資源等比增加,平均距離感知誤差遞減,且每增加相等的感知帶寬資源,誤差降低的幅度減小,將100 MHz的下行帶寬資源全部分配給感知,所能獲得的平均距離感知誤差約為0.15 m。
不同感知資源下估計誤差對分簇性能增益的影響如圖3所示,仿真了無線感知資源分別為4 MHz和0.6 MHz情況下,感知結果對分簇性能增益的影響。結合圖2結果分析,分配4 MHz的感知資源比分配0.6 MHz的感知資源所估計的平均距離誤差更低,因此分簇所得通信鏈路更穩定,在分簇時間間隔內性能增益更高。其中所提基于Delaunay三角劃分的分簇算法性能最優,且與基于具有噪聲的基于密度的聚類方法(2ensity-base2 spatial clustering of applications with noise,DBSCAN)的分簇算法一樣,所得V2V鏈路較為穩定,受V2V可靠性約束變化的影響較小;而基于K-means的分簇算法性能最差,由于所得V2V鏈路不穩定,受V2V可靠性約束變化的影響較大。

圖2 不同感知帶寬資源估計的平均距離誤差

圖3 不同感知資源下估計誤差對分簇性能增益的影響
為了體現本文所提算法在節約網絡算力資源的基礎上依然可以獲得較好的性能增益,本文對比了文獻[11]中聯合考慮車輛分簇與資源分配的分布式DRL方案,并增加了基于貪心算法的資源分配方案,該方案每次進行RB分配時執行如下步驟。
步驟1將每條傳輸鏈路分別分配給一個空集。
步驟2計算該RB分配給各鏈路集所能傳輸的數據量并記錄最大值
步驟3找到當兩集相并時,分配RB所能傳輸數據量最大的并集。
步驟4若數據量傳輸大于,則并上這兩個集合,更新每條鏈路剩余的傳輸需求,并重復步驟2和步驟3。
步驟5否則,將RB分配給所能傳輸的數據量為的鏈路集合。
不同車輛數下聯合不同分簇和資源分配策略性能如圖4所示,結果表明,分布式DRL方案聯合考慮了車輛分簇與資源分配,性能最優;所提資源分配算法性能優于經典空間劃分以及基于圖著色的資源分配方案,且性能逼近貪心算法。當采用長期演進V2X(long term evolution V2X,LTE-V2X)中基于空間劃分的資源分配算法時,相比不分簇方案,基于Delaunay三角劃分、DBSCAN以及K-means的分簇方法在車輛數達到50輛時所達性能增益分別為15.14%、10.59% 和5.88%。

圖4 不同車輛數下聯合不同分簇和資源分配策略性能
車輛數達到50輛時不同資源分配算法的迭代過程如圖5所示,可見DRL相比其他算法需要多次迭代才可收斂至相對穩定的性能。不同資源分配算法一次迭代典型復雜度如圖6所示,其中基于空間劃分的資源分配算法事先規定了不同區域間資源復用策略,因此時間復雜度僅與資源塊分配過程相關,為O(Mlog(N));基于圖著色的資源分配算法則增加了圖著色的過程,且每次資源分配需要檢索圖著色所得資源復用的鏈路,因而復雜度為O(N2+MNlogN);所提算法則在上述檢索過程基礎上僅更新了該鏈路的調度因子,因而復雜度同為O(N2+MNlogN);貪心算法每次進行資源分配時都需要重新更新資源復用策略,因而復雜度為O(MN2logN);分布式DRL基于DQN框架,每次迭代需要更新神經網絡參數,令||w表示每個智能體(車輛)的網絡參數數目,則復雜度為O(N||w)。結果表明,相比貪心算法和分布式DRL算法,所提資源分配算法在保證性能逼近的基礎上可以大幅減少算力開銷。

圖5 車輛數達到50時不同資源分配算法的迭代過程

圖6 不同資源分配算法一次迭代典型復雜度
不同感知資源配比下不同分簇方式可達下行吞吐量如圖7所示,考慮本文針對的感知和通信共享資源的場景,即感知和通信的總帶寬資源恒定100 MHz的情況下,對比了不同感知資源配比下不同分簇算法所能達到的通信性能增益。

圖7 不同感知資源配比下不同分簇方式可達下行吞吐量
圖7表明,當感知資源分配較小時,感知估計所得位置誤差較大,分簇帶來的性能增益遠不如不分簇時的性能;而隨著感知資源分配增加,感知估計誤差降低,分簇帶來的性能增益逐步提升;當感知資源超出一定閾值時,估計精度無法帶來更有效的通信性能增益,反而占用更多的頻譜資源,最終使得通信性能驟降。不同分簇算法的仿真結果表現不盡相同,其中基于K-means算法對感知資源占比表現更為敏感,在感知分配帶寬為4 MHz時達到通信性能峰值;基于DBSCAN密度聚類的方法則在感知分配帶寬為3.5 MHz時達到通信性能峰值;所提基于Delaunay三角劃分的分簇算法更為穩定,對感知誤差相對沒那么敏感,在感知分配帶寬為3 MHz,即感知資源配比為3.0%時達到通信性能峰值;分布式DRL算法在感知分配帶寬約為2 MHz,即感知資源配比為2.0%時達到通信性能峰值。
車聯網日益增長的業務需求對有限的頻譜資源提出了更高的需求,而車輛移動性引起的通信鏈路不穩定,會導致現有的基于車輛位置信息上報的通信資源分配方法不再高效。為了提高頻譜資源分配的有效性,本文提出了一種基于通信節點無線感知輔助的車聯網下行無線資源分配方法,通過基站無線感知技術估計出車輛的移動信息,進而提出了基于Delaunay三角劃分的分簇方法,并改進了基于圖著色的資源分配算法,最后討論了通信感知資源正交情況下兩者資源占比對下行性能的影響。仿真結果表明,隨著感知資源配比的增加,系統下行吞吐量呈現先增后減的趨勢,所提資源分配方法相比傳統基于分簇和圖著色的資源分配算法能承受更差的感知性能,在感知資源占比為3.0%時達到了最優的下行通信性能增益。