薛 拯,劉 洋,韓國軍,閆晶瑩
(廣東工業大學 信息工程學院,廣州 510006)
車載自組織網絡(VANET)在智能交通系統中扮演著重要角色,而車輛之間建立暢通的通信和穩定的數據傳輸以支持流媒體應用是車聯網面臨的一個巨大挑戰.分簇能夠有效改善VANET中的數據傳輸問題.分簇算法的原理是根據一些規則集將移動節點關聯為一個簇,并選擇一個稱為簇頭(CH)的節點,以便簇和網絡的其余部分之間進行調解[1].簇頭CH負責融合簇內車輛的數據,而其他節點(非簇頭)將自己的數據傳輸至各自的簇頭CH.由于簇頭CH承擔了數據融合的任務,負責與外界通信,簇內車輛成員的變動導致網絡拓撲動態變化,加速通信鏈路的斷裂,簇結構的穩定性及簇頭的選擇直接影響數據傳輸性能[2].
分簇及簇頭選舉用于穩定網絡結構及改善車聯網通信性能,文獻[3]以減少車輛MAC層競爭為目的綜合考慮速度、密度、信道因素來選取簇頭從而提高網絡吞吐量等性能.文獻[4]指出車載網絡基本屬于復雜網絡模型,復雜網絡理論既可以提供準確的網絡圖解模型,又可以為網絡設計,優化和管理做出重要貢獻.文獻[5]提出分布式聚類算法和基于進化博弈論的簇頭選舉算法,能夠減輕基站負載并提高用戶體驗質量.文獻[6]提出一種帶時延約束的D2D協作中繼轉發策略,大幅提升數據傳輸速率.文獻[7]針對荒漠環境提出一種分簇路由算法,建立可靠路由,提高簇的結構穩定性并降低路由開銷.文獻[8]提出一種基于移動性的穩定聚類方法,利用車輛速度,位置和方向以及鏈路質量等度量用于簇頭選擇,該算法在城市和高速公路場景具有可靠的穩定性.文獻[9]提出一種計算節點穩定值的模型,根據距離、速度和概率參數的差異來計算節點穩定性,選取的簇頭具有很高的價值穩定性.此外,基于各種智能方法改善車聯網及自組織網絡性能,也是當前的研究熱點[10-18].
文獻[19]提出一種基于分布式集群的傳輸調度,建立無競爭傳輸調度機制,用來解決最大最小流量分配問題,改善集群內車輛數據傳輸.文獻[20]提出基于集中式聚類的混合車載網絡框架,實現聚類和協調消息傳輸,以減少開銷并改善安全數據傳輸.文獻[21]提出一種具有選擇性調制和功率控制的自適應傳輸方案,提高簇頭與基站之間的中繼鏈路容量,仿真表明該設計大大提高了5G用戶的誤碼率和干線鏈路吞吐率.文獻[22]提出一種新的VANET數據傳播策略,選擇最大效用的節點用作數據中繼,所提出的方法在數據傳播延遲方面表現更好.
文獻[23]提出車聯網輔助本地交通信息收集架構,用于支持信息流入的有效匯聚節點選擇方案以及基于通信阻抗的最佳交通信息傳輸模型,以便提高信息傳輸效率.首先建立車聯網加權無向圖模型,利用復雜網絡技術分析出租車GPS數據庫構建車輛網絡拓撲結構,驗證車載網絡的時間不變性.有效匯聚節點選擇的標準為最大化節點網絡容量,網絡容量是用節點峰值負載容量來量化的,通常承載大量遠程業務負載的節點對整個網絡容量具有重大影響,該方案用于改善車聯網交通信息傳輸性能和降低通信成本.
文獻[24]提出一個綜合的VANET分析模型,包含MAC協議操作,PHY層無線信道條件和車輛的移動模式,充分表征VANET集群的實際性能,提出一種泰勒級數展開的近似方法,推導出包丟失概率和吞吐量的閉式表達式.利用新模型設計VANET集群發現數據包丟失取決于集群中的車輛數量,集群太大,大量車輛之間的分組沖突和大地理跨度上的傳輸故障,大型集群分組丟失率高.集群太小,由于集群中生成的流量需求有限,集群的無線電資源將未得到充分利用.該模型分析揭示了集群大小,車輛速度,流量需求和窗口大小之間的內在依賴關系以及對集群總吞吐量和數據包丟失的影響,為VANET設計和管理提供指導方面的實用價值.
分簇及選擇簇頭雖然改善了簇內車輛通信狀況,但簇內通信往往是單跳的方式,當某一車輛脫離與簇頭的通信范圍時,可能出現通信鏈路斷裂,重連質量不穩定的情況,容易導致數據分組丟失,特別是在大型城市存在大量業務數據分發業務時,容易造成沖突和分組次序混亂,因此對簇內數據傳輸優化是非常必要的.
針對上述問題,本文基于復雜網絡理論,利用成都市真實出租車GPS數據建立車輛通信無向圖模型.本文提出基于車輛廣義距離的譜聚類分簇算法及基于模糊邏輯的簇頭選擇算法,針對大量業務數據傳輸問題提出優化模型,仿真結果表明,所提出的方案比現有算法有效提高了集群內系統網絡吞吐量,降低了數據傳輸時延.
本文數據集基于成都市出租車2014年8月3日到8月30日真實GPS數據.選擇經度[103.90,104.20]和緯度[30.55,30.80]范圍內的車輛GPS數據用于構建車聯網模型.圖 1為某一時刻車輛GPS坐標分布.
車輛通信無向圖模型G=(V,E).V為所有車輛集合,E為車輛間通信鏈路集合.假設所有車輛和路邊單元具有相同的通信能力,一對節點只要在最大信息傳輸范圍r內就能實現彼此通信,假設加性高斯白噪聲(AWGN),功率為N0.

圖1 成都市出租車GPS坐標分布
無向圖模型基于復雜網絡理論,節點度(在最大通信范圍內與該節點通信的鄰居節點數),中介中心性,聚類系數是模型的關鍵參數.圖 2反映了每個節點的中介中心性及所有車輛的聚類系數.

圖2 中介中心性與聚類系數
中介中心性用于量化節點的重要性:
(1)

聚類系數表示車輛節點聚集程度的系數:
(2)
式(2)中ki為車輛i的度.Ei為車輛i的所有鄰居車輛通信鏈路總和.
基于構建的無向圖模型,車輛之間要想形成穩定的簇需要考慮車輛周圍鄰居車輛數以及與鄰居車輛的速度差和實際距離差,定義車輛之間的廣義距離Dij見式(3),廣義距離反映了每個車輛之間的相似度,廣義距離越大,說明兩個車輛之間形成簇的可能性越小.
Dij=ξ1(kiBi+kjBj)+ξ2vij+ξ3dij
(3)
式(3)中ki,kj為車輛i,j的度.Bi,Bj為車輛i,j的中介中心性.vij為車輛i,j的速度差.dij為車輛i,j的距離.ξ1,ξ2,ξ3為權重系數.
基于廣義距離分簇算法流程見算法1.
算法1.基于廣義距離分簇
初始化:
1.計算車輛之間的歐氏距離dij;
2.根據r=1000m產生鄰接矩陣和度矩陣dM;
3.計算ki,Bi,vij;
4.計算廣義距離矩陣Dij(ξ1=ξ2=0.3,ξ3=0.4).
譜聚類:
5.生成拉普拉斯矩陣LM,LM=dM-Dij;

8.使用K-means對新排序的向量空間進行聚類.
輸出:
9.分簇結果
為了形成穩定的分簇以及選擇穩定的簇頭本文基于模糊邏輯考慮車輛的領導力、速度、距離三個因素(LFi,VFi,DFi).領導力因素主要考慮車輛節點度和中介中心性.速度因素在這里指的是車輛與鄰居車輛的綜合速度差(根據節點度所占的權重計算).距離因素這里指的是車輛與鄰居車輛的綜合歐式距離.只要車輛周圍鄰居節點數多,車輛節點與周圍鄰居節點的綜合速度差越小,綜合距離越小,選取的簇頭生存周期更長,在簇內負責協調與其他車輛的通信會更加穩定可靠.
LFi=kiBi
(4)
(5)
(6)
(7)
根據每個車輛計算出來的領導力、速度、距離因素,由于沒有一個具體的閾值來確定該因素對該節點選擇為簇頭是否合理,因而將每個因素模糊劃分為三個等級,領導力因素對應{好、中、壞},速度因素對應{慢、中、快},距離因素對應{近、中、遠}.對于每個輸入因素采用模糊隸屬函數來刻畫每個因素,所有因素在計算出來后統一進行歸一化處理.對于每一個因素輸入對應一條IF/THEN規則,輸出分為{Perfect,Good,Acceptable,Unpreferable,Bad,Very Bad}六個等級,輸入輸出隸屬函數見圖 3.
三個因素輸入一共對應27條模糊規則,模糊規則見表1.由于輸出變量最后為模糊值,最后基于重心法根據輸出模糊值對應的圖形求解圖形重心的橫坐標進行去模糊化,其值作為車輛節點成為簇頭的概率.

圖3 輸入輸出隸屬函數
根據文獻[23]中最大化網絡容量(MNC)來選擇網關節點(簇頭),其問題形式如式(8)所示.P=[p(t),t=1,2,…,N]T,P表示節點成為簇頭的概率.基于本文通信模型,兩種算法選擇簇頭的概率如圖 4,只有個別車輛能夠被選擇為簇頭.
min Ω
s.t. RAP-Ω1+y=0
PT1=1
y≥0
P≥0
(8)

圖4 基于兩種方法的簇頭選擇概率(數據范圍為經度[104.03,104.10]和緯度[30.63,30.67])
針對簇內大量流媒體數據傳輸的需求,由于車輛高速移動以及物理層信道衰落效應會影響分簇后的集群可靠性以及吞吐量性能,即使在MAC層無傳輸沖突的條件下,物理層信道條件也會對系統數據包丟失產生很大影響,本文從考慮物理層解碼失敗而引起數據包丟失的角度,在基于前面完成分簇及簇頭選擇工作提出簇內數據傳輸優化模型.
在集群Cj(j為簇頭)內,第i個車輛數據包到達簇頭丟失的概率為式(9)[24].
(9)
式(9)中K2為路徑損失指數.
Lpi=φi/[Tc(vi)log2(1+γ0)],φi為第i個車輛發送數據包的大小,γ0為接收SNR閾值.

表1 模糊規則
Table 1 Fuzzy rule

RulesLFVFDFRANKRule1GoodSlowClosePerfectRule2GoodSlowMediumGoodRule3GoodSlowFarUnpreferableRule4GoodMediumCloseGoodRule5GoodMediumMediumAcceptableRule6GoodMediumFarBadRule7GoodFastCloseUnpreferableRule8GoodFastMediumBadRule9GoodFastFarVeryBadRule10FairSlowCloseGoodRule11FairSlowMediumAcceptableRule12FairSlowFarBadRule13FairMediumCloseAcceptableRule14FairMediumMediumUnpreferableRule15FairMediumFarBadRule16FairFastCloseBadRule17FairFastMediumBadRule18FairFastFarVeryBadRule19PoorSlowCloseUnpreferableRule20PoorSlowMediumBadRule21PoorSlowFarVeryBadRule22PoorMediumCloseBadRule23PoorMediumMediumBadRule24PoorMediumFarVeryBadRule25PoorFastCloseBadRule26PoorFastMediumVeryBadRule27PoorFastFarVeryBad
(10)
式(10)中N0為加性噪聲功率,Pt為傳送功率.
(11)
式(11)中λ0=c/f0,Gt、Gr為傳送機和接收機的天線增益.
因此集群內每個車輛吞吐量φi的計算如下:
φi=λi(1-pi)LPi
(12)
式(12)中λi為第i個車輛的分組到達率.
簇內數據傳輸優化模型見式(13),φ0為每個車輛之間的最大傳輸速率,每個集群的分組到達率上限為μ.
s.t.φi≤φ0
(13)
利用MATLAB對所提方案進行數值仿真.φi設置為400Bytes~500Bytes之間隨機分布,吞吐量值φ0設置為400Kbps,每個簇的分組到達率上限μ設置為200packets/s,GtGr設置為1,f0為5.9GHz,Pt為2W,γ0為3dB,N0為3.98×10-12mW,路徑損失指數K2為2.
比較基于Fuzzy、基于MNC兩種方法的吞吐量及時延性能見圖5所示.基于Fuzzy的方案中,吞吐量達到350kb/s的節點數量及吞吐量均值明顯高于基于MNC的方法,時延高于0.5的節點數量及時延均值明顯少于基于MNC方案,基于Fuzzy方案選出的簇頭能夠維持與簇內車輛之間穩定的通信,在吞吐量和時延性能方面優于MNC方案.

圖5 基于兩種方法的簇內吞吐量與(歸一化)時延性能比較
當簇內車輛數增加時,簇內平均吞吐量性能變化如圖6所示,基于Fuzzy,基于MNC,隨機選取三種方案隨簇內車輛數增加,平均吞吐量性能變化維持在穩定范圍內,提出的數據傳輸模型能夠適應車輛數的變化并保持穩定的通信狀況.當簇內分組到達率上限μ=100時,基于Fuzzy的方案簇內平均吞吐量高于MNC和隨機方案,當μ=200時,簇內分組到達率上限增加,簇內通信狀況改善,三種方法的平均吞吐量均有提高,但基于Fuzzy的方案簇內平均吞吐量性能依然優于其他兩種方案,在保證傳輸質量的前提下最大化簇內吞吐量.改變通信半徑r后,簇內數據傳輸優化模型仍舊保持較高的平均吞吐量.
簇內平均時延變化見圖6,隨車輛數增加,基于三種方案的簇內平均時延保持穩定,簇內傳輸優化模型不會隨簇的變化發生較大波動,當簇內分組到達率上限μ=100時,基于Fuzzy的方案簇內平均時延低于MNC和隨機方案.當μ=200時,簇內分組到達率上限增加,三種方法的平均時延均有下降,基于Fuzzy方案的簇內平均時延最低.通信半徑r=2000時,三種方案的變化趨勢與r=1000時相似,數據傳輸優化模型隨通信半徑變化仍舊保持良好性能,基于Fuzzy方案在保證傳輸質量的前提下降低傳輸時延.
在車聯網場景中,車輛位置、速度及網絡拓撲快速變化,這種變化具有不確定性,本文提出的基于廣義距離的分簇算法劃分相對穩定的簇,在簇內選擇出比其他節點更加穩定的節點作為簇頭,能夠保持簇頭與簇內成員之間數據傳輸的穩定性,提高傳輸鏈路的質量.

圖6 簇內平均吞吐量與平均時延性能比較
(14)
(15)
為了改善車輛網簇內數據傳輸性能,本文基于復雜網絡理論構建車聯網通信模型,針對城市大規模車輛通信環境提出一種分簇 及基于模糊邏輯選擇簇頭并優化簇內數據傳輸的模型,模型充分考慮了車聯網形成穩定分簇的條件以及物理層無線信道條件,基于真實數據模擬了大規模車輛簇內通信環境.仿真結果表明,本文方案與MNC算法和隨機算法相比,有效提高了系統吞吐量,降低傳輸時延.
下一步工作將對簇內傳輸路徑進行優化,考慮路徑損失等車輛節點的通信狀況來進一步優化傳輸模型.