范怡敏,羅云飛,沈克永
1.南昌理工學院 計算機信息工程學院,南昌 330044
2.華為技術有限公司,廣東 深圳 518129
車載網絡作為當前智能交通系統的重要成員,通過車與其他單元間相互交流信息,為高效、舒適、安全駕駛提供了有力保障。面對復雜的駕駛環境,對道路安全等問題,對車輛自組織網絡中數據傳輸的效率以及準確性要求更加嚴格。特別是當發生車禍或嚴重堵車時,大量車載節點頻繁接入協議固定分配的信道時,嚴重增加了數據傳輸中分組丟失率和效率,這成為當前亟待解決的熱點問題之一[1-2]。
認知無線電(Cognitive Radio,CR)是解決無線電頻譜利用率不足問題的關鍵機制。CR可確保有效使用可用的無線電頻譜,而不要求新頻段的分配。其動態和智能的自動選擇傳輸參數和接入技術,可最大化信道利用率。目前已有和即將推出的車輛預計都將在車輛行駛過程中,提供車載內部命令傳輸和無線服務動態接入功能[3-4]。CR作為一個頻譜資源再利用的核心技術[5],包括三個組件:(1)頻譜感知:要求次級用戶(Secondary User,SU)在作用距離內感知和檢測無線電頻譜環境,以檢測未被主用戶(Primary User,PU)占用的無線電頻段;(2)動態頻譜管理:要求CR網絡動態進行信道分配,以選擇通信的最佳可用頻段;(3)自適應通信:CR設備能夠配置自身的傳輸參數,以伺機充分利用不斷變化的頻譜空洞。
通常,一個具有CR能力的移動終端或車載節點,能夠感知通信環境,根據用戶的喜好和需求從操作環境中分析和學習信息,并對操作參數進行重新配置,以符合系統規則。雖然CR問題在協議棧的所有層中都有出現,但關鍵問題都局限于物理層和媒體訪問控制(Media Access Control,MAC)層,因為在無線信道上進行通信的控制和協調都發生在MAC層。文獻[6]是一種搶占式的MAC方法,目的是降低端到端的延遲。其主要利用MAC層的感知刺激建立頻譜機會圖,然后確定最佳的感知時間和傳輸時間,協調與其他用戶的頻譜接入。文獻[7]在車載網絡中,以干擾概率作為約束條件,利用感知時間的訪問策略和窮舉搜索,以完全跨層設計為目標,共同優化頻譜感知參數和訪問參數。文獻[8]在異構信道可用的情況下,研究局部感知可用,對具有較高可用性的信道進行感知的統計感知策略可能會提高通信性能。然而,文獻[8]并沒有指出需要找到一個有效智能的機制,以感知和分配PU未占用的射頻信道,以有效部署有利于SU的CR網絡。
雖然認知無線電已被成功應用于車載網絡,且不用分配專用頻率。但建立有效感知和智能數據傳輸依然十分困難。本文主要通過一個集成的MAC協議(Integrated MAC,IMAC)解決頻譜感知和動態頻譜管理問題。IMAC包含基于模型預測控制(Model Predictive Control,MPC)部分,可對分配給PU信道的未來狀態進行預測。IMAC則使用該預測執行頻譜感知和動態頻譜管理。
MAC協議可以被映射到一個包括動態變化約束的多變量優化問題。但需要SU進行數據傳輸最優信道時必須具有先應性。基于模型預測控制(Model Predictive Control,MPC)系統[9]是解決該類問題的最好方法之一,因為MPC可以提前幾個時間間隔預測變量數值,防止相鄰時間間隔的變量預測值出現急劇的增加或下降,并可以處理隨時間變化的多約束多變量的優化問題。MPC最初設計目的就是解決該過程,并以滾動優化的方式解決一系列最優控制問題[10]。其主要優勢是以一種系統化的方式處理輸入和狀態約束問題。
通常,MPC預測模型包括以下2個問題:(1)需要對變量的值進行預測;(2)需要通過預測計算使變量有界。基于MPC系統的典型例子如圖1所示,其中模塊A決定約束變量的上下界;模塊B預測受模塊A支配約束;模塊D基于預測做出決策,并在系統上執行該決策,由此可以測量約束變量的實際數值;模塊C對比模塊D和模塊E的輸出,并在出現誤差的情況下,將其反饋到模塊A和模塊B。因此,MPC系統是一個具有反饋功能的控制系統。

圖1 MPC框架
提出框架設計的主要特征如下:
(1)將CR車載網絡映射到一個閉環系統,其將信道分配問題轉化為一個可滿足性問題。
(2)使用MPC系統,先應性地決定數據傳輸信道的未來狀態,從而降低信道感知負擔。
(3)在車載網絡中選擇對移動SU數據傳輸最優的可用信道,降低了車載SU節點的負擔,在分布式CR網絡和集中式CR網絡中都可以進行操作。
已知一個主用戶信道列表和M個傳輸狀態,通過IMAC預測未來K個時隙的PU信道傳輸狀態。所有無線傳輸的時間線均被劃分為相等大小的信標間隔或時隙[11]。本文首先描述如何使用該框架,預測PU在下一個即將到來時隙的信道狀態,其后描述如何以相同的方式預測未來K個時隙(K>1)的PU信道狀態。本文這里假定沒有通用性損失,每個PU均與一個專屬的信道相關聯。任意一個PU信道的繁忙狀態或空閑狀態分別取決于相關聯的PU是否正在進行數據傳輸。
設N個與PU相關聯的信道表示為{X1, X2,…,XN}。設表示信道Xi在時隙 j的狀態。在時隙t已知的情況下,與Xi相關聯的歷史多項式Dpi為:

本文這里使用的MPC框架如圖2所示。對于所有的預測變量zi,其約束變量或目標值(NGi)的期望值極限由模塊A設置。對于每個變量zi,模塊B使用期望目標值(NGi)通過控制計算預測zi在MPC框架中的概率,使用數學模型(Dpi)通過以往歷史數值預測zi在現實系統中的概率;模塊D是現實系統,可基于預測做出決策,并執行操作。且將操作的結果反饋給模塊B;模塊B基于模塊C輸出的變量zi的預測值和現實過程中輸出的zi的實際數值,計算變量zi在預測中的誤差。該反饋可提高預測質量。本文將CR網絡的信道分配問題映射到MPC框架上。下面將描述圖2中的MPC框架的各模塊。

圖2 本文算法框圖
值得一提,本文提出的框架在分布式CR網絡和集中式CR網絡中都可以進行操作。在分布式CR網絡中,由基站執行圖2中的模塊A、D和C,并生成以后K個時隙的信道狀態預測。此外基站在K個時隙中對信道進行感知以發現其狀態,并使用該狀態作為對模塊B和A的反饋。在集中式CR網絡中,由每個SU每次在K個時隙中執行圖2中的模塊A、B和C。在執行先應式數據傳輸算法前,所有的次級用戶都要進行如下操作。首先所有的SU相互交換預測值;然后每個SU計算信道Xi,以及信道狀態為空閑的SU數量Ji,1≤i≤N 。
3.3.1 設定點計算
設NGi的值為1(NGi=1),反之則設TGi的值為0。0.6 M的值基于如下條件:當一個信道在近期超過60%的時間為繁忙狀態,則設定該信道的狀態為繁忙。式(3)很好地體現了這一點。

3.3.2 誤差校正和目標計算
模塊B基于從模塊A、模塊C和模塊D得到的反饋,計算未來M個時隙的每個信道Xi的NGi值。模塊A基于以往的時隙,向模塊B提供每個信道Xi的NGi值。模塊D給出每個信道Xi在過去時隙的實際狀態。模塊C給出Xi在過去的M個時隙的預測狀態。對于每個信道Xi,若模塊B和模塊D給出的數值相同,即對上次狀態的預測是正確的,那么更新后的NGi值與模塊A給出的NGi值相同。若對上次狀態的預測是錯誤的,那么更新后的T Gi值對模塊A給出的NGi值進行補充。模塊E將該所有信道Xi更新后的NGi值反饋送到模塊C。
3.3.3 控制計算和預測
模塊C是IMAC的核心模塊,預測未來M個時隙的信道狀態。模塊C存儲式(1)中描述的多項式(Dp1,Dp2,…, D pN)的集合。多項式中的值(t-M≤j≤t-1)為信道Xi(真實數值)在時隙[t-M,…,t-1]的實際狀態。模塊D將這些數值提供給模塊B。NGi為模塊B到模塊C的第二個輸入。模塊C輸出每個信道Xi在即將到來的時隙中處于狀態TGi的概率。這一點由MPC控制計算實現,Dpi被作為系統模型使用,而NGi則用作設定點的目標。因此,本文將MPC框架當做黑盒使用,以計算信道狀態概率。

在上述預測中,為每個有數據傳輸的SU選擇最優信道,以確保連接穩定性和滿足高速動態性。作如下操作:
首先,采集預測信道狀態。
然后,在列表中排列信道,使當前時隙的所有空閑信道排列在繁忙信道的前面;在不止一個信道為空閑狀態的情況下,且距離SU最遠的信道給予優先排序。如果在這種情況下仍然出現了兩個或兩個以上的信道具有相同優先級,則隨機選擇一個信道給予優先級。該處理方法的理論基礎為:主用戶距離一個信道的距離越遠,則其可能產生的干擾越小。
3.3.4 實際過程
模塊D包括先應式數據接收算法[12],輸出信道數據傳輸的真實狀態,并在當前時隙將其作為反饋輸入到模塊A和模塊B中。
上述步驟描述了使用MPC框架預測下一個即將到來的時隙的N個信道狀態的方法。該方法也可以擴展到預測當前的后K個時隙的信道狀態,因為MPC控制計算能夠預測大量時隙的預測變量值。該計算作為一個迭代過程執行如下。
圖2中,模塊C首先預測在時隙t的N個信道的狀態,并使用同樣的方法計算在時隙t+1的信道狀態預測概率。然后,在使用該概率不改變目標值,同時假定對輸出的預測是正確的情況下,預測在時隙t+1的N個信道狀態。將該過程重復K次,以得出在接下來連續K個時隙中N個信道的預測值。
另外,數據傳輸的持續時間劃分為相同大小的信標間隔。而且每個信標間隔被進一步分為感知、溝通和數據傳輸階段(具體如圖3)。由于每個SU節點都是二分之一的雙工收發機,使用一個專用的全局公共控制信道(Common Control Channel,CCC)[13-14]以在發射機和接收機之間交換控制消息。因此,本文假定SU通過周期性信標間隔來同步。即:無論哪個SU節點在何時加入網絡,首先必須要收聽CCC上的信標間隔,并將自身與網絡的其他部分同步。此外,上文所提“時隙”也就是相同的信標間隔。

圖3 信標間隔的時間
為了體現所提車載網絡的優異性,在一個標準的車載CR模擬環境中進行實驗。將文獻[6]和文獻[7]技術視為對照組,文獻[6]是一種搶占式的MAC方法,文獻[7]是一種反應式信道分配方法。
二是市場自主力量相對薄弱。市場主體數量和民營經濟水平對市場力量影響至關重要。2017年大連全市私營企業總數約20.5萬戶,個體工商戶總量達到42.6萬戶 [5]。相比較,深圳私營企業總數超過180萬戶,個體工商戶也超過了130萬戶 [6],而且深圳高科技企業80%以上是民營企業 [7],因此深圳的市場力量才能強大,市場機制才能健全。大連還需要多增加民營企業數量,多培育高科技高成長性民營龍頭企業。此外,大連企業市場化自主決策能力不強。央企、國企的公司管理現代化水平不高,過度依賴領導者喜好來配置人事、生產和銷售資源。民營企業也缺乏真正獨立性,存在一定的政商依附關系。
在包括10個PU和10個PU信道的模擬網絡中對三個算法都進行實驗,并對固定網絡結構和可變網絡結構都進行模擬。MPC的預測范圍K設為3,M設置為8,最優感知時間為14.2 ms,一幀的持續時間為100 ms。假定存在一個全局公共控制信道,以供SU交換控制封包和狀態消息。SU節點假定只通過PU信道,且不通過非授權信道傳輸數據。其目的是為了強調SU可以使用PU信道的限制。
定量評價標準[15]有:信道利用率(Channel Utilization,CU)、退避率(Backoff Rate,BR)、感知延遲(Perceptual Delay,PD)。
CU表示一個信道被用于有效數據傳輸的時間百分比,其定義如下:

其中,tsimu表示模擬的持續時間,tbusy表示在數據傳輸中信道為繁忙狀態的總時間。信道利用率衡量了一個MAC協議在每個無差錯信道上保持相等負荷的能力。

BR衡量MAC協議作出正確預測的能力,定義如下:其中,Nretr表示在數據傳輸階段SU發生退避的總次數,SUbusy表示SU在傳輸數據時的總持續時間。
PD是SU成功傳輸給定數據包之前所感知的平均信道數量,定義如下:

其中,Nfail表示成功傳輸數據前在信道感知階段所感知到的信道總數量,SUpacket表示SU已傳輸數據包的總數量。
本文方法、文獻[6]、文獻[7]在高、中和低三種信道活動中得到的信道利用率如表1與表2所示。通過觀察得知信道利用率最佳的是本文方法。其原因主要是本文方法能夠預測未來信道的正確狀態。文獻[7]信道利用率要優于文獻[6],是因為文獻[7]方法基于過去狀態對信道進行分配,而文獻[6]方法在占有信道一個時隙后,才開始進行數據傳輸,且信道選擇也是隨機的。

表1 集中式結構信道利用率對比%

表2 分布式結構信道利用率對比%
退避率表現了一個主用戶信道的可再用性。本文方法、文獻[6]和文獻[7]在高、中和底的通信量環境下得到的退避率如表3和表4所示。文獻[6]在忙碌的通信量配置文件中具有與本文方法相當的退避率,主要歸功于在數據傳輸開始之前暫停一個時隙的原則。因此在第一個時隙中可能出現的退避被避免了。此外,PU信道活動在繁忙通信量配置文件中最高。與A和B相比,本文協議在退避率上分別得到了一定的改善。

表3 集中式結構退避率對比 %

表4 分布式結構退避率對比 %
感知延遲方面的對比如表5和表6所示。可以看出,與文獻[6]和文獻[7]相比,本文方法降低了感知延遲。

表5 集中式結構感知延遲對比ms

表6 分布式結構感知延遲對比ms
在可變網絡結構中,車載SU的數量從10到60逐漸增加,同時在每個間隔處記錄性能指標。與在固定網絡結構中的情況相似,次級用戶假定為生成指數級別的隨機通信量。車載次級用戶以每小時10~60 km不等的速度,在一個直徑為10 km的范圍內移動。
不同方法在可變SU的分布式網絡結構性能比較如圖4所示。可以看出,信道利用率和退避率隨SU數量的增加而提高。

圖4 不同方法在可變次級用戶的分布式網絡結構性能比較
圖4 (a)中,本文方法對不同數量的車載SU的曲線比較平坦。這說明本文方法的一致性,通過反饋和學習識別出競爭較少的PU信道,具有較好的穩定性。由于設計中的自適應性,本文方法能夠在可變的SU中表現良好。
圖4(b)中,在SU數量較少的情況下,文獻[6]在平均退避時間的表現上稍優于本文方法。主要原因是其傳輸方式比較保守,只在信道空閑的情況下傳輸數據,且實際的數據傳輸會滯后一個時隙。因此,在當前的時隙該信道實際上是閑置的。所以,文獻[6]完成任務的等待時間較長,從而避免了在該時隙發生退避的可能性。這種行為方式只有在SU數量較少的情況下才會有收益。但是,隨著SU數量的增長,該行為會導致信道利用率下降。
另一個可擴展性研究是通過保持SU數量不變,提高PU信道的數量。PU信道的數量從10到60逐漸遞增,并在每個間隔記錄下性能指標。如圖5(a)所示,本文方法的表現優于其他兩個方法。但是,信道利用率隨著PU信道數量的增加而降低。從圖5(b)中可以看出,退避率也隨著信道數量的增加而降低。其原因是隨著PU信道數量的增長,對SU提供服務的PU信道數量增多。

圖5 不同方法在多信道的分布式網絡結構中的性能比較
本文提出的IMAC方法不僅通過對環境的有效學習提高了信道利用率,而且有助于系統在連續多個時隙的一個周期中做出更好的決策。這不僅降低了觀察-判斷-決策-行動的循環時間,而且優化了CR網絡的整體性能。實驗證明了提出方法的有效性。通過使用從MPC框架中得到的結果,降低SU節點需要感知的信道數量。以一個系統化的方式對SU節點進行信道分配以增加信道利用率。