譚詩翰,金鳳林,頓聰穎,孟凡倫
(陸軍工程大學 指揮控制工程學院,江蘇 南京210007)
隨著地面多媒體業務的激增、移動互聯網的蓬勃發展及人類活動范圍的進一步擴大,用戶對無處不在的無線網絡服務和更快數據傳輸速率需求日益增加,無線通信產業面臨嚴峻的考驗。空天地一體化網絡系統(Space-Air-Ground Integrated Network,SAGIN)將空間網絡、空中網絡與地面網絡互連,具有網絡資源豐富、網絡覆蓋范圍廣的特性,受到學術界和工業界的廣泛關注[1]。
然而,由于各網絡空間使用的網絡通信設備不同,所處的網絡通信環境不同,不同網絡空間上的網絡系統及管理(如網絡架構、資源分配方法以及緩存策略等)具有多樣性,網絡特性(如網絡時延、網絡資源、覆蓋范圍等)具有差異性[1],造成SAGIN整體網絡結構復雜,各層網絡系統管理難以統一以及網絡系統間的協同策略制定困難。因此,設計一種可以適應SAGIN復雜網絡環境的網絡管理架構對SAGIN建設發展有著重要意義。
已經有一些研究針對SAGIN網絡管理架構的設計進行了討論。文獻[2]將SDN和NFV應用在衛星架構的設計上來,有效增強了網絡系統的穩定性和靈活性。文獻[3]提出了一種基于軟件定義無線電技術的空間信息系統架構(SDS-BI-SIS),以解決當前空間信息系統建設的不足。它們都采用了層次結構和衛星網絡,然而,上述研究關注的是單層空間網絡,而沒有考慮到SAGIN各層網絡空間相協同的情況。文獻[4]提出了一種用于操作響應空間(ORS)的網絡方案。該方案是一個基于OpenFlow和網絡虛擬化技術的空間-地面一體化網絡,為一些突發情況的快速處理提供了新的思路,具有很高的敏捷性和靈活性。文獻[5]提出了一種分級服務交付體系結構,并強調了其在選定的衛星—地面集成場景中的潛在作用。這些研究主要集中討論SAGIN的架構設計,對于各網絡空間如何基于所提出的架構進行協調管理缺少具體的研究和論證。
本文在SAGIN不同網絡空間分布式移動網絡架構基礎上部署MEC,構建SAGIN多維管理架構。通過對網絡系統分層,使SAGIN內各網絡可以自主構建網絡拓撲,分配網絡資源;MEC作為管理實體,對SAGIN不同網絡進行協同管理。
本文的主要貢獻總結如下:
(1)構建SAGIN多維管理架構,對網絡系統分層,利用MEC對SAGIN各網絡空間進行協同管理。SAGIN各網絡可以在分布式管理架構下具有很強的自主性。
(2)基于SAGIN多維管理架構搭建網絡仿真平臺,為MEC配置強化學習方法用于制定網絡協同策略,通過仿真實驗證明該架構的可行性。
MEC是指在移動網絡邊緣部署計算和存儲資源,為移動網絡提供智能服務環境和云計算能力。本文中,MEC作為網絡系統的管理者,與SAGIN內不同網絡互聯。MEC通過與SAGIN系統內網絡進行通信交互,利用其內部存儲模塊,收集匯總網絡狀態信息和用戶服務請求信息。利用MEC云計算能力,分析處理所收集到的網絡系統信息,制定最優的網絡管理策略。MEC將網絡管理策略傳輸給SAGIN系統內網絡,不同網絡根據MEC制定的網絡管理策略采取相應的網絡動作,實現對SAGIN不同網絡間的協同管理。
分布式移動網絡架構較傳統集中式網絡架構具有更好的靈活性、可拓展性和可靠性性,廣泛地應用于SAGIN各網絡空間網絡系統[6-9]。本文依托GEO衛星,將地面區域劃分為固定的網絡服務區域[10]。網絡服務區域覆蓋范圍內的空間、空中和地面網絡作為一個系統整體,各網絡空間內的分布網作為其子網絡。通過部署MEC對子網絡進行協同管理。
將SAGIN劃分為三層:數據層、控制層和管理層。其中數據層和控制層實體對應于子網絡在分布式移動網絡中的數據節點和控制節點,即子網絡數據節點和子網絡控制節點;管理層實體為MEC,即管理節點。
各網絡層的具體功能介紹如下:
(1)數據層:通過子網絡數據節點為用戶提供網絡接入以及數據傳輸服務。子網絡數據節點由所屬的子網絡控制節點控制,負責其資源分配及運作模式。此外,子網絡數據節點將自己的數據信息傳輸到所屬的子網絡控制節點,輔助子網絡控制節點判斷網絡狀態。服務分配策略會通過衛星網絡統一下發到用戶,子網絡數據節點會根據服務分配策略,判斷是否響應用戶服務請求。
(2)控制層:主要有三個方面功能,一是信息采集,子網絡控制節點接收來自數據層的用戶信息和服務請求。收集接入用戶類型、數量以及子網絡資源利用率等信息。在進行特征提取、異常診斷和數據計算等工作后,將子網絡狀態信息傳輸到管理層,輔助管理層決策;二是本地管理,子網絡控制節點根據自身情況為接入用戶分配網絡資源,并下發給子網絡數據節點;三是策略轉發,子網絡控制節點接收管理層的網絡服務分配策略,并轉發給相應的子網絡數據節點。
(3)管理層:主要有三個方面功能,一是內部資源的注冊和查詢,對所屬范圍內的子網絡進行注冊,并提供外部網絡對子網絡的查詢功能;二是創建策略,根據控制層上傳信息,確定網絡系統內部各子網絡的狀態信息、用戶的服務請求信息,來創建網絡服務分配策略,并下發給子網絡控制節點;三是網絡系統對外的通信交互。
圖1給出一個典型的SAGIN架構,包含三個子網絡:多層衛星網、空中自組網和地面異構網。其中多層衛星網屬于多層衛星通信系統,其分布式控制節點是GEO衛星,而數據節點是LEO衛星,LEO衛星在GEO衛星的統一管理下共同服務于同一地面區域。LEO衛星以及空中自組網的數據節點和地面網的數據節點共同構建SAGIN數據層;GEO衛星、空中自組網控制節點以及地面異構網控制節點共同構建SAGIN控制層;MEC作為SAGIN管理層實體與子網絡控制節點連通。

圖1 SAGIN網絡架構
為簡化模型,假設每一個用戶周圍都部署有SAGIN終端(SAGIN-T)[11],SAGIN-T擁有接入SAGIN空間、空中和地面子網絡的能力,用戶可以通過SAGIN-T接入所在范圍內任一子網絡。SAGIN-T接入網絡系統后,首先向子網絡控制節點上傳自身的位置信息以及周圍的網絡環境信息,并定期更新。
如圖2所示,用戶首先根據自身所需的服務特性,通過自描述服務請求機制[12],向其可能接入的SAGIN-T發送服務請求,SAGIN-T會根據用戶的服務請求,分析判斷用戶所需的服務類別,添加服務類別標簽。將服務類別信息等傳送給所屬子網絡,子網絡控制節點將其接收到的用戶服務請求信息上傳到管理層。同時,子網絡控制節點會周期性收集其所屬數據節點的狀態信息,并將其傳送到管理節點。管理節點對所接收到的用戶服務請求信息進行注冊、登記,并結合子網絡上傳的網絡狀態信息,根據自身的網絡服務分配策略,為用戶服務分配子網絡,并下發給對應子網絡。子網絡控制節點接收到管理層下發的網絡分配策略,結合其所屬的子網絡數據節點狀態信息和用戶服務請求信息,根據自身的網絡資源分配策略,為用戶分配網絡資源,并向SAGIN-T發送服務響應信息,完成對用戶服務請求的響應。

圖2 SAGIN網絡架構工作流程
本文使用NS2平臺和Python搭建了一個系統級網絡仿真環境。利用NS2平臺模擬和采集網絡數據,利用Python模擬MEC運行機制,對所收集的數據進行分析、處理,并輸出對用戶服務的分配策略。
本文采用了一個典型的SAGIN場景模型,如圖3所示,其中地面子網絡由一個地面基站(BS)組成;由三個無人機組成空中子網絡,作為地面網絡的補充,為地面小區邊緣用戶以及地面小區覆蓋范圍外的用戶提供服務;單顆LEO衛星作為空間子網絡,可以提供更為廣闊的網絡覆蓋范圍以及豐富的鏈路資源,以為其他網絡空間覆蓋范圍外的用戶提供服務,以及分攤地面網絡以及空中網絡的傳輸壓力。每個子網絡都由其控制節點來負責管理所屬數據節點,控制節點采用線性規劃的方法[13],對由MEC所分配的用戶分配網絡資源,由于控制節點位置對仿真操作和實驗結果影響不大,因此并未在圖3中標出。每個用戶通過SAGIN-T接入SAGIN,最多有3種可能的方式來訪問網絡,即地面子網絡、空中子網絡和空間子網絡。每個用戶同時只能接入一個子網絡。

圖3 SAGIN實驗仿真場景
由于空間、空中和地面網絡空間使用的頻段不同,信號衰減度不同,故可以區分不同網絡空間,構建網絡傳輸模型[14]。
本文依據用戶對傳輸速率的需求以及對網絡時延的敏感程度,劃分兩種服務類別:非實時服務(NRT)和實時服務(RT)。其中,非實時服務由傳統的數據應用程序生成,如郵件下載、網上沖浪等;實時服務是由語音應用程序或視頻流生成,對時延要求較高,考慮到衛星通信時延高,所以實時服務只能接入地面子網絡和空中子網絡(具體參數設置見表1)。

表1 參數設置
仿真實驗中MEC通過學習由控制層上傳的網絡環境數據,根據用戶服務請求信息,利用Q-learning算法,獲得最優服務分配策略,通過控制每個用戶接入的子網絡,對SAGIN不同網絡進行協同管理[15]。Q-learning算法具體介紹如下。
定義網絡系統狀態s=(S1,S2,S3,r),其中S1、S2、S3分別表示地面、空中和空間子網絡的狀態量,r用來描述最近一個服務數據。子網絡狀態量表示為:

定義動作空間a={1,2,3}。1、2、3分別表示地面、空中和空間子網絡。
定義網絡獎勵為:

其中U(s,a)表示網絡效用值,B(s,a)表示對網絡擁塞的懲罰。網絡效用值由系統的整體用戶滿意度決定,整體用戶滿意度反映了用戶對網絡系統服務的滿意度水平,其計算方法參照文獻[16],由于篇幅原因,在此不再贅述。
定義狀態-動作對(s,a)的價值函數Q(s,a)。Q(s,a)的更新式為:

其中ρ是學習率(0<ρ<1);Ψ為后續狀態對當前狀態的影響因子;設τ為設置的離散時間間隔,i為系統內相鄰服務請求間隔時間△t相對于τ所需要的迭代次數。
運行上文所構建的網絡仿真場景,并在不同網絡環境下對SAGIN多維管理架構子網絡協同管理和用戶隨機選擇接入子網絡兩種方法的網絡系統整體用戶滿意度和擁塞率進行了對比,實驗結果表明在網絡系統的整體用戶滿意度和擁塞率上所提架構對子網絡協同管理要優于用戶隨機選擇接入子網絡。
如圖4所示,在網絡資源充足的環境下,網絡的擁塞率較低,由初始狀態到達網絡狀態相對穩定之后,通過短時間的學習,本文所提架構對子網絡進行協同管理相較于用戶隨機選擇接入子網絡整體用戶滿意度上升超過15%。

圖4 資源充足環境下對比
如圖5所示,在網絡擁塞的環境下,由于網絡資源利用率較高,可調控的資源量比較少,因此對子網絡協同管理相較于用戶隨機選擇接入子網絡整體用戶滿意度變化不大,但是子網絡協同管理相較于用戶隨機選擇接入方法的子網絡擁塞率下降超過50%。

圖5 網絡擁塞環境下對比
本文對基于MEC的SAGIN多維管理架構做了詳細介紹,并在此基礎上加入Q-learning算法用于MEC策略決策,通過仿真實驗驗證了所提架構的可行性。但是,不可忽視的是,隨著信息網絡的發展,SAGIN網絡用戶的數量和多樣性激增,服務定制以及差異化服務需求增加,對網絡的傳輸能力以及網絡信息的分析處理能力提出了更高的要求。因此,設計更為靈活可以適用于更多樣的網絡服務場景的SAGIN管理架構,以及更為高效的網絡管理策略將是下一步研究的重點。