徐翠萍,譚獻海
(西南交通大學 信息科學與技術學院,成都 611756)
天地一體化網絡由天基網絡、空基網絡及地基網絡等空間網絡互聯融合而成,其中,地基網絡包括高速鐵路(簡稱:高鐵)專網、船舶專網、民航專網。
高鐵專網作為鐵路信息化公共基礎平臺,不僅要承載通信專業的移動通信業務,還要承載非通信專業的鐵路運調、票務、營運、供電等業務,以及面向鐵路旅客的服務類業務。隨著天地一體化網絡的高速發展,為增強高鐵通信的可靠性,迫切需要研究流量資源的分配方式。目前,國內外尚缺少針對基于天地一體化網絡的高鐵專網業務的深入研究。
本文對天地一體化網絡的高鐵專網業務進行分析,進行流量建模,通過分析高鐵核心業務系統(重點是高鐵核心控制類業務及旅客服務類業務),抽象其中具有代表性的業務傳輸內容、報文到達間隔等特征,完成核心高鐵業務流量建模,為后續的流量預測、網絡資源分配、流量監管等工作奠定基礎。
天地一體化信息網絡[1]貫穿海洋遠邊疆、太空高邊疆、地基網絡新邊疆,是信息時代掌握全球資源的戰略性公共信息基礎設施。天基網絡由天基骨干網與天基接入網組成,天基骨干網是由 6 顆與地球相對靜止的衛星構成的雙環狀網絡,天基接入網由120 顆、分布在12 個軌道面的低軌衛星構成;空基網絡由各類民用、軍用飛行器組成;地基網絡則由地面互聯網、地基節點網等組成。
天地一體化網絡中的天基網絡與高鐵、船舶、民航等地面專網均相對孤立,且具有異質、異構的組網機制和通信協議,在網絡的移動性、可擴展性、安全性、業務服務質量(QoS, Quality of Service)等方面也存在著明顯差異,導致天基網絡無法直接實現與各類地面專網的高效互聯,難以跨越多個異構網絡進行信息共享和資源整合,易形成信息孤島并影響專網用戶的服務質量。因此,亟需研究如何在保證服務質量的前提下更合理地分配網絡資源。
天基網絡作為高鐵專網的輔助,是高鐵業務通信的基礎[2-3],高鐵專網根據通信和使用場景的不同,以列車為中心,分為4 種網絡。(1)列車網絡:主要包括列車通信網(TCN,Train Communication Network) 和 輔 助 資 源 計 算 機 網( ARCNET,Auxiliary Resource Computer Network);(2)車—地通信網:包括軌道電路、查詢應答器、鐵路綜合數字移動通信系統(GSM-R,Global System for Mobile Communications-Railway)、鐵路寬帶移動通信系統(LTE-R,Long Term Evolution-Railway)、軌道電纜等;(3)車—車通信網:包括超短波直接通信、GSM-R、LTE-R;(4)地面通信網:包括基礎網、移動通信網、業務網3 部分,能為鐵路的運營提供基本的語音、數據、圖像的通信等。
高鐵應用于專網的業務種類繁多,現有的高鐵應用業務分為3 個領域、10 個主要應用方面和38 個重要應用系統。由于網絡資源有限,不可能全部通過天地一體化網絡來傳輸。比較可行的做法是將天地一體化網絡作為一種新的通信手段,或作為現有系統通信方法的備份手段,當現有通信網絡不通時,改走天地一體化網絡。適合通過天地一體化網絡傳輸的高鐵業務應是那些與高鐵營運安全密切相關的核心業務。
本文選擇與高鐵運營密切相關的5 類核心業務進行建模與研究,包括列車控制、調度指揮、緊急救援、旅客服務及行車安全監控與災害防護。其中,旅客服務屬于非控制類業務,其余屬于控制類業務。
本文重點分析控制類業務中的列車控制業務和非控制類業務中的旅客服務類業務。
列車運行控制系統[4-5](簡稱:列控系統)是用于控制列車運行速度,保證行車安全和提高運輸能力的控制系統。本文基于CTCS-3 列控系統進行研究[6],其結構可進一步劃分為地面子系統和車載子系統。列控系統的信息流向如圖1 所示。

圖1 列控系統信息流向示意
由圖1 可知,列控系統信息流向可從4 個部分進行研究,列控車載子系統、列控地面子系統、車站聯鎖及行車指揮中心(CTC,Centrailized Traffic Control)。
列控車載子系統可實現與地面安全傳輸信息、計算列車運行速度和運行距離等功能。列控車載子系統在運行中反饋給列控地面子系統的車輛信息包括車輛基本信息、位置信息及速度信息。
列控地面子系統包括無線閉塞中心(RBC,Radio Block Center)、 臨 時 限 速 服 務 器(TSRS,Temporary Speed Restriction Server)、軌道電路、列控中心(TCC,Train Control Centers)、應答器。TCC 接收軌道電路的信息,并通過聯鎖系統傳送給RBC;RBC 根據軌道電路、聯鎖進路等信息生成行車許可發給列車,行車指揮中心發送臨時限速命令信息給臨時限速服務器,臨時限速服務器向TCC 傳遞臨時限速命令,集中管理臨時限速。
CTCS-3 級列控系統中實現車地系統通信有3 種方式,包括軌道電路、應答器及GSM-R 無線通信。其中,軌道電路傳輸行車許可、線路參數、進路信息及列車數據信息;應答器傳輸定位信息、線路參數、進路參數、臨時限速等信息,滿足行車指揮中心等其他系統的需求。列控系統業務數據內容如表1 所示。

表1 列控系統業務數據內容
高速列車的旅客服務流量大且集中,以娛樂性的網絡流量為主,業務發生源主要為智能手機、平板電腦和筆記本電腦等。因此,旅客服務類業務多屬于移動互聯網業務。本文對移動互聯網業務進行建模,依據QoS 標準,劃分4 類常見的旅客服務類業務,分別為:傳統互聯網業務、即時通信業務、流媒體業務和P2P(Peer to Peer)業務。
高鐵專網業務建模包括控制類業務和旅客服務類業務2 個方面。控制類業務分析與流量建模方面,由于,相關的研究尚少,能參考的內容不多,本文采用純流量分析的方法進行建模。從業務的實現原理及流程出發,分析每一類業務的信息傳輸內容及流向,抽象每一類傳輸報文的報文種類、到達時間間隔、報文長度等參數,據此構建控制類業務流量模型。旅客服務類業務分析與流量建模方面,高鐵旅客服務與一般的互聯網服務相似,相關研究較多,本文采用理論分析與實際流量擬合相結合的方法開展旅客服務類業務分析與流量建模。以已有的網絡流量建模研究成果,初步確定旅客服務類業務的流量模型,再通過實際網絡流量進行擬合驗證。
由對列控系統業務信息傳遞的分析可知,列控系統數據可分為周期性和隨機性2 種類型。
3.1.1 周期性業務模型
軌道電路和應答器傳輸的數據(如列車信息、線路參數、行車許可)是規律的,其數據包長度與發送時間間隔固定。本文根據這2 個參數建立周期性業務模型為[7]

其中,R是周期性數據;N是數據編號;L是數據長度(單位:byte);T是發送時間間隔(單位:ms);信息包類型總數為36,i=1,···,36。
以報文傳輸內容為分類依據,列控系統周期性業務模型(部分)如表2 所示。

表2 列控系統周期性業務模型(部分)
3.1.2 隨機性業務模型
隨機性業務是指由外界觸發產生,由觸發概率決定的業務。Poisson 分布適合描述單位時間內隨機事件發生的次數。以臨時限速包為例,臨時限速命令由RBC 發送給列控車載子系統。假設在任何時間段內,工作人員發出臨時限速命令的概率為P,且發出命令與前后業務的產生沒有任何關系,則認為列車在單位時間內需要限速的次數服從Poisson 分布

其中,P代表工作人員發出臨時限速命令的概率;X(t) 代表命令發出次數n與時間t之間的函數關系,n=0,1,2,···; λ 代表隨機性業務發生的頻率。每次發送限速命令的時間間隔可以由Poisson 分布推導,得出單次操作的時間間隔服從指數分布。假設發出限速命令的時間間隔為t,則每次限速命令的發出時間間隔為

由上式推導的隨機性業務模型如表3所示。

表3 列控系統隨機性業務模型
考慮到旅客服務類流量數據涉及用戶隱私,較難獲取,本文利用實驗室局域網模擬列車上網環境,使用WireShark 收集2021 年6 月2 日9:00~17:00期間產生的流量數據,并與公開流量數據集的部分數據進行整合,作為旅客服務類研究數據。
通過數據擬合實驗獲得4 類業務報文到達時間間隔所對應的概率分布模型擬合參數,并引入回歸評價指標R2和均方根誤差作為擬合算法的檢驗標準,旅客服務業務模型如表4 所示。

表4 旅客服務類業務模型
本節對列車控制、調度指揮、緊急救援、行車安全監控與災害防護及旅客服務類業務5 類核心業務流量特性進行分析與建模。
本文利用Matlab 軟件,依據流量模型產生控制類業務流量,包括4 類高鐵控制類業務的周期性流量和隨機性流量;同時將實驗室捕獲的數據與在網上獲取公開數據集Bellcore 聚合得到旅客服務業務數據;將控制類業務與旅客的服務類業務流量數據聚合得到高鐵專網業務流量數據集,并命名為HSRBFlow,其包含100 000 條數據,作為本文研究的數據來源。
高鐵專網業務流量(簡稱:流量)數據曲線如圖2 所示。從圖2 中可初步觀察流量的變化趨勢[8-9]。圖2(a)和圖2(b)的橫坐標為時間,間隔分別為1 s 和5 s;縱坐標為數據包長度(單位:kB),二者的流量不隨規模大小、拓撲結構及時間尺度的改變而改變,局部和整體的流量結構存在自相似性,初步判斷流量具有自相似性;此外,兩圖中均存在某些時刻數值突然攀升的情況,說明流量具有突發性;流量每間隔一定時間會重復,因此,還具有周期性。

圖2 不同時間間隔合成流量曲線
高鐵專網業務流量具有自相似性和突發性,本文采用alpha-stable 自相似模型[10-11]對其進行建模。alpha-stable 自相似的特征函數為[12]

其中,

α為特征指數,表示分布中突發的程度;β 為偏斜參數,控制分布的尾部變化情況; σ 為尺度參數,表示分布的偏差值;μ 是位置參數,表示分布的中值。本文采用分位數法計算流量在alpha-stable 自相似分布的參數,擬合比較仿真流量與alpha-stable 自相似分布的概率密度曲線,擬合結果如圖3 所示,其中,橫坐標為數據包長度,縱坐標為概率密度。
由圖3 可看出,藍色的流量數據概率密度曲線很接近紅色的alpha-stable 自相似分布的概率密度曲線,且流量數據尾部具有明顯的重尾化特征。兩者大部分數據的概率密度相等,雖存在部分差異,但由于整體概率密度的數量級非常小,因此,同一流量值對應的兩種概率密度的差異不大,從直觀角度判定可使用alpha-stable 自相似分布描述流量的自相似性與突發性。

圖3 仿真流量與alpha-stable 自相似分布擬合結果
為更準確地觀察數據分布模式,本文通過QQ(Quantile-Quantile)圖[13]來判斷給定流量數據是否符合分布擬合結果,如圖4 所示。圖4 中,橫坐標表示alpha-stable 自相似分布的分位數,縱坐標表示高鐵專網業務流量數據的分位數。分析圖4 可知絕大部分數據點都處在一條近似直線上,尾部最后幾個數據點有偏差,但仍處在95%的置信偏差區間內,因此,可認為在可接受偏差范圍內;個別數據偏差較大,占整體比例太少,可忽略不計。綜上,可認為流量服從alpha-stable 自相似分布。

圖4 Q-Q 圖展示
本文研究適合通過天地一體化網絡傳輸的高鐵業務流量建模及其應用的關鍵技術問題,在分析高鐵營運安全密切相關的核心業務的基礎上,抽象高鐵業務組成、業務特征等。以列車控制業務和旅客服務業務為例,通過分析系統結構及信息流向對高鐵專網業務進行建模,在業務建模的基礎上構造數據集,分析驗證高鐵專網業務流量的周期性、自相似性及突發性等,是后續流量預測及空天地一體化網絡資源分配等關鍵問題解決的基礎。