宋光敏,王群青,黃占兵,施迅,韓高健
(1. 聯通(浙江)產業互聯網有限公司,浙江 杭州 310051;2. 中國聯合網絡通信有限公司浙江省分公司,浙江 杭州 310051;3. 華為技術有限公司,浙江 杭州310051;4 華為技術有限公司,廣東 東莞 523808)
隨著工業互聯網、車聯網、智能電網等領域數字化轉型,各垂直行業對確定性時延訴求日益增加[1-4]。例如虛擬現實/增強現實(virtual reality/augmented reality,VR/AR)等應用一般要求時延低于50 ms,并且滿足99.9%以上的時延可靠性要求。港口煤礦等遠控場景要求傳輸時延低于50 ms,并且滿足99.99%以上的時延可靠性要求,工業自動化控制要求傳輸時延低于4 ms,并且滿足99.999%以上的時延可靠性要求。為了滿足各行業差異化服務等級協定(service level agreement,SLA)需求,5G 確定性網絡技術要求對無線、承載網、核心網各域實現資源隔離,確定性調度與轉發,可以將端到端時延時、抖動和丟包率等指標控制在業務所需的上下界[5-7]。
傳統數據轉發網絡基于“盡力而為”和“統計復用”,難以滿足垂直行業超高可靠低時延的業務需求。雖然有一些基于以太網擴展的低時延方案,例如硬實時交換機體系結構(hard real time switch architecture,HaRTES),但以太網不具備網絡帶寬預留能力,無法絕對優先轉發時延敏感業務流[2]。IEEE (Institute of Electrical and Electronics Engineers)協會和IETF(Internet Engineering Task Force)提出了一系列時間敏感網絡(time-sensitive networking,TSN)技術,主要包括IEEE 時間同步(802.1AS)、IEEE 802.1Qav(流媒體優先級隊列)、IEEE 802.1Qbv(時間窗調度)、IEEE 802.1Qcc(TSN 配置),以及其他擴展增強機制,例如流分類、整形與冗余傳輸機制。為了加快5G 賦能工業自動化升級的步伐,中國信息通信研究院、中國聯通、中國移動、華為公司于2020年聯合發布了《5G 確定性網絡產業白皮書》和于2021 年發布了《5G 確定性網絡架構產業白皮書》,詳細調研了行業業務SLA 需求和探討了確定性網絡架構的演進路線。
雖然業界有大量的確定性技術研究,但仍無法滿足垂直行業對網絡可靠性的需求。因為無線傳輸信道存在多徑效應、弱覆蓋、突發干擾等時延抖動因素,空口時延抖動是保障5G 端到端時延可靠性的主要挑戰。5G 預調度技術是一種典型可降低上行業務調度等待時延的技術。通過預先分配上行調度資源,終端用戶可實時發送數據,無須上行調度申請(scheduling request,SR)。為了減少控制信令的資源開銷,免授權技術可以在終端無線資源控制(radio resource control,RRC)實體配置固定資源進行數據傳輸,避免基站頻繁發送上行調度授權(UL grant)消息。在多終端和混合流場景,基站無法準確感知業務周期與發包偏移時刻,這兩種技術往往需要密集預留空口資源保障業務的可靠性,造成空口資源嚴重浪費。另外,在空口質差場景中,數據傳輸解碼失敗,會引入額外的重傳時延,降低端到端時延可靠性。分組數據匯聚協議(packet data convergence protocol,PDCP)復制可以提升空口鏈路的可靠性。這種技術對終端的能力有依賴,并且通常對小區所有簽約用戶的報文(5QI 粒度)進行復制重傳,無法針對某一個終端的單一業務流開啟。為了解決上述問題,核心網可深入感知業務流特征、協同基站和應用,進行跨域調度,提升5G 端到端時延確定性能力。
本文聚焦于AGV 協同業務,AGV 之間通過5G 局域網(local area network,LAN)傳輸導航與定位指令,協同搬運貨物?;诨【€業務模型,推導和分析主從AGV 間距誤差(業務KQI)與網絡時延可靠性之間的映射關系。為了應對空口上行調度等待時延、弱覆蓋和同頻信號干擾等時延抖動因素,本文提出了一種端邊協同時延確定性保障技術方案,實現業務流級跨域時延保障。首先,核心網可基于業務IP 與端口號等特征,實現流分離,利用機器學習等算法推斷單流業務的起始發包時刻與業務周期。這可以突破基站無法識別多流業務特征的瓶頸。
核心網可協同基站,進行空口資源預留,降低空口上行調度等待時延和資源開銷。同時,用戶面功能(user plane function,UPF)可向基站訂閱空口信道狀態數據,針對某一業務流,動態開啟對應終端側與UPF 側的傳輸可靠性保障措施,提升空口質差場景的時延可靠性。
從廣義來看,5G 端到端(end-to-end,E2E)通信主要包含兩類:終端到終端和終端到服務器。本文聚焦主從AGV 通信業務,針對終端到終端場景進行5G E2E 時延分析。E2E 時延指終端設備之間端到端通信的來回時延。 5G 端到端時延如圖1所示,E2E 時延主要由節點處理時延與節點之間的傳輸時延構成,終端到服務器場景僅包含單次空口傳輸時延,但涉及UPF 轉發到應用服務器的時延消耗??梢员硎緸椋?/p>

圖1 5G 端到端時延

各變量具體含義如下。
·tradio代表終端設備與基站之間的無線傳輸時延,主要由物理層通信引起。無線傳輸時延取決于無線傳輸的物理距離,以及無線環境的信道質量,例如射頻信號被建筑表面反射,穿越叢林等,無線傳輸的物理距離。在空口弱覆蓋或干擾場景,初傳包丟包后,空口會進行HARQ 重傳和RLC 重傳。重傳時延開銷與基站配置的HARQ/RLC 重傳間隔與最大重傳次數相關。
·tgnb:代表基站的處理時延?;驹谖锢韺犹幚砩婕靶诺谰幗獯a、信道交織與去交織,循環冗余校驗(cyclic redundancy check,CRC)、信號調制與解調、波束成形、正交頻分復用(orthogonal frequency division multiplexing,OFDM)信號產生等。另外一方面,數據包會在任務緩存隊列中產生排隊等待時延,主要與物理層資源塊(resource block,RB)的數目與RB 復用能力相關。特別地,在傳統上行調度中,終端發送上行數據時,可能會從RRC_idle(空閑)或 RRC_inactive(休眠)狀態進入RRC_connected(連接)狀態,并向基站發起調度申請(scheduling request,SR),產生上行調度等待時延。
·transport:代表基站與核心網之間的光纖傳輸時延。時延的主要影響因素有基站到核心網的距離,接入、匯聚、核心的網絡拓撲結構,以及傳輸設備的轉發能力。一般來說,相比空口傳輸,光纖傳輸時延會低很多,時延的抖動范圍也更小。
·tcore:代表核心網處理時延。時延的主要影響因素是UPF 轉發策略、轉發路徑、IP 尋址以及報文過濾。
總體來說,E2E 時延包含上下行無線傳輸時延、上下行基站處理時延、往返光纖傳輸時延和核心網處理時延。為了便于描述,本文把無線傳輸時延與基站處理時延統稱為空口時延。
本節主要介紹5G 使能多AGV 協同業務、5G通信組網,并推導業務KQI 與網絡時延可靠性之間的映射關系。
為了滿足生產作業的復雜性,多AGV 可通過協作完成設定的任務,如協同搬運大型貨物。本文考慮經典的“領航—跟隨”協作模型[2]。這種模型把小車劃分為主AGV 類型和從AGV 類型。
主AGV 承擔領航任務,具備自主導航能力。通常來說,AGV 可以采用同步定位與地圖構建(simultaneous localization and mapping,SLAM)技術進行導航規劃。根據文獻[2],主AGV 硬件架構如圖2 所示。上位機主要包含Linux 開發板,運行SLAM 定位算法與導航控制系統。上層控制層包含激光雷達和視覺采集相機等傳感器模塊。僅依靠激光雷達或者相機掃描數據,很難在復雜環境準確構建地圖。AGV 可以融合激光雷達、視覺特征等傳感器數據,提升地圖構建精度,消減導航累積誤差。主AGV 在領航運行時,需要向從AGV 實時傳輸導航指令,包含運行的速度、加速度、角速度等信息。

圖2 主AGV 硬件架構
從AGV 以跟隨主AGV 運行,協同完成貨物搬運任務為主。在“領航—跟隨”關系綁定后,從AGV不會進行自主導航規劃,按照主AGV 發送的導航指令巡航。同時,從AGV 會實時定位,將自身位置信息以一定的控制頻率上報給主AGV,輔助主AGV 進行導航指令計算,以及監控主從AGV 距離信息。為了AGV 協作安全運行,當主從AGV 距離超過既定門限后,主AGV 會降低運行速度甚至停車,同時也會將降速指令發送給從AGV。生產作業時,主從AGV 可以靈活切換“領航—跟隨”角色,故從AGV 采用與主AGV 同構的硬件架構。
5G LAN 可以為工業制造提供跨域連接和企業移動專網,允許設定用戶組實現Ethernet 和IP通信?;?G LAN 的主從AGV 組網如圖3 所示,機器人控制系統(robot control system,RCS)、主從AGV 均通過CPE 接入5G LAN。RCS 機器人控制系統可以通過5G 網絡向既定的主從AGV 發送協同搬運任務。主從AGV 收到RCS 指令后,完成“領航—跟隨”模型綁定。主從AGV 業務初始化后,主AGV 以發包頻率f向從AGV 發送導航指令,從AGV 同樣以發包頻率f向主AGV 發送位置信息。在主從AGV E2E 通信中,報文經歷空口上下行傳輸時延、基站處理時延、傳輸時延以及核心網處理時延。

圖3 基于5G LAN 的主從AGV 組網
主從AGV 距離誤差是業務KQI 的關鍵指標。E2E 時延抖動導致從AGV 接收導航指令滯后,從而拉大主從AGV 間距,AGV 可能會減速降低貨物搬運效率,甚至導致貨物脫落。同時,主AGV 接收從AGV 位置信息也會滯后,不能精確計算從AGV 下一時間窗的導航指令。當主從AGV 距離超過告警門限后,AGV 會觸發保護性停車機制。另一方面,連續多個時間窗未收到報文,會觸發AGV“看門狗”機制,判決“主從通信失聯”,主從AGV 業務均會重啟。由此可見,AGV 協同業務對時延可靠性有較高需求。通常來說,元器件可靠性、定位算法誤差也會影響主從AGV 的距離誤差。本文重點分析5G 網絡時延對距離誤差的影響。下面推導業務KQI與時延SLA 的映射關系。
主從AGV 業務協作搬運貨物涉及直線運動與弧線轉彎。主從AGV 可以并排行駛,也可以共線行駛。主從AGV 協同作業示意圖如圖4 所示,本文考慮主從AGV 并排執行弧線作業,分析業務KQI 與時延SLA 的映射關系。主AGV 以半徑r在內圈做弧線運動。設定主從AGV 額定車距為l,主從AGV 運行速度為v。主AGV 在A1 點執行轉彎,同時向從AGV 發送轉彎指令,從AGV 沿著切向直線運行。經歷E2E 時延t后,從AGV 在B2 點收到指令。此時主AGV 沿著弧線運行到A2點。假設主從AGV 雙向通信的E2E 時延均為t。從AGV 在B2 點發送位置信息給主AGV,經過E2E 時延t后,主AGV 在A3 點收到從AGV 的消息。AGV 日志統計距離為A3-B2,實際距離為A2-B2。為了簡化分析,本文僅考慮單回合主從AGV 信息交互,不考慮多個回合的累計誤差以及AGV 的糾偏策略。

圖4 主從AGV 協同作業示意圖
首先以圓心點為原點,建立極坐標系,主從AGV 位置的極坐標如圖5 所示。則A2、A3 和B2 的坐標依次表示為(r,α/2)、(r, )α和(r', )β,其中:

圖5 主從AGV 位置的極坐標

使用類似的方法,可以得到主從AGV 日志統計距離A3-B2:

根據主從AGV 距離公式,業務KQI 可以表示為p-l。上述推導方法可以應用于主從AGV共線弧線行駛、直線行駛,本文不展開分析。
綜上,主從AGV 的距離誤差不僅與E2E 時延t相關,也與額定距離l、轉彎半徑r和AGV運行速度v相關。例如設定AGV 最大速度為1 000 mm/s,額定主從AGV 距離1 200 mm,AGV轉彎半徑不小于50 mm。為了使業務KQI 誤差小于10 mm,則根據業務KQI 公式,得出E2E 傳輸時延值為47.8 ms。AGV 業務通常對業務可靠性要求較高,如主從AGV 交互一萬回合指令,最多有一次距離誤差超出10 mm,則理論時延SLA 需求為47.8 ms@99.99%。
由于空口時頻資源受限,鏈路易受干擾和調度機制復雜性,空口時延抖動是滿足AGV 時延可靠性需求的主要挑戰。5G 空口上行調度如圖6 所示,本文重點對空口上行傳輸各個狀態過程的時延抖動展開分析,主要包括狀態切換、調度授權等待、數傳等待和數據重傳。

圖6 5G 空口上行調度
(1)狀態切換時延
終端狀態切換流程如圖7 所示,終端設備在處于非活動狀態時,可能會釋放無線資源控制(RRC)連接,節省電能。當UE 處于用戶連接管理空閑態(CM-idle)時,首先需要和恢復RRC連接與PDU 會話承載,切換到RRC-connected 狀態才能監聽物理下行控制信道(physical downlink control channel,PDCCH),獲取基站發送的上行調度授權(UL grant),隨后在基站分配的時頻資源進行上行數據傳輸。一般來說,上行傳輸時,終端主動發起協議數據單元(protocol data unit,PDU)會話建立或恢復請求,時延開銷為50~70 ms。下行傳輸時,網絡需要尋呼處于CM-idle 態的終端,需要100 ms 以上的時延開銷。特別地,5G通信增加了RRC-inactive 態,僅釋放終端到基站的RRC 連接,但保留終端到核心網的上下文,如用戶接入狀態,可以有效減少用戶恢復與網絡連接時的信令交互次數。用戶處于RRC-inactive 狀態時,需要10 ms 重新建立RRC 連接,就能進行數據傳輸。

圖7 終端狀態切換流程
(2)調度授權等待時延
由于空口時頻資源有限,終端需要等待基站UL grant 才能發送數據。上行調度時延開銷包括SR 發送等待時延開銷和基站調度時延開銷。在傳統上行調度中,終端發送緩存區已經清空后,有新的數據到來,需要通過物理上行控制信道(physical uplink control channel,PUCCH)向基站發送SR,等待基站上行調度授權。根據協議,終端只能在SR 固定周期點發送請求,平均等待時延約為20 ms。收到用戶SR 請求后,基站會讓終端通過物理上行共享信道(physical uplink shared channel,PUSCH)發送緩存狀態報告(buffer status report,BSR)。在多終端場景,基站根據可用RB數目、用戶優先級、數據量等信息,進行RB 分配。業務并發量越大,用戶等待基站調度的時延抖動越大。
(3)數傳等待時延
終端收到UL grant 后,在指定時隙發送數據,平均等待時延約為2 ms,抖動較小。
(4)數據重傳時延
由于無線信道衰落、小區邊緣接入以及同頻信號干擾等空口質差因素,無線鏈路接收端常常會解碼失敗,引發數據重傳。5G 通信在介質訪問控制(medium access control,MAC)層使用混合自動重傳請求(hybrid automatic repeat request,HARQ)技術合并多次傳輸誤碼數據,提升解碼成功率?;就ǔE渲米畲? 次HARQ,每次重傳時延開銷為 5 ms。當基站采用非確認(unacknowledged mode,UM)模式,4 次HARQ重傳均解碼失敗后,該數據包丟失。反之,基站采用確認(acknowledged mode,AM)模式,有可能觸發無線鏈路控制無線鏈路控制(radio link control,RLC)層重傳。通常RLC 重傳周期40 ms,最大重傳次數為32 次。在空口質差場景中,鏈路解碼失敗可能性變大,會引入多次HARQ/RLC 重傳,常常導致大時延抖動。
為了應對上述時延抖動挑戰,本節介紹一種端邊時延確定性解決方案用于提升AGV 通信時延可靠性,滿足AGV 業務可靠性需求。端邊協同時延確定性組網方案如圖8 所示,端邊協同時延確定性方案架構主要包含端側確定性Agent 模塊和服務側確定性Service 模塊。確定性Agent 可植入AGV 上位機進行流量透明代理,與位于UPF的確定性Service 建立確定性時延保障管道。Agent代理AGV 應用流量,AGV 應用不需要做額外開發。確定性Service 對業務流量進行分析,識別主從AGV 交互指令的周期與起始發包時刻,利用預調度技術、協同基站進行空口資源預留、降低包調度等待時延。同時,確定性Service 會采集空口信道的實時測量數據,如參考接入功率(reference signal receiving power,RSRP)、信道質量指標(channel quality indication,CQI)等,在質差條件下,動態開啟時延保障策略,提升包傳輸可靠性。

圖8 端邊協同時延確定性組網方案
端邊協同時延保障技術的交互流程如圖9 所示,端邊協同時延保障技術的交互流程包含如下3 個階段。

圖9 端邊協同時延保障技術的交互流程
(1)端邊協同配置階段
終端確定性Agent 置于AGV 上位機,向確定性Service 發起注冊。Agent 成功注冊后,確定性Service 可對Agent 進行生命周期管理,監控Agent運行狀態,配置確定性時延保障參數。確定性Service 可根據業務特征,配置服務質量(quality of service,QoS),并且向基站發送調度策略配置。
(2)端邊協同資源預留階段
主從AGV 流量經過端側Agent 代理后,由確定性管道轉發至確定性UPF。確定性Service 采集業務流量來包信息,使用機器學習算法推斷業務發包周期與起始時刻,以及感知業務包長。根據業務發包特征,UPF 協同基站,進行空口資源預留,降低狀態切換和基站調度授權等待時延。特別地,該方案可以根據業務特征,精準配置所需RB 數目和預期調度時隙,避免了空口資源浪費,有效提升頻率利用率。
(3)端邊協同質差保障階段
確定性Service 向基站訂閱空口信道測量數據?;局芷谛陨蠄箧溌稲SRP、CQI 等參數。當檢測到上行信道質差,確定性Service 傳遞消息給端側,開啟端側質差保障措施。端側Agent 對上行業務流量進行可靠傳輸處理,確定性Service 進行對應的處理。當檢測到下行信道質差,端側Service 對下行業務流量進行可靠性處理,確定性Agent 進行對應的處理。當空口信道質量恢復到良好水平,可關閉質差保障,降低空口資源消耗。
本文的創新性主要在于構建端邊協同機制,聯動端側和RAN 側,協同優化傳輸時延與資源開銷。該方案適用于終端混合流、視頻背景流等典型toB 業務場景。核心網可以基于業務粒度(如利用業務收/發IP 地址、收/發端口號及協議信息過濾流量)感知時延敏感業務流的特征,例如包長、周期、發包時隙偏移等,開啟業務級時延保障技術,以最優資源開銷保障傳輸時延可靠性。
實驗基于杭州聯通展廳進行測試??紤]兩類空口環境:AGV 近點接入5G 網絡,終端RSRP 約-71 dBm,平均RB 干擾功率-116.9 dBm,最高-105 dBm,有輕干擾;AGV 小區邊緣接入5G 網絡,有鄰區同頻用戶作業務,終端RSRP 約-95 dBm,平均RB 干擾強度-116.2 dBm,最高-93 dBm,有突發強干擾。本文將端邊協同技術與傳統上行調度(上行需進行SR、等待基站調度授權)、預調度(基站逐TTI 預留資源、無質差保障措施)技術進行對比。AGV 每20 ms 發送一個指令,包長300 byte。
時延可靠性對比結果如圖10 所示?;€數據使用傳輸上行調度,沒有進行上行資源預留,平均時延相比預調度、端邊協同技術抬升約10 ms。在近點場景,預調度與端邊協同時延保障技術在99%~99.99%可靠性度量下,時延基本一致。但因為近點場景存在輕微干擾,當時延可靠性大于99.99%時,使用端邊協同技術相比預調度機制可以減小時延抖動50.8 ms。在質差場景,相比預調度技術,采用端邊協同方案,可以降低時延46.4%(99.9%可靠性度量)和70.9%(99.99%可靠性度量)。由此可見,端邊協同技術方案可以在空口弱覆蓋、干擾等質差場景極大降低時延抖動。此外,使用端邊協同技術,可以達到20 ms@99%、30 ms@99.9%,有效消減99.99%可靠性及以上的時延抖動。

圖10 端到端時延可靠性對比結果
呈現使用預調度技術和端邊協同時延保障技術的AGV 實際收包序號與理論收包序號的差值分別如圖11 和圖12 所示。實驗環境為空口質差場景,端到端時延會有較大抖動??梢钥闯?,在無質差保障的測試場景中,AGV 接收指令序號出現了較大的波動。圖11 有兩次較大的序號抖動,序號范圍超過了100 個包。追蹤AGV 日志發現主從AGV 因大時延抖動,進入了“失聯”狀態,業務發生了重啟。使用了端邊協同時延保障技術,AGV 收包未觀察到大時延抖動。上述結果有效驗證了端邊協同時延保障技術對5G 端到端時延優化效果。

圖11 AGV 實際收包序號與理論收包序號差值(預調度)

圖12 AGV 實際收包序號與理論收包序號差值(端邊協同技術)
考慮AGV 最大速度為1 000 mm/s,額定主從AGV距離1 200 mm,AGV轉彎半徑不小于50 mm,AGV 業務KQI 優化效果見表1,結合質差場景時延測試數據,計算業務KQI(基于AGV 日志統計主從距離誤差)。使用預調度技術,在99.9%可靠性度量下,主從AGV 距離誤差達到了10 mm。相比之下,使用端邊協同技術,主從AGV 距離誤差控制在10 mm 的可靠性為99.99%,可靠性提升了10 倍。此外,使用端邊協同技術,主從AGV 最大距離誤差為16.9 mm,相比于預調度技術的主從AGV 最大誤差,業務KQI 提升了89.04%。

表1 AGV 業務KQI 優化效果
本文分析了AGV 協同搬運業務對網絡時延可靠性的需求,推導了業務KQI 與時延可靠性的映射關系。現有5G 機制存在頻譜浪費嚴重現象,并且難以解決空口突發干擾、弱覆蓋等質差因素的問題。本文創新性地提出了一種端邊協同保障時延確定性方案。基于業務特征進行網絡資源預留,降低調度等待時延,并且感知空口狀態,開啟質差時延保障機制,實現5G 時延確定性傳輸。測試結果證明了該方案可以極大消減時延抖動與優化業務KQI。此外,端邊協同時延保障方案對終端生態友好,不需要應用進行修改,適用于工業物聯網等各垂直行業,可大規模商業部署。最后,5G 時延確定性傳輸還有很多挑戰亟待解決,例如空口擁塞、混合流傳輸等,需要持續演進端邊協同保障時延確定性方案、研究應用和網絡跨域協同技術,加快工業數字化升級。