魏汝翔/WEI Ruxiang,劉琦/LIU Qi,趙廣/ZHAO Guang,曹暢/CAO Chang,唐雄燕/TANG Xiongyan
(中國聯合網絡通信有限公司研究院,中國 北京100048)
在數字經濟時代,算力如同農業時代的水利、工業時代的電力,既是國民經濟發展的重要基礎,也是科技競爭的新焦點。算力是設備或平臺為完成某種業務所具備的處理業務信息的關鍵核心能力,包括邏輯運算能力、并行計算能力、神經網絡加速能力等[1-2]。
算力業務除了對上述算力資源有要求外,還會根據具體的業務類型,對網絡的上下行帶寬、時延、抖動、存儲等方面有不同的要求。算力業務從應用的角度可以分為計算類、存儲類、互動類,這3 類業務會互相重疊、交叉[3],一種算力業務經常同時屬于上述多種分類。不同業務對算力與網絡指標的要求不盡相同??偟膩碚f,對于計算類與存儲類等對網絡時延與抖動要求不高的算力業務,適用于“東數西算”場景,可將海量數據傳輸到西部進行計算與存儲;而對于互動類業務,不適用于東數西算,應合理利用邊緣算力,就近提供服務。
東數西算對傳統基于距離的路由策略提出了新的需求。在路由決策時,不再將所有業務都分配到距離(包括跳數、開銷、時延等)最近的節點,而是綜合考慮業務屬性與算力資源的分布,在已知各類業務對網絡指標、算力與存儲需求的情況下,通過路由策略對各類業務進行分配:將對實時性要求較低的冷數據分配到西部算力樞紐節點,將對實時性有一定要求的溫數據分配到東部算力樞紐節點,將對實時性與可靠性要求較高的熱數據分配到距離最近的邊緣算力節點。
當前電信運營商的網絡流量主要以視頻業務為主,預計未來網絡流量中視頻流量的占比將進一步增加。據Omdia網絡流量報告預測[4],2019 年視頻流量占全球總流量的76%,到2024 年,視頻流量將占到總流量的80%。據愛立信移動市場報告預測[5],到2025年,移動視頻流量在移動數據總流量中的占比將從2019 年的略高于60%增長到近75%。從用戶角度來看,視頻業務主要以下行流量為主。無論是當前主流的短視頻、社交媒體視頻等業務,還是不斷發展的4K、8K 等超高清視頻點播類業務,均需要占用大量的網絡下行帶寬。此外,虛擬現實(VR)、混合現實(MR)等新興業務也對網絡的下行帶寬提出了很高的要求。
當前中國電信運營商城域網流量主要以下行流量為主。以中國聯通為例,在城域網家庭寬帶流量中,上行流量與下行流量比值大約為1∶3;在移動互聯網流量中,上行流量與下行流量比值大約為1∶7。據中國信息通信研究院的監測報告[6],2022 年第1 季度,中國5G 平均用戶下載速率為304.8 Mbit/s、平均用戶上傳速率為49.6 Mbit/s;4G平均用戶下載速率為27.8 Mbit/s、平均用戶上傳速率為2.9 Mbit/s;Wi-Fi平均用戶下載速率為179.7 Mbit/s、平均用戶上傳速率為36.3 Mbit/s。當前主流的固網寬帶業務、移動網絡4G 或5G 業務、移動終端通過Wi-Fi 上網等業務的下載速率遠遠高于上傳速率。隨著未來視頻業務占比的不斷增加,網絡下行帶寬與上行帶寬仍然會存在利用率不均衡的問題。
對于計算類與存儲類的算力業務,東數西算可以將東部的海量數據從用戶側通過網絡傳輸到西部算力樞紐節點,這需要占用大量的網絡上行帶寬。對于以下行流量為主的電信運營商網絡而言,東數西算剛好能夠復用當前電信運營商的城域網帶寬。此外,遠程醫療、高清直播等業務對網絡帶寬的需求也主要集中在上行帶寬。如果在路由決策時能夠分開考慮上下行帶寬利用率,電信運營商的網絡帶寬將會得到更充分的利用。因此,在路由決策時除了要滿足業務對算力、時延、帶寬等業務屬性的需求外,還要充分、有效地利用電信運營商的網絡資源以及國家算力樞紐節點的資源。
軟件定義網絡(SDN)的出現,給多業務場景中的路由策略制定提供了新的思路[7]。SDN與傳統網絡的區別體現在轉發平面和控制平面的解耦。相較于傳統網絡,SDN架構下的控制層可以利用編程的方法對數據層面的轉發行為進行控制,從而更加靈活地管理網絡。
基于IPv6 段路由(SRv6)可以實現報文轉發路徑的可編程。同時,采用SRv6 技術可以簡化網絡結構,實現網絡之間的無縫銜接。這使得路由能力不再割裂[8],并可以結合SDN 控制器實現業務的路由決策。基于SRv6 算力路由技術的相關行業標準已完成初稿的編制,正在意見征求中。
算力業務的集中式路由決策正是利用SDN 與SRv6 的思想,首先通過組合使用邊界網關協議段路由連接狀態(BGP-LS)、隨流檢測(iFIT)、Telemetry 等技術,實現網絡上下行帶寬利用率、時延、抖動、丟包率等網絡指標的實時檢測[9];然后通過算力感知等技術獲取全網的算力及存儲信息;再根據不同業務對算力及網絡性能的需求,通過控制器依次為各種業務分配最優路徑。目前來看,算力業務的集中式路由決策的標準化及設備性能等都較為成熟[1]。
集中式路由決策的方式需要控制系統掌握全網實時的詳細信息,根據不同的業務類型以及用戶對業務服務級別協議(SLA)的不同需求,將業務分配到能夠滿足用戶對算力、存儲及網絡能力需要的節點。全網設備及鏈路眾多,算力與網絡信息的及時更新,對控制層的計算、存儲都提出了較高的要求。例如,當因業務的分配或完成而導致網絡指標或算力資源發生變化時,或因新設備上線、原設備掉線以及鏈路通斷狀態的改變引起網絡拓撲結構變化時,都需要控制層及時更新網絡信息,重新完成路徑規劃再將信息下發至網絡頭節點。這一過程所需的時延會極大地影響用戶體驗,甚至影響業務的正常運行。
與集中式路由決策相對的是分布式路由決策。分布式路由決策由網絡中的路由器設備完成路由決策與轉發。這其中的關鍵在于對算力的感知與標識,以及如何將計算能力與網絡狀態信息發布到全網。為了解決上述問題,計算優先網絡(CFN)的概念被提出[10-11]。
CFN延續了傳統分布式路由協議的設計思路,通過對網絡架構和協議的改進,將計算能力與網絡資源作為路由信息發布到網絡,并路由到相應的計算節點,從而實現計算能力與網絡資源的優化和高效利用。CFN的核心功能在于算力資源感知和算力任務調度。
由電信運營商與部分業內主流廠商提出的《算力網絡算力路由協議技術要求:OSPF 協議擴展》當前已在中國通信標準化協會(CCSA)立項。該標準定義了開放式最短路徑優先(OSPF)相關協議的擴展選項,如OSPFv2/OSPFv3協議。這些協議能夠攜帶算力信息和網絡信息,推動了分布式算力路由決策的標準化工作。
分布式路由決策具有良好的擴展性,但實現起來比較復雜。目前,算力編排與網絡控制等方面的標準化工作還未完成[12],距離應用還很遠。此外,將算力服務標識、路徑規劃、路由決策等控制權交由網絡中分散的節點設備,容易導致業務流量被篡改、攻擊。兩種路由決策的對比如表1所示。
目前,3家電信運營商聯合高校、企業正在起草行業標準——《算力網絡算力路由協議技術要求》。該標準定義了算力信息和網絡信息的感知和通告方法,給出集中式與分布式兩種通告方式的優點及其應用場景,并重點針對算力網絡集中式控制器提出相關的技術要求。
隨著算力網絡國家樞紐節點的建設,算力資源將向三大區域集中:西部算力樞紐節點、東部算力樞紐節點、各地市的邊緣算力節點。各區域的地理位置及它們之間的網絡連接基本不變,但區域內部的算力資源與這些資源之間的網絡連接將隨著算力網絡的發展而不斷變化。若采用集中式路由決策,那么上述算力資源與網絡連接的頻繁改變會嚴重影響控制器的信息更新與路徑規劃;若采用分布式路由決策,則無法通過全局統一的管控與路徑規劃來實現業務路徑的全局最優。
為了解決上述問題,本文中我們結合兩種現有的路由策略,在東數西算場景下探索出一種基于業務屬性與算力資源分布的混合式路由決策方式。我們將國家算力樞紐節點、區域邊界節點等重要算力區域中的關鍵設備,以及電信運營商各城域網、骨干網中的核心設備集中管理?;谧陨淼姆植际铰酚蓻Q策能力,這些關鍵設備能夠感知所在的算力區域中各種網元設備的算力及相互網絡指標等信息,然后將這些信息上報給控制層,再由控制層統一進行集中式路由決策。這樣可以將業務調度到全局最優的算力區域,再由以上的這些關鍵設備通過分布式路由決策以局部最優的方式調度到自身所在算力區域的具體網元中。例如,如果人們要去某個商業中心的餐廳用餐,首先用手機軟件(相當于控制層)通過全局最佳路徑導航到該商業中心(相當于集中式路由決策),再通過查看商業中心的內部樓層介紹或詢問等方式選擇局部最佳路徑,從而到達餐廳(相當于分布式路由決策)。
當區域內部算力或網絡信息變化不大時,區域關鍵設備無須將這些信息實時上報給控制器,因此不會對全局集中式路由策略造成影響。通過設置區域資源告警,在區域內部算力資源不足或網絡狀態劣化達到一定程度后,區域關鍵設備將算力或網絡信息上報給控制器,并且在后續的集中式路由決策時不再將新業務調度到該算力區域。這樣既可以大幅簡化控制層所需要的全網設備及鏈路數量,又能在部分網絡指標、拓撲結構或算力資源發生微小變化時,降低區域關鍵設備對控制層實時更新網絡信息以及重新完成路徑規劃所造成的時延影響。
基于業務屬性與算力資源分布的混合式路由決策的算力與網絡信息通告流程如圖1所示。

▲圖1 混合式路由決策的算力與網絡信息通告示意圖
1)區域1、2、3 中的所有路由器分別完成算力資源信息與網絡指標信息的采集。需采集的信息包括各算力資源節點的邏輯運算能力、并行計算能力、神經網絡加速能力等算力資源信息和其存儲能力,以及路由器之間的鏈路上下行帶寬及利用率、網絡時延、丟包率、抖動等網絡指標信息。
2)區域1、2、3 中的關鍵設備(即路由器R10、R20 R30)分別通過BGP擴展協議等方式互相通告它們之間的網絡連接狀態信息。
3)區域1、2、3 中的所有路由器分別在各自區域內部將采集到的上述信息進行域內通告。待網絡收斂后,所有路由器均生成了各自區域內部的算力服務路由表項。、
4)區域1、2、3 中的關鍵設備將它們之間的連接信息與各自所在區域的算力資源信息上報給控制層。
在控制層進行集中式路由決策時,僅需考慮將業務分配到哪個區域。待業務到達目標區域的關鍵設備時,關鍵設備通過分布式路由決策,逐步將業務轉發到區域內部最終的算力資源節點。當區域內部算力資源與網絡狀態的改變程度大于告警域值時(如內部大型算力節點故障或某條核心網絡鏈路中斷),該區域的關鍵設備將重新收斂后的算力與網絡資源信息上報給控制層,從而使控制層能夠根據最新的區域信息重新進行集中式路由決策;而當區域內部算力資源與網絡狀態的改變程度小于告警域值時(如內部小型算力節點故障或某條非核心網絡鏈路中斷),該區域的關鍵設備則無須將收斂后的算力與網絡資源信息上報給控制層,這樣不會對控制層進行集中式路由決策造成影響,僅對業務到達目標區域后的分布式路由決策產生影響。
我們通過以下4 種典型的場景,介紹在東數西算背景下,基于業務屬性與算力資源分布的混合式路由決策是如何將用戶的業務分配到合適節點的,具體如圖2所示。

▲圖2 4種場景中基于業務屬性與算力資源分布的混合式路由決策示意圖
場景1:位于某西部地市的用戶A希望使用車聯網來實現自動駕駛業務??蛻舳藙t根據該用戶選擇的業務類型,判斷出此業務對時延非常敏感,需要將此業務分配到離其物理位置最近的、時延最小的邊緣算力節點,因此客戶端決定采用分布式路由決策在區域內部進行分配,用戶所屬的路由器R21將該業務分配到邊緣算力節點21。
場景2:位于某東部地市某區縣的用戶B 希望觀看某高清視頻??蛻舳烁鶕撚脩暨x擇的業務類型,判斷出該用戶所選業務對網絡下行帶寬要求很高,且用戶希望觀看的高清視頻所在數據中心的位置與用戶位于同一區域。因此客戶端決定采用分布式路由決策將該業務分配到存儲對應資源的數據中心,用戶所屬的路由器R41將該業務通過路由器R40分配到數據中心。
場景3:位于某東部地市的用戶C希望觀看某高清視頻。與上一場景類似,客戶端判斷出用戶希望觀看的高清視頻所在數據中心與用戶位于不同區域,因此決定首先采用分布式路由決策將業務通過路由器R31 派往區域內的關鍵路由器R30,然后采用集中式路由決策將業務派往區域4 的關鍵路由器R40。當業務到達R40后,再通過分布式路由決策,將其分配給存儲對應資源的數據中心。
場景4:位于某東部地市的用戶D希望備份大量的醫療影像數據并進行智能影像分析。客戶端根據該用戶選擇的業務類型及服務級別,判斷出該用戶所選業務對網絡的上行帶寬要求很高,且需要一定的邏輯運算能力、并行計算能力以及存儲能力,對網絡時延無要求,因此決定將其分配給西部國家算力樞紐節點,實現東數西算。控制層根據當時掌握的全網算力與網絡資源信息,以及用戶所在的位置信息,通過集中式路由決策規劃出業務大方向,即經過區域3的關鍵路由器R30到區域2的關鍵路由器R20,再到區域1的關鍵路由器R10。在區域3中,由用戶所屬的路由器R31到關鍵路由器R30的路徑由分布式路由決策進行規劃。因用戶所屬的路由器R31檢測到其至路由器R30的直連鏈路上聯帶寬利用率很高,而通過路由器R32到達路由器R30的鏈路上聯帶寬利用率很低。因此,路由器R31將業務通過路由器R32發送給區域3的關鍵路由器R30。核心算力節點11的并行計算能力與存儲能力均不足以滿足業務要求,而核心算力節點12的邏輯運算能力、并行計算能力、存儲能力等性能均能滿足業務要求。因此,當業務到達某西部國家算力樞紐節點所在區域1的關鍵路由器R10 時,根據分布式路由決策,關鍵路由器R10將業務通過路由器R11分配到核心算力節點12。
當前,由3家電信運營商聯合行業知名企業共同起草的《算力網絡混合式組網技術要求》已在CCSA立項。該標準綜合集合式算力路由與分布式算力路由的優點,提出了混合式算力路由技術方案:由上層控制器/編排層完成算力信息的收集與分發,將算力狀態通過上層系統向網絡節點設備進行擴散與通告,再由網絡節點結合計算與網絡狀態進行路由決策及算力服務選擇,同時結合操作維護管理(OAM)技術來實現算力服務可用性狀態的實時通告。該方案主要針對車聯網等時延要求高的場景,通過混合式算力路由技術實現路由的快速收斂,并形成可快速落地應用的現網部署技術方案。
由于算力網絡的快速發展及東數西算政策的加速實施,算力業務的數量逐步增加,面向算力網絡路由決策技術的落地需求也相應增加。當前,CCSA《算力網絡 混合式組網技術要求》的項目組正在開展面向車聯網場景下基于該方案的原型研發,以混合式算網一體路由調度為核心,立足具體應用場景,構建端到端的算網服務解決方案,賦能車聯網等需求場景。目前該方案已具備三大核心技術能力:綜合算+網因子進行服務選擇及路徑計算,為應用端提供最優算力服務;為終端的低時延應用提供快速調優的算力路由能力;提供網絡層與應用層的移動業務連續性解決方案,實現無感知服務切換。后續我們將結合具體的實驗環境進行應用部署與測試,以推動基于算力業務的算力網絡混合式路由決策方案在現網場景中落地。
在中國東數西算政策支持下,通過路由決策將不同業務高效地分配到合適的位置,將成為算力網絡發展的主要方向之一。本文中,我們首先梳理出各類業務對算力與網絡指標的需求,分析、研究了包含算力業務的路由策略與實現機制,在集中式路由決策與分布式路由決策的基礎上,結合當前網絡流量現狀與未來網絡流量發展趨勢,探索出一種在東數西算場景下,基于業務屬性與算力資源分布的混合式路由策略。該方法結合集中式與分布式兩種路由策略的優勢,適用于各類傳統非算力業務與新型算力業務,能夠提供一種安全、靈活、高效的全局路由策略。隨著未來技術標準的不斷完善及商業模式的逐步明確,算力網絡的路由策略及其應用實現將得到進一步的研究和落地。
致謝
作者在本文寫作中得到了中國聯通研究院易昕昕、龐冉的幫助,謹致謝意!