李少鶴 李泰新 周旭



摘要:算力網絡能夠改善邊緣和云中心、邊緣和邊緣的資源互通調度問題,實現算力、存儲、網絡等多種資源動態調度,并提供極致的服務質量。基于網絡計算模型的發展歷程和算力網絡需求背景,提出算力網絡的供給模式和3層服務模式,指出算力網絡是一種以網絡為中心的多種融合資源供給網絡計算模型。
關鍵詞:算力網絡;以網絡為中心;網絡計算模型;供給模式
Abstract: Computing power network can improve resource interoperability and scheduling in edge-to-cloud and edge-to-edge scenarios, realize the dynamic scheduling of multiple resources such as computing power, storage, and network, and provide ultimate service quality. Based on the analysis of development process of network computing model and the background of computing power network demand, the supply paradigm and three-layer service mode of computing power network are proposed. It is pointed out that computing power network is a network-centric new network computing model with integrated supply of multiple resources.
Keywords: computing power network; network-centric; network computing model; supply paradigm
隨著5G網絡時代的到來,以及人工智能、大數據技術的興起,作為互聯網基礎設施的計算機網絡體系面臨巨大的挑戰。國際數據公司(IDC)預測,2020—2025年將有超過50%的數據會在網絡側進行存儲、計算和處理[1]。在中國“新基建”戰略的指引下,“新聯接”和“新計算”成為建設數字基礎設施的重要抓手。當前,計算能力供需關系不平衡成為產業創新升級演進的瓶頸。構建彈性開放、高效協同的計算基礎設施,成為信息技術(IT)產業與通信技術(CT)產業融合發展的重要共識。
算力網絡采用以網絡為中心的多種融合資源供給網絡計算模型,依靠“云數據中心+邊緣服務器+用戶終端”三級協同(簡稱“云+邊+端”協同),使計算資源從終端、云向邊緣擴散,以便提供泛在網絡連接和算力服務,實現算力資源的靈活調度。算力網絡有望滿足智能社會中新型業務對網絡的需求,實現“算力無處不在、隨取隨用”的未來網絡場景。
1 網絡計算模型發展歷程
網絡和計算一直以來是計算機領域發展的主線。在兩者互補融合的歷程中,網絡計算模型的變化經歷了多個階段。圖1展示了計算網絡模型及其使能技術演化和網絡計算場景需求變遷的脈絡。
在早期的大型計算機時代,用戶終端僅僅作為顯示器,并通過通信線路連接到大型主機,使用集中點的算力資源。那時的計算資源完全集中,網絡只起到終端登錄連接的作用,功能單一。
隨著個人計算機(PC)的發展,主機間的通信需求促進計算機網絡的蓬勃發展。同時,隨著PC的普及,計算資源也變得越來越分散。在20世紀90年代,隨著計算資源的分散化和計算機網絡的發展,研究者提出一種分布式的網絡計算模型——網格計算,即利用大量異構的計算機閑置中央處理器(CPU)計算資源和磁盤存儲資源,通過網絡通信技術,將其作為一個分布式的大規模計算機集群,以完成需要大量算力的計算任務[2]。網格計算技術的愿景十分宏大。然而,由于這一技術思想過于超前,當時的PC和網絡性能均不能支撐大規模分布式網絡計算的場景。此外,在商業模式上,閑置資源的利用效率不高。這使得網格計算并沒有獲得大規模商用,多被用于志愿科學計算。網格計算的提出,為后來網絡計算模型的發展提供了思路和技術基礎。
隨著互聯網業務的飛速發展,人們對計算存儲能力的需求不斷攀升。在2006年提出的云計算便是脫穎于網格計算思想的下一代網絡計算模型[3]。通過分布式技術,云計算將計算、存儲資源存放在云網絡中心,使用戶僅通過網絡就可以獲得龐大的計算資源和存儲服務。相對于網格計算完全分散的計算資源,云計算的計算、存儲資源仍是集中部署的。這使得云計算可以完成高可靠且高彈性的資源供給。這與以WEB為代表的互聯網服務對資源的需求高度吻合,因此云計算一提出便掀起熱潮。云計算衍生出多種云服務模式,是一個里程碑式的網絡計算模型。云計算誕生于固定互聯網業務需求之下,為移動互聯網的發展奠定堅實的基礎,并與智能手機這一新型終端一起,掀起移動互聯網發展的浪潮。目前,幾乎所有通用互聯網、移動互聯網應用都被部署在云服務器中。可以說,云計算貫穿了整個通用互聯網和移動互聯網的發展,成為互聯網經濟的核心推動力。
近年來,互聯網技術開始從消費類應用場景向產業應用場景拓展。物聯終端、工業設備、智能汽車等更多類型的終端開始聯入網絡。產業應用的新業務對實時性、可靠性、吞吐能力、能耗等的要求遠遠高于消費類的應用,網絡環境也變得更加復雜。面向產業應用的特殊需求,傳統云計算數據中心部署位置距離用戶較遠,無法為時延敏感業務提供低時延服務。把海量物聯終端數據傳輸到云計算中心進行處理,將給網絡帶來巨大的帶寬壓力。單單依靠集中式的云計算,無法有效支撐產業互聯網的發展。在這種需求的推動下,邊緣計算應運而生。邊緣計算將數據存儲、處理和計算下沉到網絡邊緣,并接近用戶終端,可以滿足低時延、大帶寬、低能耗的網絡需求。邊緣計算這一概念最早由2009年的Cloudlets演化而來[4],并作為5G網絡的使能技術,伴隨著5G技術進入快速發展期。2014年歐洲電信標準協會(ETSI)提出移動邊緣計算。隨后,移動邊緣計算演化為多接入邊緣計算[5]。邊緣計算模型使得算力資源在網絡中得到進一步豐富,地理布局更廣,提供方式更為靈活,彌補了云計算集中部署帶來的時延、帶寬方面的弱點,是新一代網絡計算模型從“集中”回歸“分布”的又一次輪回。

按照時間順序,表1給出了網絡計算模型發展歷程中的關鍵技術和思想對比。從前文描述可以看出,一項技術的成功,除了技術本身的先進性以外,真實存在的產業需求、可行的商業模式都是決定性的因素。
2 算力網絡需求背景
2.1 算力網絡發展背景
在5G人工智能(AI)時代,新型網絡業務持續涌現,對算力的需求飛速增長。高算力和低時延的應用場景愈加多樣化,如物聯網、智慧出行、虛擬現實、泛在計算等。這些場景對算力的需求亦呈現多樣化爆發式增長。隨著萬物互聯愿景的進一步推進,聯網終端和設備數量將呈現指數級增長。據Statista預測,2025年全球物聯網設備將超過750億臺[6]。用戶對于時延、帶寬的變化更為敏感,對服務質量的要求進一步提高。
與此同時,算力資源的供給也將進入快速發展期。2020年4月20日,中國國家發展和改革委員會首次明確新型基礎設施建設(簡稱“新基建”)的范圍。其中,信息基礎設施包括以數據中心、智能計算中心為代表的算力基礎設施等。這是“算力基礎設施”這一概念首次在國家層面的被提出。目前,多種算力供給設施正在大力建設中,如超算中心、云計算數據中心、智能計算中心、邊緣計算站點。有報告指出,與已投運機柜數相比,2020年北京、上海、廣州、深圳周邊的在建和規劃數據中心機柜增長超過了300%,這說明算力資源供給進入快速增長期[7]。相比于2020年,2025年以邊緣計算為代表的分布式算力資源將增長790%,超過集中式算力資源。IDC預計,未來中心化算力占比將不超過12%,分布式算力將超過88%[7]。
隨著算力需求和算力供給的飛速增長,算力供需之間的不平衡問題愈加凸顯。IDC數據表明,計算資源的綜合利用率普遍小于15%。特別是邊緣計算節點,由于均是面向特定場景建設的,計算負載的潮汐效應往往更加明顯,單靠目標應用場景,難以消耗邊緣計算節點的所有算力資源。目前,云計算中心和邊緣計算節點之間、邊緣節點和邊緣節點之間的計算資源調度不夠靈活,集中式算力資源和分布式算力資源發展不一致,導致算力供給與需求無法有效匹配,使局部過載而其他資源閑置的情況出現。這大大降低了算力資源作為信息社會底層基礎設施能力的效率。由于現有網絡系統存在局限性,業務大多屬于靜態部署,資源復用率低。網絡配置也多為靜態,路由尋址方式效率低,難以針對目前輕量級的微服務需求進行優化。算力資源需要與網絡結合,更大范圍、更細粒度地有效匹配和調度,才能充分發揮海量算力的真正效用。
2.2 算力資源和網絡能力適配
算力在“集中-分布”模型間呈現鐘擺式變化。隨著邊緣計算的興起和智能社會的算力需求發展,算力即將進入“集中+分布”的全新發展階段。
集中式算力資源可以高效處理需要大算力的計算任務。分布式算力資源可以為終端用戶提供高質量、低時延、隨用隨取的算力服務。面對“云+邊+端”網絡協同和“集中+分布”算力協同的場景需求,以及為解決算力資源供給失衡的問題,網絡在新型網絡計算模型中將會占據更重要的位置。網絡的功能將從“連接算力”(為數據中心、算力節點和用戶終端提供連接功能)轉向“調度算力”(通過網絡對算力節點間的算力資源分配和調度),甚至轉向“組織算力”(對整個網絡中的異構算力資源進行編排和組織管理)。新需求對網絡能力的要求進一步提高,即要求網絡可以容納、調度、編排多種地理布局、多種物理異構,并提供海量的計算、存儲、連接資源。新型網絡計算模型將會以網絡為中心,實現算力資源和網絡能力的有效適配,最大限度地提供高效的網絡算力調度和編排。
3算力網絡供給模式與核心特征
3.1 網絡計算資源的組織與供給模式
在目前的網絡生產關系下,產業鏈各方不同程度地掌握了應用需求、計算資源、網絡資源。與之對應,網絡計算資源的組織與供給可能有以下3種模式,如表2所示。
(1)以應用為中心。在這種模式下,算力資源的組織與調度以自身的業務生態為中心。具有代表性的算力服務商有百度、阿里、騰訊等大型OTT(指互聯網公司越過運營商)互聯網企業。它們在進行算力資源的部署時,以自建為主、整合第三方算力資源為輔,并基于OTT模式,租用運營商網絡資源實現傳輸與調度。以應用為中心的模式本質上是云計算模式的擴展。對于互聯網公司來說,這種模式具有業務延續性好、技術成熟、成本相對較低的優點。然而,由于不同互聯網業務生態系統之間存在互斥,這種模式的算力網絡服務較難保證第三方的公立性。同時,由于采用OTT模式,不直接掌控網絡資源,該模式難以支持高可靠、低時延業務。
(2)以計算為中心。在這種模式下,算力資源主要來自原分散的第三方算力,通過服務網絡加以組織,來執行計算任務。此模式以新興的區塊鏈算力網絡公司為代表,例如BHP、EXODUS、Computing Planet等[8]。它們的算力資源多為整合的第三方算力資源,自建算力資源比例較低。基于OTT模式,它們租用運營商網絡資源來構建overlay的算力網絡,在應用層實現傳輸與調度。然而,以計算為中心的模式也存在一些問題:難以保證服務質量,支持的業務類型較為有限,管理成本相對較高。
(3)以網絡為中心。這種模式強調直接使用底層網絡對算力進行整合、組織和調度,通過優化后的算力標識、路由協議與傳輸協議,來實現算力資源與網絡資源的高度集成與協同調度。具有代表性的算力服務商為網絡運營商,其算力資源部署以自建為主、第三方為輔,且擁有大量的邊緣計算節點,同時算力資源分布廣泛、類型豐富。這種模式具有完整的底層網絡資源和調度管理能力,可以按照應用需求來按需調度合適的算力資源,并保證網絡傳輸質量。以網絡為中心的模式具有明顯優點:算力服務的中立性最高,服務質量可保證,管理成本較低。
從以上分析可以看出,以網絡為中心的算力組織與供給模式最符合未來多元化業務發展需求,也最符合算力作為智能社會底層基礎設施的定位。
3.2 算力網絡核心特征:以網絡為中心的融合資源供給
算力網絡是以網絡為中心的新型網絡計算模型。基于最新網絡技術,如運用網絡功能虛擬化技術(NFV),算力網絡可以有效地將異構算力資源虛擬化。此外,通過云網融合技術和軟件定義網絡技術(SDN),算力網絡還可以將網絡中的計算、存儲、連接資源進行智能化的有效編排,將計算資源、存儲資源等多維異構資源完全融入到網絡系統中,使各類資源節點在網絡中可以通信和實時交互,并進行多維異構資源的動態調度。算力網絡的出現是資源供給模式的變革,它通過網絡來連通分散且碎片化的計算、存儲等資源,構建一體化的信息通信技術(ICT)基礎設施,并向各相關產業提供網絡、計算及存儲等服務,如圖2所示。
在算力網絡中,與算力任務相關的算力網絡能力,比如算力資源、服務標識,在網絡邊緣進行收集,并向用戶提供算力網絡能力視圖。用戶通過應用,發出初始報文攜帶算力任務的需求,比如需要的算力種類、算力總量、服務名字、時延上限、任務拆分等。基于收集到的算力網絡能力詳情和相應的需求到能力的映射算法,算力網絡邊緣網關將用戶的算力任務需求組合,映射為相應的算力網絡能力組合。然后基于預設語法,將算力網絡能力組合解析為相應靈活的報文格式。這些報文攜帶調用相應算力網絡能力的指令和元數據,以便完成算力任務。
在算力網絡服務模式下,用戶無須在海量、分散的算力供應商中選擇合適的算力點,也不必擔心網絡能力如何與計算模型相匹配。算力網絡將幫助用戶發現性能最佳的算力資源,按照業務需求來規劃可靠的網絡路徑與傳輸服務,并幫助用戶高效率地完成業務,使成本降到最低。
4算力網絡服務模式
算力網絡吸納和調度各類分布式的算力,以統一服務的方式,并結合確定性網絡輸送高可靠、可度量、通用化的算力資源,來使能人工智能應用,體現網絡價值。運營商或者第三方公司建設供給側的算力供給資源池,并通過算力網絡完成基礎設施供給、網絡連接供給和平臺及業務能力供給,以滿足需求側的虛擬現實、云渲染、自動駕駛以及AI等應用的算力需求。
算力網絡服務形態決定了算力調度方式、度量方式、盈利模式和商業模式。類比于云計算的基礎設施即服務(IaaS)、平臺即服務(PaaS)、軟件即服務(SaaS)的3層服務模式,算力網絡也可以自底向上分為3種服務形態,如圖3所示。
(1)算力基礎設施服務形態。算力服務商提供基礎算力設施,算力資源以算力站點結合虛擬網絡的形態存在。需求側租賃算力網絡服務商提供的算力資源,并由算力網絡調度用戶請求并使之到達合適的算力部署站點,同時由用戶決定算力設施的使用方式。這種服務形態主要面向那些擁有較強IT開發能力、產品對算力依賴強、有能力對算力進行精細化管理的客戶,如大型互聯網公司、獨角獸企業、云計算中心。
(2)算力平臺服務形態。算力服務商提供算力平臺和開發環境,算力資源以算力資源池的形態存在。用戶無須關注算力資源部署細節,即可基于算力平臺來開發和使用高質量、低時延的算力。這種服務形態主要面向那些具備一定IT開發能力、產品對算力較依賴的客戶,如大型工業制造企業、中小互聯網企業。
(3)算力軟件服務形態。算力服務商提供上層算力應用服務,算力資源以應用程序接口(API)的形態存在。用戶無須關注系統和軟件細節,僅提交業務需求,并通過API完成算力任務。這種服務形態主要面向那些IT開發能力弱、產品對算力較依賴、無法對算力進行精細化管理的客戶,如互聯網小微企業、物聯網公司、制造業企業等。
算力網絡服務形態亦是算力網絡研究者的重點研究方向。算力網絡將打破傳統運營商僅販賣網絡連接和流量的盈利模式,有助于擴展算力需求的商業客戶。3層算力網絡服務形態模型具有自下而上垂直拓展的特點,針對不同的算力業務需求,可以提供全方位和高自由度的實現方式,能夠給予算力網絡供應商更多可能的服務方式和業務模式。
5 算力網絡發展現狀
算力網絡架構一提出便備受業界關注,業界對于算力網絡的研究正在如火如荼地開展中。華為提出算力網絡基礎框架計算優先網絡(CFN)。三大運營商也在著力建設算力網絡架構設施,并發布對算力網絡的研究成果[9-12]。為滿足未來科學研究范式向基于大數據發展的需求,中科院計算機網絡信息中心提出面向科研大數據的算力網絡架構。
算力網絡的標準化和產業化也在持續發展中。2019年末,華為和移動基于CFN技術提出3項國際互聯網工程任務組(IETF)標準草案。目前,這3項標準仍在持續更新中[9, 13-14]。2019年10月,在國際電信聯盟(ITU)全會上,中國移動提出算力感知網絡(CAN)相關草案,華為、中國聯通和中國電信也提出算力網絡(CPN)的相關草案[15-16]。同時,華為在寬帶論壇(BBF)上也進行城域算力網絡(MCN)的立項[17]。目前,華為和運營商在ETSI和中國通信標準化協會(CCSA)也在積極推進算力網絡相關標準的立項工作。
在產業動態方面,網絡5.0產業和技術創新聯盟也在積極參與算力網絡的生態建設。聯盟成員包括華為、三大運營商、中科院計算機網絡信息中心、中國信息通信研究院、清華大學等。該聯盟成立“算力網絡特設工作組”,將5G智能云化網絡架構推進為算力網絡[18]。目前,華為、中國移動、中國電信均已完成算力網絡的初步試驗部署,并展示了試驗驗證成果。此外,中國聯通也在開展算力網絡服務平臺的試點工作。
6 結束語
如同電力的普及奠定了工業社會發展的基礎一樣,泛在算力將成為智能社會發展的基石。在政策上,算力網絡是中國新基建概念中算力基礎設施建設的核心之一,它響應了建設數字化、智能化社會的政策號召;在技術上,算力網絡符合5G+AI技術建設乃至6G網絡建設的要求,并可以起到關鍵作用;在商業應用上,算力網絡將為各行各業提供高質量、低時延、大帶寬的網絡、計算、存儲服務,符合未來網絡業態的良性發展趨勢。
參考文獻
[1] REINSEL D, GANTZ J, RYDNING J. Data age 2025: the evolution of data to life-critical [R]. 2017
[2] LAN F, CARL K. The grid: blueprint for a new computing infrastructure [M]. San Fransisco: Morgan Kaufmann publisher, 1999
[3] AZODOLMOLKY S, WIEDER P, YAHYAPOUR R. Cloud computing networking: challenges and opportunities for innovations [J]. IEEE communications magazine, 2013, 51(7): 54-62. DOI:10.1109/MCOM.2013.6553678
[4] SATYANARAYANAN M, BAHL P, CACERES R, et al. The case for VM-based cloudlets in mobile computing [J]. IEEE pervasive computing, 2009, 8(4): 14-23. DOI:10.1109/ MPRV.2009.82
[5] ETSI. Multi-access edge computing (MEC) framework and reference architecture: ETSI GS MEC 003-2019 [S]. 2019
[6] Statista Research Department. Internet of Things - number of connected devices worldwide 2015-2025 [R]. 2019
[7] 前瞻產業研究院. 2021-2026年中國IDC(互聯網數據中心)行業市場前瞻與投資戰略規劃分析報告 [R]. 2020
[8] BHP工作組. BHP全球智能算力網絡項目周報[R/OL]. [2021-03-18]. https://m.huoxing24. com/userCenter/4c1079cbe18d4e57a7722a2fd676763a
[9] LI Y, HE J, GENG L, et al. Framework of compute first networking (CFN) [Z]. 2019
[10] 中國移動研究院, 華為技術有限公司. 算力感知網絡白皮書 [R]. 2019
[11] 中國聯合網絡通信有限公司. 中國聯通算力網絡白皮書 [R]. 2020
[12] 雷波, 劉增義, 王旭亮, 等. 基于云、網、邊融合的邊緣計算新方案: 算力網絡 [J]. 電信科學, 2019, 35(9): 44-51
[13] GU S, ZHUANG G, YAO H. A report on compute first networking (CFN) field trial [Z]. 2019
[14] GENG L, WILLIS P. Compute first networking(CFN) scenarios and requirements [Z]. 2019
[15] GENG L, LEI B, FU Y, et al. Use cases and requirements of computing-aware networking for future networks including IMT-2020: ITU-T 480-WP1 [S]. 2019
[16] HUAWEI Technologies Co. Ltd, China Telecom. Framework and architecture of computing power network: ITU-T 563-WP3 [S]. 2019
[17] HUAWEI Technologies Co. Ltd. Metro Computing Network (MCN) [EB/OL]. [2021-03- 18]. https://wiki.broadband-forum.org/display/ BBF/SDN+and+NFV
[18] 網絡5.0產業聯盟. 網絡5.0產業聯盟CFN特設組倡議與籌備匯報 [Z]. 2019
作者簡介
李少鶴,中國科學院計算機網絡信息中心在讀碩士研究生;主要研究方向為新型網絡技術、網絡流量感知和預測等。
李泰新,中國科學院計算機網絡信息中心助理研究員;主要研究方向為網絡協議、機器學習、天地一體化網絡等;發表論文20余篇,申請專利10余項。
周旭,中國科學院計算機網絡信息中心研究員;主要研究方向為未來網絡架構、5G/B5G、天地一體化網絡、人工智能、邊緣計算等;發表論文70余篇,申請專利40余項。