(中國科學技術大學,中國 合肥 230027)
對未來無線通信網絡(B5G和6G)所面臨的挑戰,已經有較多研究者從不同角度進行了研究。本文中,我們就未來無線網絡智能管控所面臨的重大技術課題進行討論,研究值得特別關注的核心和基礎,提出知識+數據驅動學習模型作為解決之道。
未來網絡(B5G和6G)是在現有網絡的基礎上發展起來的。它既要包容既有網絡和技術,比如4G、5G、物聯網(IoT)及各種專用網,又要引入和構建新的6G網絡,這使未來網絡體系變得極為繁雜。此外,各種新型業務和服務層出不窮,與普遍應用的軟件定義網絡交叉疊加,使得人們不得不尋求未來網絡管控的技術基礎和實現方法。由于需要訴求、網絡變量和資源開銷都比較多,如果沒有新技術基礎和新技術方法,這個課題的發展會相當艱難。
因此,未來智能網絡必須具有極其簡單的網絡架構,把過去、現在和未來的可能手段都統合起來,充分利用智能學習方法實現各種資源的最優化利用。
未來網絡智能將會有3大核心:智能管控的極其簡潔的網絡架構、知識+數據雙驅動的學習機制、全場景全業務動態聯合優化。其中,“管控”是目標,“學習”是基礎,“優化”是方向,這3點在未來網絡智能中缺一不可。
1)全場景管控。面對地面覆蓋、空中覆蓋、天體覆蓋以及微覆蓋和點覆蓋的全場景應用,未來網絡的管控能力要能夠有效實施、綜合利用。現在地面網絡5G、4G、IoT、WiFi和個人網等統合起來的超密集網絡,要做到優化管控已經十分艱難。在未來,如果沒有強大穩健的學習能力,地面與空中切換、地面與衛星交互是無法智能管控的。
2)全知識學習。作為未來網絡智能管控的基礎手段,全知識學習會利用直接和間接的各種知識,在大數據配合下自主、獨立、透明地學習。全知識包括用戶傳輸需求、用戶屬性、網絡參數、資源開銷等。用戶傳輸需求可能比較簡單,但伴隨的用戶屬性可能相當多樣。在未來,這些知識的利用可能是實現期望目標的重要因素。
智能學習,通常是指機器學習、深度學習、強化學習,甚至是這些學習的結合,它是數據驅動的學習類別。在輸入對象和輸出對象一致的情況下(如新媒體學習),這類學習大多十分有效,能夠提高辨識能力。這類學習可被稱為信號處理型學習。
2017年一篇《模型驅動的深度學習》論文,開啟了模型+數據驅動學習模型的研究和應用。2018年用于多輸入多輸出(MIMO)檢測的模型驅動深度學習網絡、2019年用于波分多址的模型驅動深度學習方法以及后用于物理層傳輸的模型驅動深度學習方法等,都是該領域典型的進展。由于輸入與輸出的對象基本上相同,這些研究進展可以歸并為信號處理類型學習,并且這些進展的研究重點主要在提高判決能力上。
對于未來網絡的智能管控,我們要把各種知識和參數的相互關系和聯動看成一個學習整體。通常,輸入的是用戶需求和用戶屬性,輸出的是優化的網絡參數和必須提供的資源開銷。隨著用戶需求和用戶屬性的增多,智能管控變成一個極其復雜的優化問題。這就要求智能學習要有復雜群體的設計能力。為此,我們提出了一種開放、透明、可解釋的深度學習方法,即知識+數據驅動的學習方法[1],這種方法可以把知識驅動與數據驅動有機結合起來,能夠融合無線知識的有效性和數據的動態實時性。
知識+數據驅動學習模型,集中體現了無線通信網絡智能化的知識+數據雙驅動的學習架構、知識和數據分別學習和訓練的數學表達、統一的學習輸出和損失率反向傳播判決。
知識+數據驅動的學習模型,首先涉及的是知識的范圍和表達,隨后是知識驅動和數據驅動在各層的分與合以及它們透明的可解釋性,最后是反向傳播損失率判決和反饋實施。學習模型把這些綜合起來,就形成了一種依據用戶業務需求、充分利用用戶屬性和無線大數據、自動學習知識變量取值和使用最小資源開銷、實現最佳通信的能力。
無線通信和網絡的全知識分為3個范疇:用戶面知識、網絡面知識、服務面知識。每個面有各自的知識變量和公式表達。
1)用戶面知識。用戶面知識最直接的是用戶和用戶傳輸需求。單位面積用戶數高達上千萬、帶寬從吉比特每秒變為到太比特每秒將是常態。這是從1G到5G一直面臨的要求,到B5G和6G,甚至以后,也不會例外。用戶屬性是用戶面知識的一個重要方面,也是未來必須引入和應用的。用戶屬性具有知識性,相互關聯而又隨機不同的[2]。隨著通信從服務“人”走向服務“物”、再走向服務“虛擬對象”,針對用戶和用戶傳輸需求,需要尋找它們附帶的不同用戶屬性,以便精準估計用戶意圖,實現準確送達。當然,除用戶和用戶傳輸需求之外,用戶的屬性還包括用戶移動速度、用戶數據時延要求、用戶所在位置等。這些用戶屬性都可以用數學量來表達,以實現在智能網絡中得到最大限度的利用和滿足。
航線的敷設按照常規航空攝影要求完成,旁向重疊度30%,航向重疊度60%,在標準范圍內。像片連接點經影像量測程序做自動轉點,地面控制點上以航空攝影測量規范作影像上的人工預讀,實現像平面坐標的立體觀測,經檢測發現,像點坐標測量精度在±2.0m內。
2)網絡面知識。網絡面知識包括無線傳輸、無線接入、網絡配置、定點送達等。網絡面知識涉及的網絡類型問題有:是4G、5G,還是6G?是IoT、WiFi,還是picocell?網絡面知識還涉及傳輸與網絡參數問題:是正交準正交傳輸,還是干擾對消或對齊傳輸?是大區無縫覆蓋,還是密集熱點覆蓋?是MIMO天線,還是超表面多天線?這些知識可用數學符號來表達。有些已經被證明有效可靠的數學公式,可作為智能構建復雜網絡和提高管控能力的知識對象[3]。
3)服務面知識。服務面知識主要是指完成給定服務所需的資源開銷,如頻譜頻段和帶寬、峰值功率和平均功率、算力開銷和緩存大小、人力開銷和經濟成本等。這些知識是實現未來網絡智能優化管控所必須承受的開銷,我們應盡量使之最小化。
知識+數據驅動學習模型,由數據驅動的深層學習架構和知識驅動的逐層優化過程組成,按數據驅動和知識驅動同時推進和彼此交互來完成。
數據驅動的深層學習,同標準深度學習完全一樣,有輸入層、隱含層、輸出層。層間通過學習加權函數連接,不同層的節點有不同層運算。數據驅動的深層學習最后把輸出層給出的損失率作為反向傳播判決變量,做反饋深度學習。數據驅動的深層學習輸入是用戶傳輸需求,可以是用作分析和預測的歷史大數據,也可以是用作配置和優化的動態實時用戶大數據。
知識驅動的逐層優化,是在數據驅動深層學習的伴隨和支持下進行的。不同層使用不同的知識變量,這是依據通信網絡知識來確定的。知識變量的取值,可從數據驅動學習過程中獲得。當然,對于非隨機變動不可準確預測的情況,知識變量的取值也可以從已經被證明行之有效的公式和運算中獲得。
因此,知識+數據驅動學習模型,構成了知識驅動+數據驅動的雙重體系結構,可以實現知識學習和數據學習的交互運算、融和運行。
知識+數據驅動學習模型的每一層,都有數據輸入和知識輸入。數據輸入輸入的是用戶、用戶傳輸需求,以及用戶的不同屬性。其數據值是隨機、不可當即準確預測的。知識輸入輸入的是選取的知識變量和數學表達。各層知識變量的選擇,按用戶屬性、網絡參數、資源開銷分層布局。知識變量的設置因要解決的問題不同而有所區別,但知識變量的取值,可從數據學習或數據支持下的運算中獲得。通常,這會有一些約束和規范。
如前所述,在深度學習的前向結構中,各層按數據輸入和知識輸入雙重推進。首先,在數據輸入時,通過對加權矩陣元素值的調整獲得的可信輸入加權進入各層節點。在前向學習中,知識變量通過輸入數據計算的關聯公式獲得取值。通過輸入數據對輸入加權矩陣和知識變量取值的學習,完成由輸入數據、加權矩陣和知識變量參與的節點運算,隨后輸出本層數據和知識變量。最后,在輸出層輸出學習結果和反向傳播判決損失率,支持反饋學習和輸出。
深度學習的反向傳播,是指利用輸出層輸出的損失率,相對于數據加權矩陣和知識變量作偏微分,獲得加權矩陣和知識變量最佳反饋調整途徑,然后再一次做前向學習。據此,綜合前后各層整體的不斷學習,反復進行,直至達到期望目標,實現復雜網絡最佳管控。
在知識+數據驅動學習模型中,各層的輸入是從用戶傳輸需求數據開始的。前一層的輸出數據送到下一層加權處理后,被作為節點輸入數據,進行逐層計算,直至輸出。各層的知識變量是根據各層學習功能和優化需要來明確的,同時各層彼此不同;但知識變量的取值,可通過對輸入數據的有規則學習來確定。
由此可見,知識+數據驅動學習模型的各層功能是清晰的,學習過程是明確的。數據學習的走向受到知識變量的約束,知識變量的取值由輸入數據演變而定。每一層在推進中將不會存在人為干預或人工操控的可能。因此,知識+數據驅動學習模型是可解釋、透明的深度學習模型。
未來智能網絡是一種智能化的極簡網絡,也是一種分層學習架構。它包含一個由終端網絡、接入網絡、核心網絡構成的三層基礎架構,擁有明確的網間輸入輸出接口、終端用戶需求數據輸入和核心網絡服務輸出應用。這種分層學習架構,可以被定義為知識+數據驅動學習的虛擬體系架構。網間接口涉及層間輸入、輸出和加權矩陣的設計,以完成網間交互。面對用戶需求和用戶屬性,通過學習和聚類,送往上層網絡,或者駐留本層網絡,來完成端到端服務。
每層網絡又是相對獨立的,可按各層網絡功能構成自己的分層或分塊結構,并等效為另一類知識+數據驅動學習模型。根據用戶提出的傳輸需求和用戶屬性,各層網絡可以自行優化設計,實現本層網絡連通的低時延和低功耗的端對端服務。
面對各種動態隨機的用戶需求,未來網絡的智能管控能夠實時動態調整參與服務的網絡架構和參數,實現各層網絡資源的開銷最小、效益最大。未來網絡的智能管控能涉及的關鍵詞是動態、聯合、優化。
未來網絡的智能化是實現網絡整體管控的動態聯合優化。知識+數據驅動學習模型和運行規范,是未來網絡智能的基礎。用知識+數據驅動學習模型作為基礎模塊,在相對長時間的動態承載活動幀內,可構建一套網絡整體管控軟件。動態承載活動幀包括智能網絡的初始化、小于網絡能力的欠載、大于網絡能力的過載和隨機需求動態聯合優化。
動態承載活動幀的長短,不僅取決于網絡面對的大量用戶需求的統計特性穩定期,還取決于智能網絡最基本變量的持續期。無線網絡、頻譜帶寬和小區半徑,都有較長的穩定期。快,可按小時計,如終端網絡;慢,則按天或月計,如接入網絡,有的甚至按年計,如核心網。
這里以無線網絡為例,來說明未來網絡智能管控的動態優化。首先要實現無線網絡智能管控的初始化,即利用過去的用戶需求大數據和它們的相關屬性,以及網絡最基本變量(如頻帶和小區半徑),做初始化訓練。獲得的動態承載活動幀的基礎值,在動態承載幀內不容易變動。
對小于網絡能力的欠載情況,在初始化確定的無線網絡最基本變量基礎上,本次承載給定的頻譜帶寬有富余。這時,有的主動承載上一次未能完全傳輸的需求,或減少網絡的密集程度、降低發送功率、回退MIMO天線數目,以使網絡的功率開銷最小。
對大于網絡能力的過載情況,當無線網絡的所有資源效率和開銷放到最大但仍不能滿足到達的海量傳輸需求時,不得不按用戶傳輸需求的時延分類,把可承受較長時延的需求從此次傳輸中轉移給下一次或再下一次的傳輸。這樣的聯合協作和最大化頻譜利用能力,可有助于實現用戶需求傳輸最大化。
隨機需求的動態聯合優化,就是把初始化、欠載傳輸功耗最低、過載傳輸頻譜效率最大整體結合起來。無線大數據的支持,使網絡基本變量得選擇變得更精準,也使后續實時動態學習調整的代價變得最小。在動態承載幀內,欠載和過載會交替出現,并動態協作。二者聯合起來能夠做到傳輸能力最大、所需資源最少,有助于實現智能網絡管控目標。
綜上所述,未來智能網絡可以構建成為一個適合深度學習的極簡網絡架構。基于知識+數據驅動的學習模型,能夠實現網際間的學習優化和網內的學習優化,并構成一個動態聯合優化體系,有助于實現未來網絡的智能自主管控。