伏玉筍,楊根科,2
(1.上海交通大學電子信息與電氣工程學院,上海 200240;2.上海交通大學寧波人工智能研究院,浙江 寧波 315000)
20世紀80年代以來,移動通信技術逐步實現從固定到移動、從模擬到數字、從電路交換到云網融合、從窄帶到寬帶、從人人互聯到萬物智聯的演進,為社會的發展不斷注入新的動力,帶動了整個生態產業的發展,同時也提出了更高的生態系統需求。5G時代的到來,促使5G與人工智能、云計算、大數據、物聯網/工業互聯網、邊緣計算等融合交織,在各行各業產生“聚變”反應。移動通信網絡正在變得越來越復雜,這一點可以從如下3個方面來說明。
網絡復雜化。從低頻到高頻(毫米波至太赫茲)的載波越來越多,多載波是一種必然趨勢。2G、3G、4G、5G多制式共存帶來的協同和互操作難度增加;從單天線到多天線,甚至Massive MIMO,天線數越來越多,在商用場景中如何進一步提升性能面臨很大挑戰;超密的分層網絡與虛擬化云化網絡的動態變化所帶來的資源統一調度非常困難;分層解耦架構下的故障定界定位困難;傳輸網絡異構化。
業務多樣化。人與人通信的單一模式逐漸演化為人與人、人與物、物與物的全場景通信模式,業務場景更加復雜,帶來對業務級(SLA,service level agreement)的差異化需求,比如高帶寬、大連接、超高可靠性和低時延等(數據分組大小的差異是107量級,時延的差異是104量級,吞吐率的差異是105量級)[1-2],以及與之配套的網絡管理的復雜性(包括網絡切片場景等)。
體驗個性化。依托5G 網絡能力和豐富的業務發展,業務體驗也將隨之呈現出多元化、個性化發展態勢,比如沉浸式體驗、實時交互等,網絡對于業務體驗的支撐保障,將顛覆傳統模式,迎來全新挑戰,評價準則越來越多元化。
面對移動通信問題建模日益困難,求解復雜度指數級升高,網絡的運維成本越來越高。如圖1所示隨著移動通信技術的演進(從2G時代到5G時代),網絡性能在不斷地提升,但同時實際性能與理想性能的差距卻在擴大,這說明需要深入挖掘新的技術方法,使實際性能逼近理想性能,不過基于傳統方法解決這樣的問題遇到了很大的瓶頸,移動通信迫切需要引入新的方法論。
人工智能在大數據、深度學習、計算與存儲能力提升這三者的共同促進下迎來了新的浪潮[3-7]。智能通信被認為是5G 之后無線通信發展的主流方向之一[8-9],其基本思想是將人工智能引入無線通信系統的各個層面,實現無線通信與人工智能技術的有機融合。學術界和工業界正在開展該領域的研究工作[10-61],目前,該方向的研究正在從高層向低層的物理層推進,特別在物理層已經出現無線傳輸與深度學習等結合的趨勢,然而,各項研究目前尚處于初步探索階段。
圖1 實際性能與理想性能間的距離
雖然目前人工智能在移動網絡運維領域有了一定的應用[13-18(]比如智能告警處理與根因分析、關鍵性能指標(KPI,key performance indicators)異常檢測等),但是在提升無線通信系統性能方面,盡管學術界的論文不少,商業應用的成功案例卻屈指可數。
必須說明強調的是,與提供“盡力而為”服務的互聯網不同,通信網從一開始就是一個以商業經營為目的的網絡,必須確保通信服務質量和服務安全,對網絡的部署、維護升級、電信設備的性能等都有嚴格的要求。
運營商通信系統對KPI的要求很高,對性能惡化的容忍度很低,而IT系統對失敗的容忍度則很大。學習型算法的可靠性通常面臨著很大挑戰:由確定性演變為不確定性的風險很高,尤其是網絡升級,KPI在任何應用場景下不能有負增益,這更是嚴格的高壓線。
可見,雖然有著人工智能在提升無線通信系統性能上發揮著更大作用的強烈需求,但也面臨突破上的巨大障礙。本文對人工智能在移動通信方面的研究與應用現狀進行總結,同時對人工智能在如何提升無線通信系統性能上進行探索與實踐,從而為相關領域的研究人員和工程技術人員起到參考和幫助的作用。
移動通信網絡涉及的主要領域及對應的時間尺度如圖2所示。一般來說,尺度越小,人工智能的應用難度越大。后面將分別介紹每個領域的研究和應用現狀。
圖2 移動通信網絡涉及的主要領域及對應尺度
目前在移動通信領域研究中,最常用的人工智能/機器學習方法如圖3所示。由圖3可知,沒有一種方法可以“包打天下”。本文通過分析機器學習方法的特點,再結合移動通信系統的需求和特點,可以更好地把握人工智能在移動通信系統中的研究和應用。
應該說近年來機器學習本身的進步,以及大數據和計算能力的大幅提升共同促使人工智能應用取得了長足的發展。數據驅動智能是其明顯的特征之一。第四范式是指數據探索性的研究方式,即基于數據密集型的發現,從以數學模型計算為中心到海量數據處理為中心。和第一范式、第二范式、第三范式相比,第四范式在業界還未達成一致[3],但近年來大數據領域的蓬勃發展,給第四范式注入了強大活力。第四范式可能成為無線通信領域的工作范式:基于大數定理及概率設計大規模天線無線通信系統、基于大數據設計通信網絡是這方面的范例[11-12,23-25]。
圖3 移動通信領域中最常用的人工智能/機器學習方法
從控制論的角度來說,可重構、可編程無線環境的概念被延伸提出,圖4展示了無線網絡與智能無線網絡的區別[26]。具體來說,香農把通信系統抽象為轉移概率(即Pr{y|x});維納從控制論的角度,系統模型仍然是給定的,但輸出要反饋到輸入(如信道狀態從接收機反饋給發射機,以便于信道識別的波束成型、鏈路自適應等);在智能無線環境中,環境對象能夠感知系統對無線電波(物理世界)的響應,并將其反饋給輸入(數字世界)?;诟兄獢祿ㄟ^軟件控制器分別就輸入信號和環境對象對無線電波的響應進行聯合優化和配置。例如,輸入信號是轉向一個給定的環境目標,通過適當的優化相移將其反射到接收器。反過來,接收器也被引導朝向輸入信號。
圖4 無線網絡與智能無線網絡的區別
目前人工智能在移動通信系統中的研究和應用可以分為3類,具體如下。
1)“改進”類:物理層研究中的去模塊化、由傳統最優化的資源分配到基于深度學習的資源分配等。
2)“0到1”類:自組織網絡或網絡運維中的KPI建模、多參數性能模型等。
3)“代替”類:通過神經網絡代替多輸入多輸出(MIMO,multiple input multiple output)最大似然檢測以降低復雜性等。
3GPP從Rel.8/9正式引入SON的概念,在未來更是扮演重要角色,其內涵也會更加豐富[27]。傳統SON用例如圖5所示,具體如下。
1)自配置(self configuration)?;?網絡初始啟動時,自動根據環境設置系統重要參數。
2)自優化(self optimization)。在網絡運行過程中,根據接收到的系統測量和反饋信息,優化系統。
3)自愈(self healing)。在網絡運行過程中,借助系統測量與反饋,自動修復故障。
圖5 傳統SON范疇用例
和4G系統相比,5G系統具有更加靈活的頻譜(包括毫米波)和參數集/時隙結構、大規模多天線及以波束為中心的設計、分層異構的超密集網絡、多樣化的垂直業務和網絡切片的動態管理與編排、網絡架構對數據驅動的網絡智能的支持等,因此,5G-SON必將有新的內涵和挑戰[28]。目前,5G-SON正在從類似于4G-SON的基本用例(盡管實現細節會有不同)著手[29-30],依據緊迫程度,將有節奏地不斷完善和拓展新的用例和方案。
SON的核心思想與機器學習理論接近,即通過對未知環境的感知、交互、學習,自動調整系統以適應環境,從而達到最優。不同的場景、不同特性的SON需要不同的機器學習方法[20-21,30],沒有“萬能鑰匙”,比如自優化類中的移動負載平衡,強化學習就是合適的候選技術[32]。
關于是在線學習還是離線學習,有些SON的特征適合用在線學習,比如自優化和閉環SON,需要實時采集用戶反饋,進行學習推斷,獲得新的配置。有些適合用在離線學習,通過對相關的非實時數據進行挖掘來提供指導,自配置就是很好的例子。
隨著5G時代的到來,移動通信系統的網絡運營/運維面臨的挑戰將是全方位的,以專家經驗為主的運營運維模式同網絡的先進性之間,正逐漸形成差距,自動化、智能化的網絡運營運維能力將成為5G時代電信網絡運營運維的剛需。近年來,基于大數據與機器學習的人工智能,在移動網絡運維領域取得了一定成功的實際應用,如射頻指紋應用、參數自適應、負荷預測、性能預測、業務預測、無線感知、智能定位等。未來智能的管理和維護是準確理解網絡需求,進行最優的網絡設計、部署;實時感知網絡狀況,及時發現和解決問題,提高用戶體驗;當網絡出現故障時,能快速診斷,排除故障。
類比于汽車的自動駕駛的內涵,“網絡的自動駕駛”也被提出[17-18],這將更具挑戰。目前國際電信聯盟已完成了網絡智能等級的評價框架[33],3GPP開始著手自治網絡等級的概念、需求和解決方案的研究[34],提出了大數據驅動的網絡架構。該架構引入了網絡數據分析功能(NWDAF,network data analytics function),可以從其他5G功能收集數據,如圖6所示[35-37],本文按照業務進行分類,以5G信息管理要求上下文挖掘的應用場景為例分析原因,具體如下。
圖6 基于服務化的5G網絡架構
1)5G需要“上下文識別”能力支持網絡資源利用效率和網絡優化。
2)基于網絡功能虛擬化(NFV,network function virtualization)的網絡功能模塊化要求用戶面和控制面的動態性。
3)垂直業務要求端到端的性能保障機制。
4)網絡切片要求業務部署的動態性,因此要求短的上市時間(TTM,time to market)和業務覆蓋需求,這意味著需要完全自動化的閉環機制。
RRM/MAC在移動網絡性能管理和提升中起到“大腦”的作用,這種作用非常重要。本文可以基于網絡的(小區級)和基于連接的(用戶級)進行分類,其分模塊或者分層如圖7所示。小區間資源管理是優化范圍的擴大,比如干擾管理就是考慮小區間的相互影響,從全網最優化的角度,考慮干擾的控制、協調、抑制、利用等。
RRM本質就是一個最優控制問題,如式(1)所示,但影響要素眾多,如圖8所示。需要說明的是,隨著移動通信技術的演進以及場景更加多樣化,同樣的類別名稱下,其內涵及挑戰的差別是很大的。傳統的方法不足以解決復雜問題,且缺乏適應性。傳統RRM通常基于很多假設的簡化模型,通過仿真確定算法參數,可能對于場景A為“好”,但對于場景B為“壞”。
圖7 RRM/MAC領域總體分類
圖8 RRM/MAC領域典型影響因素總結
其中,Ui表示用戶i的效用。
RRM有著不同的場景和不同的特性,因此需要不同的機器學習方法。比如強化學習用于功率分配與控制、鏈路自適應[19,38-39];深度學習用于調度資源分配[40],聯邦學習用于分布式場景[41]。另外,許多傳統的通信模型,如基于聯合空間復用的大規模MIMO模型嚴重依賴信道狀態信息,它們的性能在非線性時變信道下會發生惡化,因此準確獲取時變信道的信道狀態對系統性能至關重要。通過深度學習技術對無線信道進行預測和重構[42],有可能使通信系統可以學習突變的信道模型,并及時反饋信道狀態,進一步提升多天線系統的無線性能。
需要說明的是,無線場景非常復雜多樣,不像圍棋,棋盤就是全部環境。和傳統方法相比,無線場景數據集的收集高成本與算法的高復雜、泛化能力和實時性的高要求、網絡KPI要平滑的高壓線,取得突破性的應用成果并不多。同時,研究碎片化問題突出,并沒有像物理層研究人工智能那樣考慮“去模塊化”或者說模塊間的聯合優化,比如控制信道資源和數據信道資源分配盡管時頻資源是共享的(如圖9所示),但分配機制是獨立的,這顯然不是最優的[63],其原因是控制信道分配的資源多少和能夠支持的調度用戶數有關,當然也和用戶的位置、受到的干擾大小有關,比如邊緣用戶信干比較差,為保證控制信道的可靠性,則需要占用更多的控制信道資源,不過這更易導致資源分配間的沖突碰撞而失敗。同時,控制信道資源分配得越多,可支持的用戶數越多,但數據信道可分配的資源越少,反而降低了可支持的用戶數。而數據信道的資源分配又和業務模型及調度優先級有關,因此,研究模塊的歸一化或者模塊間聯合最優化的問題非常有意義。
圖9 控制信道和數據信道聯合資源分配
一個典型的無線通信系統由發射機、無線信道和接收機構成,如圖10所示。發射機主要包括信源、信源編碼、信道編碼、調制、射頻發送等模塊;接收機包括射頻接收、信道估計與信號檢測、解調、信道解碼、信源解碼、信宿等模塊。
對于這種基于模塊設計的通信體系結構,通信領域的工作者已做了非常多的研究工作來優化每個模塊的性能,但是每個模塊的性能達到最佳并不意味著整個通信系統的性能達到最佳。一些新的研究表明,端到端優化(即優化整個通信系統)性能優于優化單個模塊。智能通信的無線傳輸研究旨在打破原有的通信模式,獲得無線傳輸性能的大幅提升。由于深度學習在面對結構化信息與海量數據時有巨大優勢,因此它可以為實現端到端性能最大化提供了一種強有力的工具[43-48]。基于深度學習的物理層通信技術主要聚焦在信道估計、信號檢測、信道狀態信息的反饋與重建、信道解碼及端到端的通信系統。基于端到端的無線通信系統也被稱為自編碼器,用編碼、信道、解碼過程代替原先的無線通信系統結構,編碼、信道、解碼部分均用深度學習網絡實現,是一種全新的無線通信系統實現思路。對于中射頻,神經網絡被用于功放線性化和數字預失真[49-50]。
圖10 移動通信系統物理層典型構成
目前有2種類型的深度學習網絡,一種基于數據驅動,另一種基于數據模型雙驅動?;跀祿寗拥纳疃葘W習網絡將無線通信系統的多個功能塊看作一個未知的黑盒子,利用深度學習網絡取而代之,然后依賴大量訓練數據完成輸入到輸出的訓練。然而,訓練深度學習網絡需要大量的標記數據,積累和標記大量信息的過程不但費時而且成本高昂。除了積累標記數據的挑戰之外,大多數基于數據驅動的深度學習模型泛化性和自適應性較弱,即使網絡部分結構發生微小變化,也會導致訓練模型的準確性大大降低。移動通信系統從1G 演進到5G,其性能的提升離不開功能模塊的建模,基于數據驅動的深度學習網絡摒棄這些已有的無線通信知識,需要海量數據進行訓練與學習,而獲得的性能往往達不到已有無線通信系統模型的性能。而基于數據模型雙驅動的深度學習網絡以物理層已有模型為基礎,可以顯著減少訓練或升級所需的信息量。由于已有的模型具有環境自適應性和泛化性,因此數據模型雙驅動深度學習網絡也具有這些特性,并且能在原模型基礎上進一步提升系統的性能。因此數據模型雙驅動的深度學習是最具潛力的發展方向之一,如圖11所示為訓練方法分類[26]。
基于人工智能的物理層技術研究有2個價值方向:提升性能或者降低成本(在性能不變的情況下降低計算復雜度),不過目前許多技術的應用實施尚未處于初期探索階段,更談不上商用。使用深度學習解決物理層無線通信問題是一條漫長的道路,而且這條道路上還有許多障礙,比如如何建立通信數據集,如何選取或設計適用于通信場景的神經網絡及如何將基于深度學習的通信技術運用于通信設備等。但基于深度學習的物理層無線通信技術研究,也可能給基于傳統無線通信的研究、技術優化帶來啟示。
圖12從研究對象的角度給出了移動通信網絡系統性能提升的全景。從圖12可以看出,一方面,把每個模塊的性能做到極致;另一方面,從縱向考慮從中射頻到應用層的跨層最優化設計,從橫向考慮從小區內到小區間/載波間的最優協同設計。
導致實際網絡性能與理想網絡性能存在大的差距的主要因素有信息的及時性、信息的確定性、信息的完備性、無法精確求解,因此,人工智能技術就是要克服這些網絡性能提升的障礙。在應用人工智能進一步提升移動通信系統性能的算法方案選型、決策技術路線時,需要考慮7個關鍵度量維度,如圖13所示。
1)可擴展性。能應對規模增加(比如更多的數據、更多的特征、更多的層數等)而不無限增加復雜度。
2)收斂可靠性。算法是否限于局部最優或者初始條件嚴重影響結果。
3)響應時間。算法訓練完成后的生效時間。
4)訓練時間和數據。算法的訓練方式為在線或者離線。對于在線算法,需要有很高實時性,訓練時間要短。關于訓練數據,除了通常標注與非標注的區分,更重要的是數據的可獲得性、粒度、數據量與本節點的存儲能力、是否需要相鄰節點、傳輸條件與代價等。
5)復雜度。為了實現期望的結果所需要的數學運算量。
圖11 訓練方法總結
圖12 移動通信網系統性能提升全景
6)精確度。算法和希望的目標之間的偏差極小。
7)收斂時間。算法抵達最優解或者期望的結果所需時間。
圖13 人工智能應用時需考慮的關鍵度量維度
網絡越來越復雜,網絡實際性能與網絡理想性能的差距不斷擴大,傳統方法在面對復雜問題時無力,但人工智能方法又有其自身的挑戰與局限性。如何走出困境?除了從人工智能本身突破之外,另一條思路是從理論上提煉出到底什么特點的領域適合人工智能,什么特點的領域并不適合,人工智能的方法和非人工智能的方法如何最佳結合以逼近性能界。
本文創造性地提出基于性能內環與性能外環的方式,相互協作逼近性能上界。有關性能內環和性能外環的定義和比較如表1所示。由表1可以看出,性能內環的價值越大,則性能外環的價值越小,反之,性能內環的價值越小,則性能外環的價值越大,如圖14所示。首先分解并解耦一個問題為性能內環和性能外環兩部分,用人工智能的方法重構性能外環部分,然后和性能內環部分協同進行性能的最優化。表1中,TTI+(transmission time interval,傳輸時間間隔)指的是時間的處理粒度為TTI量級,話統+指的是時間的處理粒度為通常話務統計的量級。
以鏈路自適應為例,目前研究中常采用滿灌包(fullbuffer)的業務模型或者隱含了滿灌包的業務模型的假設,這是有問題的。由于業務具有多樣性,有的業務在線時間很短(對于5G的大帶寬場景,業務的在線時間更短),有的業務在線時間較長。例如,以即時通信類業務為代表的小包持續性突發(burst)實時在線業務,該業務包含頻繁的文本、圖像信息和周期性的ping,這導致無線網絡在連接和空閑狀態間進行頻繁的切換,而每當退出一次網絡,之前的用戶上下文信息全無。對于在線時間短的業務,閉環反饋還沒有使鏈路自適應收斂就結束了,所以初值的選擇就顯得更加重要。因此,采用圖8所示的相關指標作為輸入基于神經網絡對初始值進行訓練,作為性能外環,訓練方式可離線也可在線。而性能內環在性能外環的基礎上,為基于確認(ACK/NACK,acknowledgement/not-acknowledgement)反饋的閉環自適應算法,比如眾所周知的外環鏈路自適應(OLLA,outer loop link adaptation)算法或者基于吞吐量最優化的其他算法,這樣既提升了性能,又降低了神經網絡泛化能力帶來的網絡KPI風險(因為性能內環的“糾偏”)。
表1 性能內環與性能外環比較說明
圖14 性能內環與性能外環的關系
就像前文所提到的,盡管人工智能在移動網絡運維領域取得了一定成功,但人工智能在如何提升無線通信系統性能方面的商業用例還很少。由前面的分析及基于人工智能的特點,本文著力探索了人工智能在一個問題的性能外環部分的應用,然后和該問題的性能內環部分進行最佳協同。下面的用例也說明了基于性能外環理念的有效性。
1)基于AI的大規模MIMO模式(massive MIMO pattern)自適應[14]。
2)基于AI的智能載波匯聚(CA,carrier aggregation),改善用戶體驗[14]。
電信網絡和IT網絡最大的不同之一是,電信網絡有著嚴格的KPI,所以人工智能應用到無線網絡系統性能提升最大的挑戰是:1)如何“穩”“準”“快”;2)如何由“概率性正確”盡可能為“確定性正確”。
為了解決上述挑戰,除了盡量使人工智能重構的無線資源管理方案本身具有優異的性能外,還必須有基于大數據分析和模擬系統的反饋閉環系統,如圖15所示,以使能無線網絡的自動化、智能化、智慧化,其中,1)模擬器的構建——模擬系統是實現“穩”“準”“快”的關鍵路徑;2)大數據分析包括“場景聚類”“根因分析”等;3)解決方案集可以是人工智能重構的無線資源管理或者各種場景化的解決方案。
圖15 基于大數據分析與模擬系統的反饋閉環系統
上述工作是一個浩大的工程,不僅涉及對移動通信技術和移動網絡系統的熟悉理解與深入研究,也有賴于遷移學習(transfer learning)、增量學習(incremental learning)、聯邦學習(federated learning)或者說共享學習(shared learning)等機器學習技術的突破,以及這兩者之間恰如其分的結合。技術決定架構,反過來架構影響技術。智能化的數據訓練是需要樣本的,而移動通信網絡樣本的獲取成本是非常高的,尺度越小越是如此,因此,分布式的計算架構至關重要、增量與存量數據的關系至關重要、共性模型和個性模型的關系至關重要等。技術需要和架構迭代研究才能最終收斂。
事實上,有了這樣的閉環系統,也就可以放心地實現解決方案精準投放了。
人工智能在提升移動通信系統性能上發揮更大作用,但也面臨著突破上的巨大障礙。下面3個問題,可以說是當下面對人工智能到移動通信領域應用前景時最大的困惑與不確定性,具體如下。
1)在當下的傳統網絡架構下,人工智能在移動通信領域到底能滲透到什么程度,能發展的程度如何。
2)未來的智能無線通信(包括其對應的新的網絡架構)會是什么形態。
3)能否實現移動通信網絡的“自動駕駛”。
本文對人工智能在移動通信領域的研究與應用現狀進行了總結分析,進行了初步的探索與實踐,但研究碎片化與實際應用的艱難、理論構建不夠、系統架構缺失等情況突出,因此在未來將以全景式視角,在研究的系統化、框架化及跨學科的交叉融合理論構建上進一步的突破創新。