劉 徹 楊愷喬 鮑江涵 俞文明 游檢衛 李廉林 崔鐵軍*
①(東南大學電磁空間科學與技術研究院 南京 211189)
②(東南大學毫米波全國重點實驗室 南京 210096)
③(北京大學電子學院 北京 100871)
20世紀60年代之前,受限于當時計算機非常有限的計算能力,早期對麥克斯韋方程組的求解大都采用解析法和高頻方法,無法仿真具有復雜結構的目標。隨著計算機技術的飛速發展,以時域有限差分(Finite-Difference Time-Domain,FDTD)法、時域有限積分法(Finite Integration Technique,FIT)、有限元法(Finite Element Method,FEM)和矩量法(Method of Moments,MoM)為代表的全波數值方法全面興起[1],成為現今工業電磁仿真軟件(例如CST,Ansys HFSS等)的算法基石。近十年以來,傳統計算電磁學已進入相對平穩的階段,另一門學科--人工智能(Artificial Intelligence,AI)進入了蓬勃發展期。2016年,谷歌DeepMind推出的AI圍棋程序AlphaGo[2]以4:1的絕對優勢戰勝當時頂尖圍棋選手李世石,此事件將AI浪潮推向了新的高度,基于AI的創新性應用也如雨后春筍般在各行各業不斷涌現,其中包括我們熟知的圖像識別、語音識別、文本翻譯等,并在最近發展出了已實現大規模商業化的自然語言大模型ChatGPT,預示著AI將越來越多地改變人類的生產和生活方式。在科學界,AI與各學科的結合也衍生出了“AI for Science”這一特殊研究領域,對自然科學產生了巨大影響,其中以谷歌發布的可預測蛋白質折疊結構的Alpha-Fold[3]為代表。最近,華為云盤古大模型研發團隊[4]發布的精準中期全球天氣預報AI模型和清華大學[5]發布的極端降水臨近預報AI模型幾乎同期登上了《Nature》雜志,預示著“AI for Science”的巨大潛力。在基礎算法領域,谷歌DeepMind[6]于2022年又推出AlphaTensor,基于強化學習技術成功發現了人類已知最快的矩陣相乘計算算法,在現有硬件條件下實現了計算效率10%~20%的提升,開創了AI尋找快速算法的先河。
仿真和計算作為科學研究的基礎,其與AI的結合也越來越受到關注,并催生出“AI for Science”領域下一個更為細分的門類--智能計算(Intelligent Computing)。2023年初,杭州之江實驗室[7]發布了其對“智能計算”的定義:“智能計算是支持萬物互聯的數字文明時代新的計算理論方法、架構體系和技術能力的總稱。智能計算根據具體的實際需求,以最小的代價完成計算任務,匹配足夠的計算能力,調用最好的算法,獲得最優的結果。”電磁仿真和計算作為工業仿真和科學計算體系的重要組成部分,自然也受到智能計算新體制的影響,衍生出了“智能電磁計算”這一新興研究方向,正深刻改變著計算電磁學這已發展百年的傳統領域。本文借鑒“智能計算”的概念,將“智能電磁計算”定義為“以在電磁仿真計算的數字空間和電磁調控感知的物理空間引入人工智能技術為手段進行電磁建模、推理和決策,以減少資源消耗、降低人工干預、提升運行效率并尋求最優結果為目的的電磁學計算理論方法、架構體系和技術能力的總稱”。
長久以來,對電磁仿真任務的求解依賴計算電磁專家從麥克斯韋方程出發,結合具體應用場景對精度和效率的需求,尋求綜合性能最優的電磁方程求解方法,而智能電磁計算的出現有望在特定應用場景下改變這一模式。我們以某個天線優化設計場景為例,在實際應用時,假設用戶僅關心天線的反射相位曲線,這時電磁仿真獲得的眾多中間參數,例如表面電流分布等,就存在一定程度上的信息冗余。在用戶對天線的不斷優化迭代過程中,積累了大量的仿真數據,這些仿真數據中已經暗含了天線結構參數和對應反射相位曲線的映射規律,但傳統電磁仿真卻無法有效利用這些歷史數據來加速自身仿真過程。已經通過理論證明,帶有非線性激活函數的深度學習網絡能以任意精度逼近任意的可測量函數[8],因此只要積累一定數量的仿真數據,就能夠通過學習訓練建立從天線結構參數來預測其反射相位曲線的深度學習網絡,替代電磁仿真過程,一般來說可將后續的天線優化設計過程加速3~4個數量級[9]。
本文旨在引導讀者了解并入門智能電磁計算這一新興領域,結合作者自身的研究范疇,首先從算法層面分別介紹了智能電磁計算在正向電磁仿真和逆向電磁成像上的最新研究成果,隨后從軟硬件或數字物理相結合的系統層面介紹了基于信息超材料的智能計算新體制和相關應用,最后對全文進行了總結并預測智能電磁計算的發展方向。需要說明的是,本綜述局限于作者所了解到的工作,因此對智能電磁計算的介紹并不全面,勢必會遺漏一些非常優秀的研究成果。希望本綜述可以起到拋磚引玉的作用,吸引更多的優秀科研工作者,為智能電磁計算的發展添磚加瓦。
基于Maxwell方程組的正向電磁仿真技術為電磁兼容分析、電子器件設計、信號處理、通信網絡設計和電子對抗等領域提供了重要參考,在信息化時代生產制造中發揮了舉足輕重的作用。是否掌握自主可控的精準快速的正向電磁仿真技術,也是衡量一個國家科學技術水準以及工業制造能力的重要指標,對我國具有重大戰略意義。目前,主流正向電磁仿真算法主要包括以有限差分法[10]、有限元法[11]、矩量法[12]等為代表的全波仿真方法,和以彈跳射線法[13]等為代表的高頻漸近方法。雖然經過前人不斷的努力,大量改進后的快速算法已經問世,但與實時化、多尺度要求仍然相距甚遠。因此,需要提出一種全新的計算范式來解決傳統方法面臨的計算效率難題。
近年來,隨著神經網絡理論以及計算機硬件的快速發展,人工智能技術在解決計算機視覺、自然語言處理等諸多領域的數據處理問題方面展現出了顯著的效率優勢,這給傳統物理仿真帶來極大啟發。綜合目前已有的研究成果可以大致看出,智能計算實現正向仿真效率提升,本質上是通過學習輸入到輸出的映射關系,提取有效物理信息,從而構建等效神經網絡模型代替傳統數值算子,在保證計算精度基本不變前提下實現計算復雜度的降階。需要指出,人工智能并不是傳統方法的替代品,因為基于神經網絡構建的等效求解器不具備普適性求解能力,其最為顯著的優勢在于特定場景下的精準快速(甚至達到實時化程度)計算,尤其適合器件優化設計等小尺度多輪迭代計算應用,以及無線環境仿真等大范圍粗顆粒度仿真應用。由此不難判斷,正向智能計算將在未來的通信、感知、制造等領域展現出巨大的應用價值。目前,正向智能計算技術逐漸成為學術界、產業界關注的熱點研究領域,并且在多個物理學科[14-16]的仿真計算方面都取得了非常積極的研究成果。鑒于上述進展,智能化也被視為計算電磁領域未來最為重要的發展方向之一。
本節主要對正向智能電磁計算近年來的研究情況進行介紹。按照實現思路上的劃分,正向智能電磁計算技術主要可以分為兩類,即數據驅動的電磁計算以及物理驅動的電磁計算。數據驅動的電磁計算內容豐富,而其中的算子學習技術因其獨特的設計理念以及優異的性能,受到了學術界廣泛關注。因此,本節接下來將主要從數據驅動、物理驅動以及算子學習3個角度展開敘述,并簡單介紹一些可微分正向仿真的研究成果。
數據驅動方法是目前智能電磁計算領域的研究主流。數據驅動的電磁計算可以理解為,給定大量仿真或實測數據,通過神經網絡有監督地學習Maxwell方程組在不同電磁參數、激勵以及邊界條件下的解,從而建立輸入到輸出的直接映射。如圖1所示,根據智能模塊在整個仿真計算過程中的使用方式,數據驅動的電磁計算大致分為兩類:一種可概括為結果學習,即直接學習從電磁參數到期望計算結果的映射,包括場值和電流等;一種可概括為過程學習,即用神經網絡代替傳統仿真方法中的某一個中間環節,實現計算效率提升。

圖1 數據驅動的正向電磁計算分類Fig.1 The classification of data-driven forward electromagnetic computing
結果學習是一種最直接的策略。文獻[17]根據地質雷達工作原理,構造神經網絡實現從給定環境、電磁參數到電磁波形的快速預測。文獻[18]給出了神經網絡求解二維波動方程的技術方案,以循環神經網絡(Recurrent Neural Network,RNN)和卷積神經網絡(Convolutional Neural Network,CNN)代替顯差分格式迭代求解不同時刻的電場。一些研究人員注意到電磁計算與計算機視覺的相似性,提出可以通過CNN代替頻域有限差分法(FDFD)求解Helmholtz方程[19](如圖2(a)所示)以及Poisson方程[20],其中文獻[19]報道的真空中紫外波段CNN等效求解器在計算全局相對誤差不超過2%的前提下實現了接近200倍的計算提速,而文獻[20]報道的3.3 GHz二維、三維CNN等效求解器也實現了低全局相對誤差(小于-30 dB)條件下1到2個數量級的計算提速。此外,美國伊利諾伊大學香檳分校的研究人員[21]基于自編碼器加RNN架構,提出了一種針對二維散射問題的時域求解器。除了微分方程,基于積分方程思想(特別是矩量法)的研究也大量出現。文獻[22]提出在求解二維介質散射問題時,可以先通過對抗生成神經網絡(Generative Adversarial Network,GAN)[23]學習等效電流分布,之后間接計算出散射場分布。文獻[24,25]針對二維完美電導體(Perfect Electric Conductors,PEC)散射問題提出了與入射波無關的“固有特征參數”,并通過學習這一參數間接計算遠場雷達散射截面(Radar Cross-Section,RCS)(如圖2(b)所示)。文獻[25]基于注意力機制設計的等效求解器表現優異,在其所給測試數據集上RCS預測正確率超過98%,且相比于矩量法獲得接近100倍的計算加速比。文獻[26]研究了三維介質散射問題,參考迭代思想設計了級聯網絡來學習電通密度,不同于簡單的黑盒網絡僅輸入入射場以及介電常數,該網絡再引入電場的Born級數展開1階項作為輸入,改善了預測散射場相對誤差,并且對比數值方法實現了計算效率接近80倍的提升。

圖2 部分數據驅動正向電磁計算研究成果Fig.2 Several research results of data-driven forward electromagnetic computing
結果學習策略直觀、高效,但問題同樣非常明顯:由于缺乏物理規律指導,結果學習策略的求解精度和泛化能力往往不盡如人意。近年來,以傳統方法為主體,以智能手段加速中間環節的過程學習策略同樣受到了關注。例如,一些早期研究試圖將智能模塊整合進FDTD計算過程。文獻[27,28]提出了“智能吸收邊界”方案,分別采用RNN以及長短期記憶神經網絡(Long Short Term Memory,LSTM)代替理想匹配層吸收邊界條件(Perfectly Matched Layer,PML),能夠在單層智能邊界的條件下達到多層PML的吸收效果,其中RNN方案更快,能夠實現約2倍的計算提速,但吸收效果不及LSTM方案。文獻[29]注意到了波動方程迭代差分格式與RNN在結構上的相似性,重新設計了RNN模型,實現了時域標量波函數模擬。文獻[30]引入了深度可微森林模型(Deep differentiable Forest,DFF)來取代傳統的多層PML,減少了計算區域的大小和復雜度,并保持了良好的精度。除FDTD之外,更多的電磁算法也被納入了智能化研究范疇。文獻[31]提出使用人工神經網絡替代轉移函數,從而加速多層快速多極子計算過程。文獻[32]將智能技術引入格林函數方法,利用人工神經網絡模擬復雜區域內的格林函數,相較于數值格林函數方法,同時降低了運算內存和時間開銷,在基本保證求解精度的前提下計算效率提升接近2倍。針對矩量法,文獻[33,34]基于共軛梯度方法(Conjugate Gradient,CG)思想,設計了一種基于級聯神經網絡的線性方程組求解器(如圖2(c)所示),可在輸入散射體的相對介電常數分布和入射場信息后快速計算獲得總場。然而這種方案加速效果較為有限,實驗觀測到相較于CG方法僅能夠在3~4 GHz頻點處獲取大約1.2倍的計算效率提升。文獻[35]在此基礎上進行了擴展,基于復數批量歸一化技術,改進了基于CG方法和廣義最小殘差方法的等效級聯神經網絡,并且通過數值實驗證實了所提方案在計算效率上的改善。不難發現,過程學習方案相比結果學習雖然引入了更多物理信息,整體泛化能力得到了改善,但計算效率增益通常會大打折扣,很少能夠觀測到出現超過1個數量級的提升。如何進一步降低過程學習方案計算復雜度,也是需要在未來深入研究的問題。
近年來,數據驅動的正向電磁計算發展大致呈現出以下趨勢:模型逼近能力持續增強,問題求解規模不斷增長,物理機制關聯度日漸緊密,求解器結構更加自由,求解結果更加穩定可靠等。雖然發展現狀仍有不足,但數據驅動方法在加速仿真過程方面仍然表現出了相當的潛力與價值。
物理驅動的正向電磁計算是一種近年來同樣備受關注的計算范式。這類方法將物理方程以及邊界條件用作神經網絡的損失函數,通過無監督或部分有監督的方式完成網絡訓練。相較于數據驅動方法,如圖3(a)所示,以物理驅動的深度神經網絡(Physics-Informed Neural Network,PINN)[36]為代表,該方法在提升網絡逼近能力的同時減少了數據依賴,特別適用于解決小樣本學習問題。受到PINN啟發,近年來物理驅動電磁計算獲得了快速的發展。文獻[37]在U-Net架構基礎上引入頻域電場方程作為損失函數,提出了求解自由空間散射光場的MaxwellNet,如圖3(b)所示,這一成果被應用于指導光學透鏡設計[38]。文獻[39]則基于PINN模型,提出了一種針對多層涂敷腔體的無網格電磁場分析算法,分析了腔體結構以及涂敷材料對耦合阻抗的影響。文獻[40]同樣基于U-Net結構,通過結合數據以及物理驅動方法,提出了WaveY-Net,可以實現對一維周期結構電磁特性的精準快速仿真,相比串行FDFD算法在計算效率上提升了近700倍。

圖3 部分物理驅動以及算子學習正向計算研究成果Fig.3 Several research results of PINN based and operator-learning based forward computing
然而,針對物理驅動方法的研究仍然處于早期階段。盡管表現出巨大潛力,與數據驅動方法類似,這種方法仍然存在許多未解決的問題,例如神經網絡受到參數、邊界條件限制,導致泛化能力同樣不足,無法求解未知的微分方程等。
算子學習[41-43]是近年來智能微分方程研究領域的重大理論與方法突破。無論數據驅動還是物理或方程驅動方法,都沒有很好地解決泛化性問題,無法實現對一類微分方程的求解。算子學習方法立足于算子通用逼近原理[41],通過設計神經網絡學習微分算子,找到方程的一般性解,從而解除參數、邊界條件等因素的束縛。算子學習本質上仍然屬于數據驅動方法,但網絡結構設計與簡單數據驅動方法已出現明顯的不同。2021年,由麻省理工學院、布朗大學等機構學者[41]聯合提出了最早的神經算子模型--DeepONet,用于解決一類微分算子的學習難題?;谒阕油ㄓ帽平硭枷?,該模型包含“分支”以及“主干”兩種全連接神經網絡,分別用于抽取源函數以及位置坐標有效信息(中間輸出向量),并最終通過點乘操作獲取解在期望位置解的取值[41]。如圖3(c)所示的另一種神經算子模型--神經傅里葉算子(Fourier Neural Operator,FNO)[44]是算子學習領域的最新研究成果。不同于DeepONet,FNO的級聯結構設計思想來源于格林函數法,其物理含義更加簡明直觀(雖然FNO目前并沒有展現出在計算效率和泛化能力方面對DeepONet的絕對優勢,不過二者都被視為極具潛力的神經算子模型)。基于快速傅里葉變換操作,FNO保證了對全局信息的學習,并且變卷積為乘法,極大地降低了方程求解計算量[44]。FNO在解決流體問題上的成功也帶給了電磁計算啟發。文獻[45]提出用于求解頻域自由空間散射問題的改進FNO,相較簡單的U-Net等效求解器,不論是計算精度,還是訓練以及推理速度都出現了顯著提升。文獻[46]提出求解頻域Maxwell方程組的擴展FNO,相較于FDFD獲得了超過100倍的加速比。
由于設計思想的特殊性,算子學習方法在效率、精度以及泛化能力方面獲得了較大提升,展現出了巨大發展潛力與應用價值,目前已被成功應用于地球大氣活動預測[47],同時也給計算機視覺[48]等其他領域研究帶來重要啟發。未來,算子學習方法的進一步發展也將帶給智能電磁計算更多可能。
受到可微分渲染技術[49]的影響,可微分正向電磁計算最近也開始受到關注。所謂“可微分”,就是能夠求出正向仿真過程的導數(廣義上的可微分技術包括神經網絡等效求解器,這里主要指非神經網絡求解技術)。未來,可微分正向電磁計算有兩個可能的應用方向:首先,可以將可微分過程本身看作優化器,借助梯度下降等方法求解逆向問題;其次,可以將可微分過程嵌入神經網絡,設計更加復雜的功能。近年來,學術界在可微分正向電磁計算上進行了初步的探索。例如,文獻[50,51]就指出,可以在一些成熟的深度學習平臺(pytorch,tensorflow等)上直接移植FDTD算法,如圖4(a)所示。一方面,FDTD算法本身可微分,能夠直接嵌入不同功能的可微分系統;另一方面,可以借助現有深度學習平臺對于并行計算的支持,加速正向仿真過程。針對不可微分算法(如高頻方法)的研究也有所突破。如圖4(b)所示,文獻[52]類比可微分渲染技術[53,54],提出了一套可微分合成孔徑雷達(Synthetic Aperture Radar,SAR)渲染系統,將渲染過程中的光柵化、判斷面元是否可見的深度緩存等離散化操作通過概率近似映射為二維圖像和三維場景要素之間的連續函數,實現了正向渲染管線(pipeline)的連續性,從而能夠利用梯度下降算法從目標二維圖像中推斷出三維信息。

圖4 部分可微分正向電磁計算研究成果示意Fig.4 Several research results of differentiable forward electromagnetic computing
目前,可微分正向電磁計算還處于發展的早期階段,這一領域還存在著大量問題等待解決。特別地,相比于全波方法,傳統高頻方法由于本身具有不連續特性,更難實現可微分化。此外,可微分化必將提升高頻算法計算、存儲復雜度,算法效率也是一大難題。當然,挑戰的存在也預示著機遇,可微分正向電磁計算仍舊具備巨大的研究價值。
本節主要就近年來正向智能電磁計算領域所取得的代表性研究成果進行梳理總結,包含4個重要組成部分,即數據驅動正向電磁計算、物理驅動正向電磁計算、基于算子學習的正向電磁計算,以及可微分正向電磁計算。這4類方法各具特色,具有不同的適用場景,彼此之間能夠互為補充。表1展示了4種正向電磁計算方法的特點。其中基于結果學習的數據方法技術成熟度很高,計算復雜度一般較低,但獲取較好泛化能力依賴大量訓練數據?;谶^程學習的數據方法近年來受到廣泛的研究,技術成熟度較高,由于沒有全面剔除數值計算環節,計算效率提升不及結果學習方案,但泛化能力獲得了很大提升。相較數據驅動方法,物理驅動方法應用成熟度稍差,而方程本身作為損失函數也導致計算復雜度有所提高,但降低了對訓練數據的依賴程度,特別適合小樣本學習問題。算子學習方法研究仍處于起步階段,應用成熟度較低,由于同樣屬于數據驅動方法,仍然需要一定量的數據參與網絡訓練,但泛化能力大幅提升,計算復雜度較低。可微分正向電磁計算突出強調可微分能力,應用成熟度適中,由于其主要目的是將傳統計算電磁方法可微分化,對應求解器結構變化不大,計算復雜度一般與傳統方法趨同,泛化能力最強,幾乎不需要訓練數據。

表1 4種智能電磁計算方法特性對比Tab.1 Comparison of characteristics of four intelligent electromagnetic calculation methods
電磁逆散射成像可將接收天線接收到的目標物體的電磁散射回波通過成像算法還原為物體的介電常數或電導率分布圖像,其作為一種非接觸式的可以窺見物體內部構造的技術,已經被廣泛應用于無損探傷[55,56]、地質勘探[57,58]、癌癥檢測[59,60]、安全檢查[61,62]等。逆散射成像過程本質上是一種從原始電磁數據到目標圖像的非線性映射,逆散射成像算法的目的就是尋找最佳的映射關系。但由于逆散射問題本身所固有的非線性和病態性,尋找合適的逆散射成像映射關系是一個非常具有挑戰性的問題,尤其是在高噪聲的環境中。在傳統算法中,這一映射關系一般通過構建電磁散射數學模型再結合優化算法來尋找,并發展出了許多經典的逆散射成像算法,例如對比源反演法(Contrast Source Inversion,CSI)[63,64]、擾動Born/Rytov迭代算法[65,66]和隨機方法[67]等。一般說來,帶有非線性激活函數的深度學習網絡能以任意精度逼近任意的可測量函數[8],因此得益于深度學習網絡這一強大的非線性映射學習能力,基于人工智能的電磁逆散射成像,本文稱之為逆向智能電磁成像,也獲得了越來越多研究者的關注[68]。逆向智能電磁成像的優勢在于,它可以從數據中學習映射規律,因此免去了復雜的電磁模型推理和構造的過程,也免去了優化算法中的迭代過程,極大提升了成像的效率。同時,針對特定的逆散射問題,深度學習網絡能夠學習出暗含幾何先驗信息的映射關系,可提升成像的精度,甚至實現突破成像分辨率極限的超分辨成像。當然,逆向智能電磁成像的劣勢也比較明顯,主要表現在兩點:一是嚴重依賴訓練數據,訓練數據的數量和質量直接決定了成像的效果;二是缺乏可解釋性和泛化能力,難以擴展到和訓練數據差異性較大的成像場景。針對這兩個問題,有很多研究者開始將電磁物理機理引入深度學習網絡結構的設計中,通過引入電磁學先驗知識,減少逆向智能電磁成像對數據的依賴,同時提升泛化能力。本節也將分為純數據驅動和電磁物理驅動這兩部分來介紹逆向智能電磁成像的相關進展。
逆散射成像的結果圖和我們所認知的傳統圖像有所不同,由于逆散射圖像表征的是目標物體的介電常數分布或電導率分布,而這些參數往往是以復數形式表示的,因此逆散射圖像一般也是一個二維復數矩陣,可以將其看成是由復數的實部部分和虛部部分分別組成的兩張圖片,對應到深度學習網絡中就是一張雙通道圖像。早期的逆向智能電磁成像以純數據驅動的深度學習網絡為基礎,利用提前制作的大量成對樣本,學習從原始電磁數據或低分辨成像結果到高精度成像圖案的映射關系。文獻[69]自述其為第1個使用深度學習技術從多重散射(多發多收天線)測量結果中重建目標圖像的論文,文章構建了一個U-Net深度學習網絡結構[70]學習從反向傳播算法(Back Propagation,BP)生成的初步圖像到目標完整清晰圖像的映射,取得了優于傳統成像算法的成像精度和效率,如圖5(a)所示。文獻[71]同樣使用U-Net網絡,進一步學習并訓練了3種成像映射關系,這3種映射的輸出都是目標圖像,輸入分別為原始散射電場回波測量數據、由BP算法生成的初步圖像和由主成分分析法獲得的感應電流數據。在文中作者分別稱這3種映射關系為直接反演模式、反向傳播模式和主成分電流模式。經過測試,反向傳播模式和主成分電流模式均能夠生成較為理想的目標圖像,但直接反演模式的成像效果不佳,如圖5(b)所示。相比于包含相位信息的散射場測量數據,使用只有電場幅度信息的測量數據(無相數據)來進行逆散射成像是一個更加具有難度的問題,這是由于相位信息的缺失增加了逆散射映射的非線性和病態性。在文獻[71]的基礎上,文獻[72]討論了使用無相數據來訓練基于U-Net的逆散射成像網絡,并構建了3種成像映射模式,其中第1種模式直接使用測量的散射電場幅度值作為U-Net的輸入,后兩種模式首先使用無相反演算法在一個小信號子空間內獲得初步的圖像,然后將此圖像作為UNet的輸入。實驗結果表明,后兩種模型均能夠取得優于傳統算法的成像效果且具有一定的泛化能力和抗干擾能力。文獻[73]提出了一種“兩步走”的逆向智能電磁成像方法:第1步,利用一種復數值U-Net網絡結構實現散射電場的頻率外推,可以從單頻點的散射電場“圖像”(二維復數矩陣形式表示的通過單發多收方式收集到的散射電場值)預測多頻點的散射電場“圖像”集合。第2步,將第1步中預測獲得的多頻點散射電場“圖像”集合輸入構建好的復數CNN網絡,最終實現非均勻、高對比度散射體的高精度實時成像。作者認為,第1步中散射電場頻率外推的實現使得僅需輸入單頻點的散射數據即可進行逆向智能電磁成像,減少了輸入數據的大小,簡化了數據測量和采集操作,因此在簡便性和實用性方面優于需要采集多頻點數據的方法。

圖5 基于U-Net結構的逆向智能電磁成像Fig.5 Reverse intelligent electromagnetic imaging based on U-Net
U-Net是一種常被用來學習從圖片到圖片映射關系的網絡結構,其所構建的從輸入特征到輸出特征的“信息高速公路”更善于處理輸入和輸出特征相似度較高的場景。而在直接反演模式中,輸入和輸出數據的特征差異性過大,導致U-Net難以學習到它們之間的正確映射關系,從而影響了最終的成像效果。文獻[71]的研究團隊在進一步的工作中[74],為了緩解深度學習逆散射問題的非線性并使得深度學習網絡能夠更加容易地學習出所需的映射關系,使用了改進的對比介電常數[75]圖像作為成像映射的輸入,最終在強散射問題中也取得了理想的成像效果,并且可以擴展到簡單的三維成像場景[74]。
除了U-Net結構,在計算機視覺領域被廣泛用于進行圖像生成任務的對抗生成網絡結構(Generative Adversarial Network,GAN)也被用來實現逆向智能電磁成像任務,GAN中生成器和鑒別器的對抗性訓練能夠在重建的圖像中引入更多的幾何特征約束。文獻[76]借鑒了一種經典的條件GAN結構Pix2Pix[77]構建了從BP算法生成的初步圖像到目標圖像的智能成像網絡。與傳統Pix2Pix網絡不同的是,作者所構建的Pix2Pix網絡的生成器部分是基于復數矩陣相乘操作實現的復數網絡。由于主流的深度學習平臺并不支持直接的復數乘法,作者將一個復數矩陣拆分成實部和虛部兩個通道,并在實數域構建等效的復數乘法操作,最終實現了等效的復值Pix2Pix網絡結構[76],如圖6(a)所示。文獻[78]將注意力機制引入Pix2Pix的生成器部分,可在背景中突出目標散射體的特征;同時將BP方法重建的未知散射體的零階t矩陣系數圖像作為Pix2Pix的輸入,首次實現了介質和PEC同時存在的混合場景的逆向智能電磁成像,如圖6(b)所示。需要明確的是,U-Net和Pix2Pix并不是互斥的,Pix2Pix中的生成器部分同樣可以采用U-Net結構,實現從電磁散射數據輸入到目標圖像輸出之間的映射,此時Pix2Pix的作用是將GAN的對抗生成誤差引入了U-Net,可以使得U-Net輸出的圖像具有更加明晰的幾何特征。

圖6 基于Pix2Pix結構的逆向智能電磁成像Fig.6 Reverse intelligent electromagnetic imaging based on Pix2Pix
由于逆散射問題的輸入和輸出之間具有復雜的非線性映射關系,因此基于傳統的深度學習網絡的純數據驅動學習往往對訓練數據的質量和數量具有很高的要求。為了應對此問題,和物理驅動的正向電磁計算類似,科研人員想到了將電磁物理機理或方程引入逆散射深度學習網絡的結構設計和誤差函數設計中,為逆散射問題定制專用的深度學習模型,能夠更容易地學習到輸入和輸出之間的非線性關系。同時,從信息量的角度,電磁物理驅動的深度學習網絡不但可以從訓練數據中學習所需信息,還可以從人類總結出的、以數學公式為表達形式的物理規律中學習,因此能夠在一定程度上降低對訓練數據數量的要求。
上述兩種物理驅動的深度學習網絡結構雖然都借鑒了迭代優化算法,但是它們訓練完成后從輸入到輸出都是一個端到端的直接映射,不存在迭代過程。其實逆散射成像深度學習網絡也可設計成迭代的形式,這么做的好處是整個成像過程可以具有更高的可控性和可解釋性,表現出更好的抗噪聲特性;代價就是會犧牲一定的計算效率。文獻[81]展示了一個基于有監督下降方法(Supervised Descent Method,SDM)的逆散射成像反演算法,它是一種迭代的機器學習方法,將反演過程分為離線訓練和在線預測兩個階段。在離線訓練過程中,它在每次迭代中學習一個用來更新模型的參數下降方向;在在線預測階段,之前學習到的參數下降方向被用來指導反演過程中模型參數的更新方向(下降方向和數據殘差的乘積),并通過實測數據證明了該方法的通用性和可靠性。在文獻[81]的基礎上,研究人員將深度學習技術引入逆散射成像的迭代優化反演過程中,形成了迭代的逆散射成像深度學習框架,并將其分成兩個順序執行的階段:離線訓練和在線優化學習。文獻[82]展示了一個非常經典的案例,在離線訓練階段,作者設計并訓練了一個前向求解器神經網絡(FWD Solver)來代替數值正向求解器[34](從目標圖像預測對應的散射電場);隨后作者設計了一個子網絡(Sub-network)用來代替逆散射反演求解器(從散射電場數據恢復目標圖像),并將前向求解器神經網絡和子網絡交替級聯,組成最終的迭代的深度學習網絡結構,稱之為ISP求解器(Inverse Scattering Problem,ISP)[82],如圖8(a)所示。在在線優化學習階段,作者使用預先制作的成對訓練數據樣本集來訓練ISP求解器(其中FWD Solver的網絡參數保持不變),具體做法為將實測的散射電場數據和當前FWD Solver預測的散射電場數據之間的殘差輸入到子網絡中,并讓子網絡學習當前的圖像和真實圖像之間的殘差,以此逐漸逼近真實的目標圖像。
上述的所有逆向智能電磁成像模型雖然都實現了比傳統逆散射成像算法更好的成像效果,但是都離不開提前制作大量的包含散射電場數據和對應的目標圖像的成對訓練樣本,也就是說它們都是基于監督的深度學習模型。眾所周知,訓練數據集的收集和制作過程是非常耗時的,是否可以設計一種非監督的逆向智能電磁成像模型,它無需制作成對的訓練樣本,而且和傳統逆散射成像算法一樣僅獲得當前目標的散射電場數據就能完成成像任務,同時又可以充分利用深度學習網絡的擬合優勢實現比傳統算法更好的成像效果?對于此問題,文獻[83]進行了初步嘗試并構建了首個非監督的逆向智能電磁成像架構CSI-GAN,如圖8(b)所示,在無需成對訓練數據的情況下實現了優于傳統算法的成像效果。CSI-GAN的設計靈感來源于乘性對比源反演算法MSCI[64],MSCI的誤差函數分為兩部分,其中一部分源于預測的散射電場數據和實測數據的差值,另一部分來源于一個表征成像圖案平整度的幾何特征約束函數,可以使得最終生成的圖案具有更清晰的邊緣和平坦的內部結構,同時抑制背景區域的噪聲。但是實測結果表明,當散射體幾何結構較復雜或相對介電常數較高時,MSCI中的幾何特征約束函數不足以使最終的成像結果表現出清晰的目標特征,整個算法仍舊會陷入一個效果非常差的局部最優解。為了在成像算法中引入更強的幾何結構約束,CSI-GAN將完整的對比源反演算法(CSI)[63]和循環對抗生成網絡(Cycle-GAN)[84]相結合,其中CSI算法引入基于物理方程的優化過程,Cycle-GAN引入基于目標幾何先驗知識的強幾何結構約束來對CSI迭代過程中的成像結果進行修正。和迭代的逆散射成像深度學習框架一樣,CSI-GAN的實現也分為離線訓練和在線優化學習兩個階段。在離線訓練階段,將Cycle-GAN預訓練為一個圖像去噪器;在在線優化學習階段,Cycle-GAN中的判別器會接收預先收集的圖像(例如手寫體數字圖像),學習如何判別這些“合法”圖像的特征;生成器會接收來自CSI算法的中間成像結果,在來自物理方程和來自判別器的兩個誤差函數的同時作用下更新自身網絡參數,不斷輸出修正后的成像圖案,幫助CSI算法脫離病態局部最優解,最終收斂到理想的成像結果。需要說明的是,整個Cycle-GAN的訓練過程都不需要收集訓練圖像所對應的散射電場數據,因此節省了大量的數據集制作的時間,尤其適用于散射電場數據較難獲得的場景。但是由于CSI-GAN中集成了完整的CSI算法迭代過程,且需要在迭代過程中現場訓練GAN的參數,因此和ISP求解器[82]相比需要耗費更多的計算時間和資源開銷。
可以看到,深度學習已經在解決電磁逆散射問題方面顯示出巨大的潛力。然而,深度學習成像結果中缺乏不確定性量化和可靠性評估仍然是一個尚未解決的挑戰。文獻[85]提出了一個條件正則化和生成流(conditional Renormalization and Generation-Flow,cRG-Flow)網絡,并開發了一種新的概率深度學習策略來量化逆向智能電磁成像方法解中的不確定性。與現有的智能逆散射方法相比,所提出的策略具有兩個重要優勢:首先,由于cRG-Flow的可逆性質,在網絡中可以同時考慮前向電磁散射計算及其逆過程,因此可以容易地對成像結果施加物理約束。其次,cRG-Flow是專為成像任務開發的模型,和傳統的深度學習網絡相比,具有更強的可解釋性。
目前逆向智能電磁成像往往局限于二維場景或者簡單的三維場景,文獻[86]提出了一種基于點云的無網格三維逆散射深度學習成像架構,可以處理具有復雜幾何形狀的三維介質體的逆散射成像問題,如圖9所示。這個工作具有3個鮮明的特點:第一,這是一種基于點云的無網格方法,與基于網格的反演方法相比,所提出的方法只需要在成像空間中隨機采樣少量的點云作為輸入,因此深度學習網絡中可訓練參數的數量幾乎與用于二維逆散射問題的網絡的參數數量相當。第二,其使用流模型構建了一個雙向可逆的網絡結構,可同時實現逆散射成像映射過程(逆向成像)和散射場的正向預測過程,其中逆向成像過程輸入隨機分布的點云和散射電場數據,得到目標介質點云分布;正向預測過程輸入目標介質點云和高斯隨機噪聲數據,得到散射電場的預測值。第三,用于反演的輸入點云的數量和位置都是可以隨意指定的,即使在輸入點很少的情況下也能夠很好地恢復散射體的形狀,且能夠單獨對三維散射體的不同部分進行重建。

圖9 基于點云的無網格三維逆向智能電磁成像模型[86]Fig.9 A mesh-free 3-D deep learning electromagnetic inversion method based on point clouds[86]
電磁超材料使用周期或準周期排列的半波長尺度的宏觀基本單元來模擬傳統材料學中微觀尺度的原子或者分子。這些宏觀基本單元通過諧振系統與外加電磁場相互作用,使得電磁超材料表現出傳統材料所不具備的獨特電磁特性[87-91]。然而早期的電磁超材料主要在模擬域對材料屬性進行設計,加工完成后功能特性就固定了,無法進行更改,極大限制了應用范圍和靈活度。2014年,Cui等人[92]提出了編碼超材料、數字超材料和可編程超材料的概念,通過將超材料中的宏觀基本單元的兩個相反的相位響應分別編碼為數字0和1,每個單元的反射或者透射的相位狀態可以通過現場可編程門陣列(Field Programmable Gate Array,FPGA)實時切換,由此實現了將超材料的宏觀特性設計從模擬域轉移到數字域,構建起了電磁世界和信息世界的橋梁,并進一步發展出信息超材料新體制[93-96]。信息超材料(超表面)的出現在降低電磁超材料的用戶端使用難度的同時極大提升了對電磁波調控的靈活性,同時使得人工智能技術可以很方便地應用于信息超材料的編碼設計、微波智能計算和感知成像,本節也將順序介紹相關的研究成果。
信息超材料的智能設計可分為單元結構設計和陣列編碼設計。由于單元結構的智能設計在我們以往的綜述文章中多有描述[9,97],此文不再贅述,而將敘述重點放在信息超材料的智能編碼設計上。文獻[98]實現了一個可以實時從所需的單波束或雙波束輻射方向圖獲得對應的超表面編碼的深度學習網絡,采用純數據驅動的方式進行訓練,如圖10(a)所示。對于輻射方向圖的輸入,不是直接輸入精確的方向圖信息,而是將一副方向圖分為3張圖片進行輸入,分別代表方向圖的上邊界、下邊界和定向性信息。對于深度學習網絡的輸出,分別使用BP方法和遺傳優化算法獲得了單波束或雙波束方向圖對應的48×48大小的二進制超表面編碼矩陣作為輸出。經過訓練,網絡所預測的超表面編碼矩陣和測試集中的正確編碼矩陣的元素吻合度超過94%,實測結果也驗證了所預測編碼的有效性。文獻[99]提出了一個基于離散偶極子近似算法所構建的物理驅動的深度學習網絡結構,充分考慮了不同編碼下單元之間的耦合效應,可以在有限訓練數據的情況下實現從超表面編碼到對應的方向圖的準確預測,且具有輕量化的優勢,如圖10(b)所示。隨后作者使用此網絡快速生成了大量的包含超表面編碼和對應方向圖的成對的樣本,這些樣本被用來訓練另一個從方向圖到對應超表面編碼的逆向設計網絡,如圖10(c)所示。編碼的預測吻合度超過了98.4%,并通過實測驗證了整個流程的有效性。

圖10 基于信息超材料的智能方向圖設計Fig.10 Intelligent design of radiation patterns based on information metamaterial
上述的智能編碼設計工作都是基于成對訓練數據的監督學習,好處是可以使用全波仿真數據或實測數據來進行訓練,具有較高的準確性,但對訓練數據的質量和數量具有較高的要求。在有些應用場景中,從超表面編碼到對應的電磁響應特性的計算過程可由近似的解析公式來描述,以此可構建非監督的深度學習網絡,實現智能的編碼設計。文獻[100]報道了一種非監督的用于全息圖實時設計的深度學習架構,并使用編碼超表面進行了實測,展示出了和傳統的GS算法相比在指標和視覺感受上更好的成像效果。作者通過引入全息成像的物理機理來給神經網絡提供先驗信息,構造了一個輸入等于輸出的自編碼器結構。具體做法:首先,構建一個深度神經網絡(Deep Neural Networks,DNN),此神經網絡的輸入為目標像,輸出為超材料編碼。然后,使用格林函數推導出從超材料編碼到目標像的前向傳播過程。最后,將DNN和這一前向傳播過程對接,形成一個輸入和輸出都是目標像的自編碼器結構,如圖11(a)所示。訓練這一自編碼器的目標函數就是輸入和輸出的均方誤差,訓練目標就是讓輸出盡量等于輸入,這樣訓練完成后取DNN的輸出就是所需的超材料編碼。作者在實際訓練時發現,均方誤差并不能完全反映所成的像在人類視覺感官上的相似度,因此在誤差函數中還引入了對抗生成網絡(GAN)的判別誤差,使得所成的全息像的視覺語義特征更加明晰。訓練時的目標圖像取自手寫體數字數據集,理論上任意公開的圖像數據集都可以用來構建訓練數據集,節省了大量的訓練集制作成本。訓練完成后從輸入一個目標像到得到所需的編碼僅需幾十毫秒,實現了實時的全息成像[100]。文獻[101]在文獻[100]的基礎上,將從編碼到全息圖像的前向公式替換成了從時空超表面的時序編碼到對應諧波輻射圖的前向公式,構建出了用于時空編碼超表面實時編碼設計的非監督深度學習網絡結構,如圖11(b)所示,并通過仿真驗證了所提方法的有效性。

圖11 基于信息超材料的非監督智能設計Fig.11 Unsupervised intelligent design based on information metamaterial
基于信息超材料的智能設計還可被嵌入到更大的系統級工作中,實現更加復雜的功能。文獻[102]展示了一種基于編碼超表面的自適應微波隱身斗篷,內置了訓練好的深度學習神經網絡,可以根據接收到的入射電場信息實時設計電磁隱身所需的超表面編碼,如圖12(a)所示。實驗結果表明,受此神經網絡控制的編碼超表面可以在毫秒內對不斷變化的入射波做出反應,表現出非常理想的隱身性能。這項工作很好地展示了智能編碼設計的優勢。為了實現快速的電磁隱身,編碼超表面需要對入射波具有極快的響應速度,生成合適的反射波形以抵消入射波的影響來隱藏內部物體。這就要求超表面對所需的電磁響應具有實時的編碼設計能力,這種情況下傳統的基于迭代優化算法的編碼設計方法就完全無法勝任了,只能采用非迭代的智能設計方法。
在明確了對輕罪與重罪的劃分應當堅持“形式標準說”之后,還需要進一步解決,在這一標準內部,到底是堅持“法定刑標準說”,還是“宣告刑標準說”?對此,筆者認為,堅持“法定刑標準說”是具有更大合理性的。
文獻[103]展示了一種模塊化的智能編碼設計方案,可以基于自由組合出的折紙狀的超表面陣列實現快速的方向圖編碼設計,如圖12(b)所示。作者設計了兩種具有不同功能的深度學習網絡,分別稱為組裝網絡(Assembled Neural)和知識繼承網絡(Inherited Neural Network,INN)。其中負責將整個超表面陣列總的全局電磁響應分解為每個子模塊超表面所需表現出的局部電磁響應,知識繼承網絡則根據組裝網絡生成的每個子模塊所需的電磁響應設計出對應的超表面編碼,最終實現了復雜方向圖模式下的可折疊超表面的快速編碼設計。
目前,人工智能的實現主要依賴兩種技術,一是基于計算機的機器學習算法(例如深度學習和強化學習),二是專用集成電路和特制的光計算芯片[104]。一個典型的人工神經網絡(Artificial Neural Network,ANN)的實現,一般使用層級連接的人工神經元來模擬人腦神經元之間的連接和行為。通過大量數據的訓練,ANN已能完成眾多的智能任務,且在人臉識別、自動駕駛、語音處理和醫療診斷等方面獲得了大量應用。除了基于計算機和芯片實現的ANN網絡,全光實現的ANN最近也被多個團隊所提出[105,106]。這些光學衍射神經網絡利用光的矢量疊加性和空間自由傳播特性可實現并行的矩陣運算操作,以此來模擬人工神經元之間的交互和連接。同時,使用光學透鏡或反射介質模擬人工神經元對信號的調制作用,最終構造出具有光速并行計算和低功耗特性的ANN硬件。
目前,雖然光學衍射神經網絡得以實現,但大都具有功能固化、不可調節、不支持參數修改、使用成本高等缺點,嚴重制約了其功能擴展。在未來的實際應用中,為了提高集成度和通用性,衍射神經網絡必然會朝著多功能集成和可編程方向發展,因此可編程的衍射神經網絡逐漸成為該領域的研究熱點。近年來,可編程信息超表面的興起[92]為實現可編程的衍射神經網絡提供了良好契機。文獻[107]率先使用多層透射式數字編碼超表面實現了現場可編程的微波驅動的衍射神經網絡硬件,稱之為可編程人工智能機(Programmable Artificial Intelligence Machine,PAIM),如圖13所示。作者使用5層透射式的可編程超表面陣列來層級調控電磁波的空間傳播和交互特性,其中每層超表面陣列都有8×8個單元,每個單元都可以看成ANN中的一個神經元節點,整個PAIM可看成是一個ANN的物理實現。每個超表面單元能在-22 dB到13 dB的范圍內調控透射電磁波的幅度,同時改變和幅度耦合的相位。當入射電磁波照射到一個可編碼超表面單元時,電磁波的幅度和相位會被該超表面單元調控,調控的系數由FPGA預先加載到單元上,如圖13(c)所示。這個被調控后的電磁波在穿過此單元后,會變為一個新的電磁波輻射源向各個方向輻射電磁波。這樣,第1層超表面的每個單元都會向第2層超表面輻射電磁波并進行矢量疊加,如圖13(b)所示。疊加后的電磁波就作為第2層每個超表面單元的入射電磁波,經過調制后繼續以同樣的方式向第3層超表面傳播,最終傳輸至第5層超表面。最后將第5層超表面的輸出作為整個PAIM最終的輸出。作者基于所構建的實測系統演示了PAIM的多種應用案例,包括圖像識別、強化學習和通信中多路用戶的同時編解碼,充分展示了PAIM的靈活性和處理智能任務的能力。

圖13 可編程人工智能機的工作原理示意圖[107]Fig.13 The Working Principle of Programmable Artificial Intelligence Machine (PIAM)[107]
文獻[107]雖然實現了可編程的衍射神經網絡,但并未實現對電磁波的非線性激活,而非線性激活函數對于復雜問題的處理是至關重要的。然而,對于光學神經網絡而言,由于結構材料的限制,可編程性能受限。另外,對于衍射深度神經網絡來說,雖可利用FPGA任意調節人工神經元的權重系數,但是難以引入非線性激活函數。近年來,人工表面等離激元的發展[108]為實現新的波空間非線性人工神經網絡提供了良好契機。文獻[107]的研究團隊在PAIM的研究基礎上,率先使用可編程人工表面等離激元功分器和耦合器實現了現場可編程的微波驅動的表面等離激元神經網絡硬件,稱之為可編程表面等離激元神經網絡(Surface Plasmonic Neural Network,SPNN)[109]。研究團隊利用人工表面等離激元(Spoof Surface Plasmon Polariton,SSPP)系統中的功分器和耦合器作為可編程的人工神經元,稱之為SSPP單元,如圖14(a)所示,并利用SSPP對電磁波的無損傳導特性來實現人工神經元之間的連接和信號傳輸??删幊痰姆蔷€性激活函數則利用檢測端口和放大器偏置電路之間的閉環反饋系統來實現。整個SPNN系統由多個子模塊組合而成,每個子模塊包含4個輸入SSPP單元和4個輸出SSPP單元的交叉連接結構,形成一個全連接的可編程神經元子塊,如圖14(b)所示。最后,以多個可編程神經子塊進行局部連接排布,構建了最終的可編程表面等離激元神經網絡,如圖14(c)所示。SPNN的可編程特性保證了其能夠使用相同的平臺實現不同的任務,構建出通用的波空間智能信號感知處理平臺。為了驗證SPNN的電磁探測和處理上的應用,團隊設計并展示了基于SPNN的無線通信實時解碼案例,實現了圖像的無線傳輸;同時為了驗證SPNN在傳統的人工智能任務(例如圖像分類)上的性能,團隊使用SPNN構造了局部連接的人工神經網絡結構,成功實現了對10類手寫數字圖片的分類任務,識別正確率達到了90%以上,持平了全連接網絡的分類性能。

圖14 可編程表面等離激元神經網絡[109]Fig.14 Programmable Surface Plasmonic Neural Networks (SPNN)[109]
相比于以往的物理神經網絡研究,文獻[107]和文獻[109]展示的工作(PAIM和SPNN)共同具有3個鮮明的創新特征。一是開創性地將信息超材料(包含可編碼超表面和人工表面等離激元)用于波空間人工神經網絡的設計,實現了所有神經元的獨立可編程,具有高度的通用性;二是可直接處理自由空間中的電磁波,無需復雜的模數轉換模塊,是連接電磁空間和數字空間的智慧橋梁;三是它們不但具有傳統的圖像智能識別功能,還具有無線通信和智能探測等功能,兼具智能計算機、通信系統、雷達系統等。作為全新的電磁空間可編程智能計算平臺和無線通信、信號感知與處理機,PAIM和SPNN有望促進人工智能技術的進一步發展,同時在新一代智能計算、6G通信、智能家居、物聯網等領域取得應用。當然,當前PAIM和SPNN還處于原型機驗證階段,尚存在集成度低、體積和功耗較大等劣勢,后續可以通過制造和加工工藝改進提升可調控單元的數量和調控精度,同時降低整體功耗。
信息超材料和傳統電磁超材料的不同點在于,信息超材料集成了可編碼超材料和環境感知模塊,可引入大數據和人工智能技術,形成智能感知、自主學習和數據處理能力,在成像、通信、雷達等領域實現了諸多新穎的應用。對于智能電磁感知在2021年之前的進展,我們已經進行了系統總結和綜述[110],故本文不再贅述,僅介紹近兩年的最新研究成果。
文獻[111]展示了一個智能室內超表面機器人(I2MR)系統,它把對環境的感知和決策任務都集中到智能超表面來處理,以便讓系統中的室內機器人僅需執行接收到的指令,極大簡化了機器人對硬件的要求并提升了續航,如圖15(a)所示。I2MR系統主要由兩部分組成,第1個是“大腦”,它配備了一個用來感知環境的信息超表面和一個由人工智能驅動的數據處理器;第2個是它的“四肢”,比如小車或無人機,并內置Wi-Fi模塊來接收指令。I2MR對環境的感知包含對靜態場景的感知和對場景中移動的人體的感知,并根據環境的變化來決定“四肢”的行動。如果“大腦”認為當前狀態下“四肢”需要有所行動,它就會定位“四肢”的位置,并建立一個無線通信鏈路,以10 Hz的速率傳輸控制指令。因此,“四肢”無需再執行任何感知或決策任務,這意味“四肢”可以擁有更長的續航或者更大的載荷?;诖薎2MR系統,作者首先設計并單獨展示了人體點云成像、“四肢”精確定位、信道主動增強等功能,最后在一個機器人輔助的家庭醫療場景中對這些功能之間的互相配合進行了集中展示,如圖15(b)所示。當I2MR檢測到有用戶跌倒時,會給機器人小車發送指令指導其順序執行3個任務:首先,小車會移動到藥物所在位置并用機械臂抓取藥物,之后小車會移動到用戶所在位置將藥物遞給用戶,最后小車會回到初始位置待命。

圖15 基于信息超表面的智能室內機器人(I2MR)系統[111]Fig.15 Intelligent indoor metasurface robotics (I2MR)[111]
文獻[111]中的I2MR系統是基于單頻段(2.4 GHz附近)的電磁波來進行場景感知的。為了提升對場景的綜合感知能力,研究團隊在最新的一個工作中對使用的頻帶進行了擴展,聯合使用分別工作在S,C和X波段的3塊分布式信息超表面實現了多任務、多尺度的智能感知[112],并展示了人體三維姿態估計、手勢識別、生命體征檢測和人體行為檢測等多個新穎的應用案例,有望應用于物聯網和數字孿生等領域。除了單獨實現感知功能,信息超表面還能與其他傳感器配合,從而更加迅速地對環境變化做出反應。文獻[113]展示了一種基于計算機視覺的智能超表面跟蹤與通信系統,研究團隊采用深度相機,通過AI技術檢測不同環境中多個運動目標的位置,將選定目標的位置信息輸入預訓練好的人工神經網絡;隨后人工神經網絡在幾毫秒內輸出優化后的信息超表面編碼序列,通過FPGA發送給雙極化數字可編程超表面,實現針對選定目標的智能波束跟蹤和實時無線通信(如圖16所示);最后設計了兩個實時的視頻傳輸案例驗證了該系統具有與移動目標進行高速信息傳輸的能力。

圖16 基于計算機視覺的智能超表面跟蹤與通信系統的工作原理[113]Fig.16 The working principle of intelligent metasurface system for automatic tracking of moving targets and wireless communications based on computer vision[113]
人工智能的升級迭代為傳統計算電磁學研究注入了新活力。可以預見,智能方法將繼解析方法、近似方法、數值方法、快速方法之后,推動電磁領域的進一步發展。但是需要意識到的是,雖然智能電磁計算領域已經出現了許多頗具代表性的研究成果,其總體上仍舊處于科學探索的萌芽階段,仍需發掘出更多的新機理和新算法,提升智能電磁計算的魯棒性、可解釋性和泛化能力。其存在的技術難題總結起來大致可以分為以下幾類:
(1) 數據獲取問題。與其他智能技術相同,數據獲取是智能電磁計算需要解決的核心難題。一般而言,訓練神經網絡所需要的數據集來源于仿真、實測,以及開源數據集。仿真過程往往耗時較大,實測成本高昂且場景受限,進一步導致電磁領域的開源數據集極為有限。因此,如不能解決好數據獲取問題,智能電磁計算發展將會面臨嚴重的瓶頸。
(2) 求解效率與計算精度的兼顧難題。一般來說,結果學習策略加速效果顯著,但是由于缺乏物理機制的指導,計算精度往往不盡如人意,例如處理高介電常數、有耗介質等問題。過程學習策略仍然依賴經典算法框架,雖然計算精度有所改善,但效率增益通常不如前者顯著。與經典方法一樣,智能方法同樣需要一種更好的計算模式,盡可能多地實現效率與精度的兼顧。
(3) 計算維度問題。近年來,大量研究局限于二維電磁問題,而三維電磁問題少有提及。為了更高效處理三維問題,未來的計算框架應當能支持更多形式的幾何模型數據結構,如網格、體素或點云。不過隨著智能技術的發展,各類專門用于處理三維模型的定制化神經網絡也開始大量出現,這將給三維智能電磁計算帶來啟發。
(4) 電大尺寸問題。電大尺寸目標仿真計算一直以來都是困擾計算電磁的核心難題。目前大量有關智能計算的研究都集中在小規模計算上,電尺度十分有限。解決電大尺寸目標仿真問題,一方面需要融合更高效的模型表征數據結構,降低存儲和計算開銷,另一方面需要解決相位帶來的快變化數據學習難題。
(5) 寬帶仿真問題。目前還很少見到討論寬帶仿真的研究,寬帶化也是正向智能電磁計算需要解決的一個重要問題。
(6) 多物理計算難題。多物理計算問題涉及的范圍更廣,與電子器件、設備以及系統的設計應用聯系緊密,近年來受到工業、學術界廣泛關注。由于應力、溫度、電磁等物理量服從不同的約束關系,多物理計算的難點主要在于不同場量耦合關系的建模,這使得多物理智能計算在等效網絡設計上也變得更加復雜。
同時相關研究人員也需瞄準工業市場領域的實際業務需求,例如超表面單元和陣列的快速智能仿真、天線和微波電路的智能化設計、通信信道的智能化建模等,在提升智能電磁計算的技術成熟度和工程實用性方面投入更多的努力。最后,智能電磁計算不應拘泥于算法創新,還可探索軟硬件結合的智能電磁計算新體制,實現從電磁空間的電磁感知硬件系統到數字空間的電磁計算算法的全流程智能化,在健康監測、安防檢查、無線通信、芯片設計和新體制雷達等領域產生更多創新性成果和應用,例如可以使用信息超表面結合人工智能感知和調控算法,實現對通信信道的自適應資源分配和優化。