劉麗娟 陳宇 羅濤等



摘要:全連接神經網絡模型可以擬合復雜函數輸入輸出關系。文章基于深度學習神經網絡方法,利用COMSOL數值模擬計算得到的數據集對神經網絡進行訓練,訓練好的神經網絡能夠預測出響應未知的虹膜帶通濾波器的透射譜。利用深度學習來解決波導濾波器傳輸特性的計算,可以避開傳統的數理方法和麥克斯韋電磁方程的復雜求解,實現波導帶通濾波囂的快速預測。
關鍵詞:深度學習;波導濾波器;虹膜
中圖法分類號:TP183 文獻標識碼:A
1 引言
深度學習(Deep learning,DL)是當今人工智能領域一顆耀眼的明星。其中,名震天下的AlphaGo 圍棋程序以及智能聊天機器人CHartGPT 都是使用深度學習算法來實現,可以說現代機器學習徹底改變了計算機科學。
近年來,深度學習也成功應用于物理學,如粒子物理學[1] 、微納光學[2~4] 、化學物理學。在波與物質相互作用中,不同的微結構與波相互作用會產生不同的效果。波導結構設計(改變結構的尺寸、材料、形狀等性質)在實現對波的調控中起著重要作用。目前,設計方法主要有基于數值模擬方法的電磁建模,但對于某種特定功能的器件,往往要不斷微調幾何形狀并反復執行仿真來接近目標,計算資源和時間都消耗很大。本文基于深度學習思路,遵循數據驅動的建模思想,不引入人為規則和設定,而是通過學習大量的數據,得到波導傳輸特性與設計參數之間的對應規律。
2 波導濾波器簡介
波導濾波器是一種選頻電路,因其結構簡單、加工方便、損耗低,被廣泛應用在通信、雷達、自動測量設備等微波設備中。作為一種經常使用的無源微波濾波器,特別是在大功率、高頻段的天饋系統中有著不可動搖的地位。在波導中放置橫向電感膜片作為濾波電抗元件可以增加傳輸帶寬。如圖1 所示,該波導濾波器模型由1 個WR?90X 波段波導和對稱的感性膜片組成。通過設置合適的結構參數,可以顯示出良好的通帶響應和帶外抑制。
3 理論計算
3.1 基本原理
深度學習是機器學習的1 個子集,可以自動從圖像、視頻或文本等數據中學習表征,無需引入人類領域的知識。深度學習使用多層人工神經網絡,該網絡是由輸入和輸出之間節點的幾個“隱藏層”組成的網絡。如圖2 所示,從宏觀層面來看,人工神經網絡由輸入層(Input layer)、隱藏層(Hidden layer)、輸出層(Output layer)組成。輸入層是原料采購部,隱藏層是數據加工部,輸出層是數據成品部。隱藏層、輸出層由一個個圓圈組成,每一個圓圈就叫節點,也叫神經元或感知機。神經網絡模型每層都存在若干節點(神經元),然后通過1 個線性函數y(x)= W?x+b 連接,其中x 為上一層的矩陣輸出,作為本層的輸入,W 是權重矩陣,b 為偏差矩陣。通過多層的線性變換,把一個多維空間映射為另外一個多維空間。在f(x)= W?x+b 的基礎上對輸出結果再次進行處理,增加1 個非線性函數(激活函數),從而可以模擬出非線性函數。
將y(x)= W?x+b 進一步優化為y(x)= δ(W?x+b),其中δ 是激活函數。常見的激活函數有sigmoid,Tanh,ReLU 等。
深度學習網絡模型的訓練有2 道工序,分別為正向傳播(也叫前向傳播)和反向傳播。正向傳播是數據從輸入層傳遞到輸出層的過程,目標是得到預測值,再得到損失函數/ 代價函數。反向傳播是深度學習的靈魂,從損失函數/ 代價函數出發,求偏導數,計算出w,b 的值。一般而言,使用梯度下降算法來求解w,b 最小值。
3.2 整體思路
以波導濾波器的結構參數作為輸入數據(xi ),利用深度神經網絡得到預測的透射譜線值(yi ),與COMSOL 仿真計算出的譜線值比較,得到二者均方誤差值,然后用誤差計算梯度,之后根據梯度在反向傳播過程中更新權重。經過多輪訓練學習,最終找到合適的權重系數和閾值系數,從而建立濾波器性能參數和結構參數的內在規律。
3.3 數據采集
首先提取濾波器的結構特征,結構參數有波導寬度W,波導長度L,虹膜片1 的長度l_iris1,虹膜片2 的長度l_iris2,虹膜片間距spacing,虹膜厚度d。利用COMSOL 對光學濾波器進行模擬計算,在指定的值域范圍內等間隔掃描模型的結構參數,得到其透射系數,構成數據集。
3.4 模型架構與訓練
構造的神經網絡的拓撲結構為1 個輸入層、1 個輸出層以及3 層隱藏層,輸入層包含6 個神經元,中間的3 層隱藏層的神經元個數分別定義為600,100,50,得到1 個6?600?100?50?33 的全連接神經網絡結構。100 次迭代后損失函數穩定在0.04,如圖3 所示。
神經網絡訓練完成后,將未訓練的測試數據輸入神經網絡進行驗證。
4 結果分析
利用訓練好的神經網絡預測的波導透射譜線結果與COMSOL 結果的仿真結果進行對比驗證,如圖4 所示,預測的透射譜線線型與仿真的結果整體趨勢相似,但是存在一定的偏移量。偏差來源主要有2 點:(1)訓練的模型沒有進一步優化;(2)訓練數據的體量不夠。
5 結束語
利用深度學習神經網絡模型在一定誤差范圍可以預測波導濾波器的透射譜線,作為一種數據驅動的建模方法,其提升了波導虹膜濾波器傳輸響應的計算效率,節約了計算資源。
參考文獻:
[1] WIGLEY P B, EVERITT P J, BASTIAN J W, et al. Fastmachine?learning online optimization of ultra?cold?atomexperiments[J].Scientific reports,2016,6(1):25890.
[2] MALKIEL I, MREJEN M, NAGLER A, et al. Plasmonicnanostructure design and characterization via Deep Learning[J].Light: Science & Applications,2018,7(1):1?8.
[3] DAI P,WANG Y,HU Y,et al. Accurate inverse design ofFabry – Perot?cavity?based color filters far beyond sRGB viaabidirectional artificial neural network [ J ]. PhotonicsResearch,2021,9(5):22?33.
[4] 吳海蓮.基于深度學習原理的介質濾波器傳輸特性研究與設計[D].北京:北京郵電大學,2020.
作者簡介:劉麗娟( 2002—), 本科, 研究方向: 數據科學與大數據技術。