方波浪 王建國 馮國斌
(西北核技術研究所,西安 710024)
為了實現強噪聲干擾下的遠場光斑質心高精度計算,研究了一種基于物理信息神經網絡的質心定位方法—質心物理信息神經網絡(centroid-PINN),該方法利用U-Net 神經網絡優化質心計算誤差損失.為了驗證該方法,利用模擬產生不同強度的兩種類型噪聲(斜坡噪聲和白噪聲)干擾下的高斯光斑訓練網絡.通過兩種類型的光斑(高斯光斑和類Sinc 函數光斑)測試神經網絡,均得到了較高的質心定位精度.相比傳統質心定位計算方法,centroid-PINN 無需根據噪聲水平設置參數,特別是能夠處理斜坡噪聲的干擾,獲得高精度定位結果.成果可用于高性能激光光斑質心參數測量設備的研制,對于夏克-哈特曼波前測量裝置的研制也有一定的借鑒意義.
光斑質心計算在激光參數測量、自適應光學、光通信等領域具有重要的應用[1-4].例如,在激光遠場光斑測量中,需要根據遠場光斑分布獲得光斑質心,評價激光指向穩定性.同時,質心是計算光斑其他特征參數(環圍半徑、光斑尺寸等)的基礎;在自適應光學中,夏克-哈特曼技術是一種常用的波前測量技術.在該技術中,子孔徑光斑的質心高精度探測是關鍵的環節之一.
干擾對于光斑質心計算精度有顯著的影響[5-11].光斑質心采用重心法(center of gravity,CoG)計算,計算準確性受噪聲、背景照明、光斑調制、離散采樣、截斷誤差等因素影響.在遠場光斑測量中,廣泛存在多種類型的噪聲,并且有的噪聲隨信號產生,難以通過實驗手段完全消除.在ISO-11146 中,為了降低邊緣噪聲的影響,規定采用加窗質心計算方法.同時,針對不同類型的噪聲給出了相應的消除方法.常用的光斑質心計算方法還包括: 閾值法(threshold center of gravity,TCoG)、加權法(windowing center of gravity,WCoG)、迭代加權重心算法(iteratively windowing center of gravity,IWCoG)、強度加權算法(intensity weighted centroiding,IWC)、擬合法、模板濾波法(matched filter,MF)、相關法(correlation,Cor)等[8,12-18].還有許多預處理方法,如空間卷積波法、頻域濾波法、流式質心算法(stream center of gravity,SCoG)、高斯噪聲估計等[11,17,19],期望去除噪聲的影響.然而,這些方法大多需要根據待測目標進行參數調整,計算精度與所采用的參數相關,對于使用者的經驗要求較高.
人工神經網絡有望解決光斑質心高精度計算難題.近年來,人工智能得到了飛速發展,解決了許多難題,如圖像識別、語音識別、語義分析、翻譯、醫學診斷等,受到了廣泛關注,具有巨大的研究應用潛力[20].在質心計算/自適應光學中也取得了許多進展.例如,Montera等[21,22]利用全連接神經網絡,將光斑直接映射至質心,對于拉長畸變的光斑,獲得了較高的計算精度;Li等[23]給出了SHWFS-neural network (SHNN)網絡,將質心計算轉化為分類問題,在信噪比很低的情況下,獲得了準確度很高的結果.全連接神經網絡方法屬于回歸問題,訓練較難收斂.所以,采用了較小的神經網絡.而較小的網絡表達能力有限,因此對于不同朝向的變形光斑需要訓練不同的神經網絡.SHNN將質心計算轉變為分類問題,有效解決了極端噪聲的干擾.但該方法的計算精度最高不超過單像素.綜合考慮,這些方法對質心計算的物理約束利用較少.針對物理問題,Raissi等[24]提出了物理信息神經網絡(physics informed neural network,PINN),該論文目前已被引用超過2000 次.PINN的主要思想為采用神經網絡優化控制方程的殘差,使得神經網絡在可解釋性方面邁出了一大步,解決了許多物理問題.
因此,借鑒PINN 的思想,給出了一種用于光斑質心計算的PINN 網絡,稱為質心物理信息神經網絡(centroid-PINN).centroid-PINN 利用損失函數將質心物理約束引入神經網絡,通過優化網絡參數降低原始光斑與預測光斑的質心誤差,實現強噪聲干擾下的光斑質心高精度預測.本文將質心計算物理過程引入神經網絡,實現了強噪聲下的畸變光斑的質心高精度智能預測.本文算法采用Python實現,神經網絡基于Tensorflow 框架.為了便于復現本文計算結果,文中所采用的程序將在論文錄用后在網絡上公開.
實際光斑強度Iraw為無噪聲光斑強度Io與噪聲強度n的疊加,表示為

基于深度學習的質心計算問題可以被表述為利用神經網絡對含噪聲光斑Iraw進行處理,得到光斑,使得利用與Io計算得到相同的質心.
神經網絡對光斑的預處理過程可以表示為

其中Θ為網絡參數.網絡訓練的目標是獲得質心計算誤差最小的網絡參數,即

其中,fc為光斑質心計算函數.質心采用一階矩定義計算:

其中,x表示坐標,包括橫縱坐標(x,y),對應質心的水平豎直位置;I為光強;i表示坐標索引;ε為數值小量,取10—15.考慮到I可能出現全零情況,因此實際計算時需要向分母中增加一個小量.L(·,·)表示損失函數.考慮到質心距離符合歐拉距離表征,采用2 范數作為損失函數,表示為

式中,下標p 表示經神經網絡處理后的光斑計算得到的質心,下標o 表示無噪聲光斑的質心.
相比于SHNN,centroid-PINN 在使用網絡方面具有很高的自由度.可用神經網絡有很多種,例如全連接網絡、深度卷積神經網絡、U-Net 等.UNet為全卷積網絡,被廣泛用于圖像區域劃分、降噪、識別等領域[25].質心計算的困難主要來源于噪聲干擾.所以,本文采用U-Net 對噪聲光斑進行預處理.如圖1 所示,網絡的主體采用U-Net 網絡,將無噪聲原始光斑施加噪聲后再采用神經網絡處理得到預測光斑,分別利用無噪聲光斑和預測光斑計算質心,將二者的質心間橫縱坐標距離作為損失函數,利用反向傳播算法優化網絡參數.U-Net為包括壓縮路徑和擴展路徑的對稱U 形結構.壓縮路徑用于編碼,擴展路徑用于簡碼.本文采用的UNet 網絡包含2 個編碼/解碼層、1 個瓶頸層以及同一級的編碼層和解碼層之間的連接.編碼層包含2 個卷積層和1 個最大池化層.卷積層用于特征提取,卷積核的尺寸為3×3.最大池化層用于降采樣.每經過一次降采樣,特征圖尺寸減小為原來的一半.為了減少信息損失,每個模塊較上個模塊的特征向量長度增大1 倍,依次為16,32,64.解碼層包含1 個上采樣層和2 個卷積層.解碼層中,前一層特征圖上采樣與同層的壓縮層的特征向量拼接后組成卷積層的輸入.通過卷積層完成特征向量長度的縮短及尺寸的加倍,從而實現圖像的勻化和主要信息提取.最終需要光斑灰度圖像計算質心,因此網絡的輸出特征向量長度為1.

圖1 網絡結構Fig.1.Network architecture.
采用模擬方式產生訓練及測試用的光斑圖像.經大氣傳輸的遠場長時間平均光斑符合高斯分布,因此采用

生成光斑.其中,x0和y0分別為質心橫縱坐標,σx和σy表示高斯函數水平豎直方向的標準差.由于每經一次降采樣,特征尺寸減半,所以U-Net 的網絡輸入尺寸需根據瓶頸層的特征尺寸及降采樣次數計算.本文選用的輸入尺寸為256×256.為了便于設置參數,考慮到通常要求遠場光斑測量區域為光斑直徑的3 倍,因此,圖像的長寬坐標范圍設置為—3—3.利用隨機數修改光斑參數產生不同形貌的光斑.其中x0,y0∈[-2,2] 表示光斑的質心位置在—2—2 之間變化,σx,σy ∈[0.4,0.8] 用于調整高斯光斑的直徑.共生成10000 張高斯光斑圖片,隨機選取其中的80%作為訓練數據,20%作為測試數據.
在輸入網絡前對光斑進行預處理.第一步: 由于質心計算僅利用光強相對強度,以及神經網絡的激活函數輸出范圍為—1—1,所以將光斑強度歸一化至0—1.第二步:為了模擬實際光斑,向原始光斑圖像中實時添加噪聲形成網絡輸入.典型的噪聲類型包括白噪聲、斜坡噪聲、橫向及縱向高斯噪聲等[17].針對經長距離傳輸的遠場光斑,橫向及縱向高斯噪聲較為少見,因此僅考慮前兩種類型噪聲干擾.白噪聲的標準差范圍為0—0.3,模擬最大30%的噪聲干擾.斜坡噪聲的最大強度范圍為0—1,斜率范圍為—0.5—0.5.第3 步: 再次將光斑強度歸一化至0—1 之間.
在得到預測光斑后,利用(4)式分別計算預測的光斑和無噪聲光斑的質心,再使用(5)式計算損失函數.計算質心的關鍵在于獲得質心坐標在圖像中的相對位置.因此,將光斑圖像的長寬坐標分別設為—1—1.圖像的大小為256×256,對應一個像素的尺寸約為0.008.最后采用反向傳播算法優化網絡參數.采用的優化器為Adam,學習率設置為0.0001.
為了進一步驗證網絡的泛化能力,采用訓練后的網絡預測了與高斯形貌不同的光斑的質心.考慮平頂光斑遠場衍射理想光斑,采用如下函數產生類Sinc 光斑:

其中,J1為一階貝塞爾函數,r為坐標點與質心距離.采用均勻分布隨機數修改其中的參數改變光斑特征.a ∈[0.5,1.5],其余參數范圍與(6)式相同.
共對所有數據訓練20 個周期.訓練中依次從總體樣本中抽取小批量樣本,批量的大小為32.典型的損失函數變化如圖2 所示.曲線顯示: 經1 個周期的訓練,損失函數明顯下降.經過訓練,訓練集上的損失函數下降了約4 個數量級,測試集上的損失函數值約為10—4.測試集的損失函數值整體小于訓練集的損失函數,原因是當前采用的損失函數為所有樣本的損失函數之和,而測試集的樣本少.多次重復執行訓練過程,得到的損失函數變化情況略有不同.這是由于優化神經網絡時采用的隨機數作為種子.但是,通常損失函數能夠在一個周期內明顯下降.Centroid-PINN 利用損失函數將質心計算物理過程融入神經網絡,使得神經網絡在訓練時能夠更好地針對質心計算提取所需的圖像特征.因而網絡較容易收斂,在較少的迭代周期內即達到收斂.需要指出的是,如果采用較大的學習率,可能出現振蕩情況.振蕩的可能原因是個別光斑恰好通過當前網絡參數前向傳播后得到近似全零圖像.但繼續訓練,損失函數將再次降低.該結果表明網絡在當前參數設置下易于收斂.

圖2 訓練過程中損失函數變化情況Fig.2.Loss in training process.
從高斯光斑測試集中隨機選取光斑圖像,采用已訓練的網絡預測光斑質心,結果如圖3 所示.圖3(a)中,第一行為3 個典型的輸入光斑圖像;第二行為對應的無噪聲原始光斑;第三行為采用第一行光斑作為輸入得到的預測圖像.輸入光斑圖像中顯示出較明顯的背景干擾,并且光斑尺寸各異、位置隨機、存在沿水平豎直方向的拉伸變形.結果顯示: 在預測光斑圖像中,僅在與原始光斑位置相同處的強度較大,在噪聲處幾乎無響應,說明網絡對于真實光斑的響應較強.進一步,分別使用重心算法(CoG)和閾值重心算法(TmCoG)計算原始輸入光斑的質心,采用CoG 計算預測圖像光斑質心.為了便于實現,TmCoG 的閾值固定為0.1.結果如圖3(b)所示.圖中顯示了10 個批次的計算結果,每個數據點為32 幅圖像的平均值.CoG 與TmCoG的計算偏差基本相同,約0.5.對比圖像尺寸為1,因此對于存在當前噪聲干擾的光斑,傳統質心算法無法準確獲得光斑質心.主要原因是傳統質心算法易受噪聲干擾,特別是無法應對斜坡噪聲干擾.而利用神經網絡預測的精度為約0.008,約為1 個像素.表明利用當前的神經網絡可以有效預測斜坡和白噪聲干擾下的高斯光斑質心位置.對比網絡輸出的光斑與原始光斑,雖然二者存在較大差異,但是網絡在光斑處的響應遠高于其他位置處,表明網絡有效提取了高精度計算質心的特征,因而獲得了較高的質心定位精度.在傳統降噪應用中,要求網絡的輸出與原始圖像相一致.Centroid-PINN 不同于傳統的降噪,Centroid-PINN 的約束為網絡輸出的光斑與原始光斑形所計算得到的質心相同.

圖3 高斯光斑典型結果 (a)典型光斑,第一行為輸入光斑,第二行為原始的無噪聲光斑,第三行為預測光斑;(b)質心誤差Fig.3.Typical results of gauss spots: (a) Typical spots,first row is input spots,second row is true spot,third row is predicted spot;(b) centroid estimation error.
為了檢驗該網絡的泛化能力,使用上述訓練后的網絡預測了噪聲干擾下的類Sinc 光斑的質心,結果如圖4 所示.圖4(a)是典型的輸入光斑、原始光斑和預測光斑.輸入光斑為含噪聲光斑.原始光斑為無噪聲光斑.預測光斑為經神經網絡處理后的光斑.為了更明顯的顯示衍射光斑圖案,灰度值采用了自然對數坐標.輸入光斑不僅包含各種類型的噪聲干擾、改變了尺寸、拉伸變化,而且增加了原訓練數據集中不存在的旋轉變換.與高斯光斑算例相似,在預測光斑中,僅在與原始光斑的主光斑位置處出現較強響應.圖像邊緣處顯示出十分低的響應是由于目前采用的U-Net 在卷積計算時采用了邊緣補零的方法,采用邊緣對稱方法可以改善這一現象.質心計算誤差結果如圖4(b)所示.由神經網絡預測的質心誤差小于0.008,即神經網絡的預測精度達到了亞像素級別.相比而言,傳統質心算法的計算誤差約0.09,未能得到準確的質心位置.因此,神經網絡預測的精度依舊遠高于傳統質心算法方法.

圖4 類Sinc 光斑計算結果 (a)典型光斑,第一行為輸入光斑,第二行為原始光斑,第三行為網絡輸出光斑;(b)質心誤差Fig.4.Typical results of sinc-like spots: (a) Typical spots,first row is input spots,second row is true spot,third row is predicted spot;(b) centroid estimation error.
為了檢驗Centroid-PINN 的性能,利用高斯光斑分別計算了兩種噪聲對質心定位精度的影響,結果如圖5 所示.圖5(a),(b)分別顯示了僅有高斯噪聲和僅有斜坡噪聲的計算結果.橫坐標表示不同的噪聲強度.每一個數據點均為32 幅圖像計算的平均結果.結果顯示: Centroid-PINN 預測的質心誤差小于0.01,約為1 個像素;而傳統方法預測的結果偏差較大,未能準確獲得質心位置.表明神經網絡可以在兩種噪聲單獨干擾下有效地排除噪聲干擾,識別光斑.特別是對于斜坡噪聲,隨著噪聲強度的增大,神經網絡預測精度進一步提升.該現象可以解釋為隨著斜坡噪聲的強度增大,噪聲的特征更為明顯,因此神經網絡更容易排除該噪聲的干擾.

圖5 不同強度噪聲對質心計算的影響 (a)白噪聲;(b)斜坡噪聲Fig.5.Influence of noise intensity on centroid computation: (a) White noise;(b) ramp noise.
針對噪聲干擾下的畸變光斑質心高精度計算,提出了基于神經網絡的質心預測方法,稱為centroid-PINN.Centroid-PINN 利用U-Net神經網絡預處理光斑圖像,將質心計算誤差作為損失函數優化網絡參數.采用模擬手段驗證了該方法.結果表明: 在白噪聲和斜坡噪聲干擾下,centroid-PINN對于畸變的高斯光斑和Sinc 光斑的質心計算精度遠高于傳統方法,可達亞像素級別.相比于傳統的神經網絡方法,centroid-PINN 具有更明確的物理意義,更易于訓練.相比傳統質心計算方法,centroid-PINN 能夠智能化消除特定類型噪聲的干擾,有效解決了噪聲干擾下的質心高精度定位難題.進一步,噪聲的類型豐富多樣,本文僅對兩種典型噪聲的干擾展開了研究,后續工作中還可以分析其他噪聲的干擾,以及多種噪聲的疊加干擾.