基于GAUNet的深度學習相位解纏方法

2023-09-02 02:25:40李東旭謝先明

遙感信息 2023年3期

李東旭,謝先明

(1.廣西科技大學自動化學院,廣西柳州 545006;2.廣西科技大學電子工程學院,廣西柳州 545006)

0 引言

相位解纏(phase unwrapping,PU)作為眾多干涉測量技術的核心步驟,廣泛應用于干涉合成孔徑雷達、光學干涉測量、核磁共振成像等領域[1]。從干涉測量技術中得到的相位主值會被限制在(-π,π]區間內,通過對相位主值加上整數倍的相位周期來恢復原始相位的處理過程稱為相位解纏。目前傳統相位解纏算法主要分為路徑跟蹤類算法[2-5]、最小范數類算法[6-9]、非線性濾波類算法[10-11]3類。路徑跟蹤類算法的代表性方法包括質量引導法、枝切法、網絡流法等,這類方法通過設置合適的積分路徑來阻止誤差沿全局蔓延,在高信噪比區域可達到較好的解纏精度,然而在低信噪比區域易造成噪聲誤差沿路徑傳遞的現象,且該類方法受積分路徑的影響往往會比較耗時。最小范數類算法的代表性方法包括無權最小二乘法和加權最小二乘法等,與路徑跟蹤法理念不同,該類方法通過建立恰當的代價函數,使解纏相位梯度與纏繞相位梯度之間差異最小化來估算解纏相位,當干涉圖中的噪聲較小時,能夠具有較強的穩健性和較快的運算速度,而當干涉圖噪聲較大時則會平滑解纏結果,容易丟失相位細節信息和降低解纏相位的動態范圍。非線性濾波類算法的代表性方法包括卡爾曼濾波方法、粒子濾波方法等,這些方法通過建立干涉相位的貝葉斯遞推估計程序來解纏,與上述兩類方法相比,非線性濾波類算法具有較好的噪聲抑制能力,能夠獲得較高的解纏精度,但這類方法存在耗時較長的問題。傳統相位解纏方法均可在一定程度上取得較好的解纏效果,但其在解纏效率方面仍有待提升。因此,如何高效地從纏繞相位中提取出真實相位仍是當下所需解決的關鍵問題。

深度學習(deep learning,DL)被廣泛應用于語音識別、圖像識別、自然語言處理等領域,并在目標識別、圖像分類、圖像分割和自然語言處理等不同領域的許多問題中都展現出顯著優勢。近年來,DL技術已開始應用于干涉圖相位解纏領域,各種基于DL的相位解纏算法[12-20]相繼被提出,這些方法大致可分為3類。第一類是兩步PU法,首先將干涉圖相位解纏問題轉化為語義分割問題,利用語義分割來預測干涉圖纏繞相位的模糊數,隨后將預測模糊數與纏繞相位相結合,并通過適當的后處理程序來獲取無模糊的解纏相位,如PhaseNet、Segnet、DeeplabV3+等。第二類是一步PU法。這類方法采用神經網絡直接從纏繞相位中提取解纏相位,無需任何后處理步驟。如DLPU、PU-M-Net、U-Net、U-Net3+等。第三類是把深度學習神經網絡與傳統算法相結合來提高干涉圖相位解纏精度,如PGNet、BCNet等。與傳統相位解纏方法相比,上述基于DL的PU方法具有解纏效率較高的特點,但其噪聲魯棒性以及解纏相位的準確性仍需進一步提高。

本文提出了一種基于全局注意力上采樣(GAU)的相位解纏算法(簡稱為“GAUPU”),該算法將PU-M-Net網絡和注意力機制進行了有效融合,通過建立纏繞相位與解纏相位的非線性映射關系來達到一步相位解纏的目的。首先,在編碼-解碼路徑之間采用了一種注意力模塊,即全局注意力上采樣模塊,將低級特征層和其對應的高級特征層進行連接,GAU模塊可以有效利用多尺度特征映射,并利用高級特征為低級特征提供加權指導,從而進一步增強干涉圖條紋特征信息;其次,PU-M-Net所采用的跳躍連接操作促進了相位細節信息與語義條紋信息的有效融合,提高了相位解纏中初始特征的利用率;最后,根據干涉圖噪聲量級評估系統對噪聲干涉圖劃分為4個噪聲量級,構建4個噪聲量級的數據集對網絡模型進行訓練,完成訓練后的網絡能直接從不同量級下的纏繞相位中獲得解纏相位。實驗結果表明本文網絡具有較高的解纏效率以及魯棒性。

1 基于深度學習的神經網絡相位解纏模型

GAUPU大致實現途徑如下:Ⅰ)搭建適合干涉圖纏繞相位解纏的網絡架構,利用文獻[18]提出的干涉圖噪聲量級評估系統對干涉圖的噪聲量級進行劃分,并構建多組不同噪聲量級的訓練集,對同一深度學習網絡架構進行訓練得到適用不同噪聲量級干涉圖解纏的解纏網絡,如圖1(a)所示;Ⅱ)對待解纏的干涉圖進行噪聲量級判定,隨后將其匹配至對應噪聲量級的預測網絡進行解纏,如圖1(b)所示。

圖1 GAUPU流程示意圖

1.1 GAUPU網絡模型

GAUPU網絡由文獻[16]所述PU-M-Net網絡以及GAU模塊組成,該網絡結構如圖2所示,其中網絡上方的數字為通道數。首先,左側編碼路徑利用6個基本模塊由上至下逐層提取輸入的纏繞相位圖的特征信息,每層模塊的輸入部分由不同分辨率的原始輸入特征圖與上一層基本模塊的輸出特征通過跳躍連接①相結合得到初始特征,并將該特征通過跳躍連接②與依次經過卷積層(如圖中白色[C],Conv3×3層+批量歸一化BN+激活函數Relu)和殘差網絡層(如圖中橙色[R])所得到的特征圖進行融合,融合后的特征圖通過卷積層進行卷積操作得到基本模塊的輸出特征,而后使用2×2最大池化將得到的輸出特征壓縮到下一個尺度,所使用的卷積填充操作采用相同(same)模式,利用這種模式使得卷積前與卷積后的特征尺度保持不變,編碼路徑最終輸出的特征圖用于解碼路徑的輸入,右側解碼路徑的網絡架構與編碼路徑對稱,其基本模塊與編碼路徑中的模塊相同,每個模塊的輸入由GAU模塊(如圖中綠色GAU)生成的特征圖以及經過2×2上采樣的下一層的輸出特征通過跳躍連接③連接構成,該路徑亦利用6個基本模塊由下至上逐漸恢復到原始輸入特征圖大小。最后,通過跳躍連接④將解碼路徑中每層模塊的輸出進行合并,并利用卷積核為1×1的卷積層調整特征圖通道數以此獲取最終的輸出結果。

圖2 GAUPU網絡框架

由于低級特征在空間分布與物理意義上存在差異,很難有效利用低級特征,為了提升低級特征的利用率,在編碼-解碼跳躍連接中采用了注意力機制GAU的連接方式,即將高級特征的全局注意力嵌入到低級特征中。采用這種方式具有如下優勢:低級特征在保留相位信息的同時融入了高級特征的上下文信息,彌補了高級特征與低級特征之間的差距,有利于更好地提升性能;不會顯著增加網絡參數;能夠高效地適應不同尺度下的特征映射;本文注意力機制先進行全局池化,后進行壓縮感知進而稀疏表達,在保留語義信息的同時可較好地減少計算和儲存成本。

GAU的結構如圖3所示,其中:C1、H1、W1分別代表低級特征的通道數、高和寬;C、H、W分別代表高級特征的通道數、高和寬;r為衰減因子(本文取r=8)。以圖2中GAU3為例,首先對解碼路徑輸出得到的分辨率為64×64的特征圖執行全局平均池化操作得到全局上下文信息,并采用瓶頸門控設計的方法[21]進一步提取解碼路徑高級特征的上下文信息,得到包含高級特征全局上下文信息的注意力特征,即先采用卷積核為1×1的卷積層對特征圖的通道數進行降維為64/r,再用卷積核為1×1的卷積層對上述得到的特征圖進行升維操作,其輸出的通道數與編碼路徑的低級特征通道數保持一致。其次,將注意力特征與編碼路徑得到的低級特征相乘,得到加權后的低級特征。最后,采用殘差設計的方法將經過上采樣的高級特征與加權后的低級特征進行融合。

圖3 GAU結構示意圖

在深度學習框架keras2.4.3的基礎上訓練網絡,計算機主要配置參數為Inter Xeon W-2245(3.9 GHZ)+128 GB RAM,NVIDIA Geforce RTX 3080 GPU。網絡訓練采用自適應矩估計優化器、均方誤差損失函數,初始學習速率為0.001,訓練輪數為160,最小訓練批次為6,訓練時間約為32 h。值得注意的是,雖然網絡訓練較為耗時,然而完成訓練后的DL網絡執行干涉圖相位解纏的時間耗費幾乎是可以忽略不計的。

1.2 噪聲量級評估系統

利用文獻[18]提出的干涉圖噪聲量級評估系統對干涉圖的噪聲量級進行劃分,并構建多組不同噪聲量級的訓練集,對同一深度學習網絡架構進行訓練得到適用不同噪聲量級干涉圖解纏的解纏網絡。

根據干涉圖噪聲估計值把干涉圖相位噪聲劃分為4等級,如表1所示。

表1 噪聲等級劃標準

噪聲估計值Ne計算方法如式(1)所示。

(1)

式中:M和N分別為干涉圖的行數和列數;Res(x,y)為取模運算后的殘差圖;l為噪聲加權系數(本文取值l為100);W(x,y)為利用偽相干系數法獲得的干涉圖質量圖。

對待解纏的干涉圖進行噪聲量級判定,隨后將其匹配至對應噪聲量級的預測網絡進行解纏,有利于提高干涉圖相位解纏精度。

1.3 網絡數據集

構建4組不同噪聲量級的訓練集,對同一深度學習網絡架構進行訓練得到適用不同噪聲量級干涉圖解纏的解纏網絡。各噪聲量級的數據集均包含35 000組數據,按如下4種方式生成。

方式1:按文獻[14]所述的數據集構建方法產生3 000組數據,其圖像尺寸為256×256,標簽圖像相位范圍為0～60 rad。

方式2:按文獻[15]所述的數據集構建方法產生4 000組數據,其圖像尺寸為256×256,標簽圖像相位范圍為0～60 rad。

方式3:由山西省大同市、安徽省黃山市、浙江省金華市等地區DEM數據轉化InSAR干涉相位圖數據24 000組,即先把DEM數據根據InSAR理論轉換為真實干涉相位,隨后產生添加不同噪聲的纏繞相位圖,共產生24 000組InSAR干涉圖數據,其圖像尺寸為256×256,標簽圖像相位范圍為0～60 rad。

方式4:由傳統相位解纏方法所獲得的InSAR干涉相位圖數據3 000組,即利用傳統相位解纏方法對實測InSAR干涉圖解纏獲得其解纏相位,隨后產生添加不同噪聲的纏繞相位圖,共產生3 000組準實測InSAR干涉圖數據,其圖像尺寸為256×256,標簽圖像相位范圍為0～60 rad。

2 干涉圖相位解纏實驗分析

2.1 模擬干涉圖相位解纏實驗

為了驗證GAUPU網絡架構的性能,利用該網絡算法解纏不同類型的模擬干涉圖,并與質量引導算法(QGPU)、枝切法(BUTPU)、迭代最小二乘法(ILS)等傳統相位解纏算法作比較。模擬干涉圖如圖4所示,圖4(a)、圖4(b)分別為多峰地形、金字塔真實相位,分辨率均為256×256,圖4(c)、圖4(d)分別為圖4(a)、圖4(b)真實相位所對應的噪聲纏繞圖,其信噪比依次為4.94 dB、-1.07 dB,所對應的噪聲等級依次為1、3。

圖4 模擬干涉圖

利用QGPU、BUTPU、ILS、GAUPU分別對圖4(c)、圖4(d)進行解纏,其解纏結果依次對應圖5、圖6,圖5、圖6分別為上述算法對應圖4(c)、圖4(d)的解纏相位圖、解纏相位誤差圖以及解纏相位誤差直方圖。從圖5可看出,QGPU、BUTPU、ILS 3類傳統算法在干涉圖信噪比較高時均可取得較好的解纏結果。從圖6可觀察到在低信噪比情況下,QGPU在解纏過程中出現噪聲誤差沿質量引導路徑蔓延,造成解纏相位不一致,甚至解纏失敗的情形;BUTPU解纏時易造成“孤島”現象;ILS解纏相位大致連續,但其誤差范圍較大。與此同時,GAUPU算法能夠取得較為理想的解纏結果,且誤差范圍較小,特別是當干涉圖所含噪聲較大時,其誤差范圍要遠遠小于上述3類方法,表明該方法具有較好噪聲魯棒性的同時能夠較為完整地還原干涉圖相位信息。表2列出了上述方法解纏不同信噪比干涉圖的均方根誤差(30次實驗平均),可以看出隨著信噪比的降低,GAUPU解纏精度要遠優于QGPU、BUTPU、ILS 3種算法。表3列出了上述算法解纏圖4(c)、圖4(d)所示干涉圖的平均時間耗費。可以看出,GAUPU時間耗費要遠遠小于上述其他3種算法。故與QGPU、BUTPU、ILS算法相比,GAUPU不僅取得了較為穩健的解纏效果,而且在時間消耗方面亦具有明顯優勢。其中,QGPU、BUTPU、ILS的運行環境均為MATLAB R2016b,GAUPU的運行環境為python 3.8。

表2 不同噪聲下的均方根誤差對比

表3 各類算法運行時間 s

圖5 不同相位解纏方法對圖4(c)解纏結果

圖6 不同相位解纏方法對圖4(d)解纏結果

2.2 實測干涉圖相位解纏實驗

實測干涉圖如圖7所示,其中圖7(a)為2021年5月21日21時48分在云南大理州漾濞縣Sentinel1A衛星采集的局部云南干涉圖,圖7(b)為Rahul 干涉圖[22]。

圖7 實測干涉圖

表4為圖7(a)、圖7(b)所示干涉圖的噪聲等級,圖8、圖9為QGPU、BUTPU、ILS、GAUPU方法分別對圖7(a)、圖7(b)解纏結果,其中圖8、圖9每行分別為QGPU、BUTPU、ILS、GAUPU方法解纏相位及對應的重纏繞圖。從圖9第1列,可觀察到QGPU方法解纏相位圖中存在明顯相位不連續區域,盡管其解纏相位重纏繞圖與實測干涉圖條紋大致一致,但其仍存在大量噪聲,易造成噪聲誤差沿質量引導路徑蔓延,易導致相位解纏精度下降或其解纏結果不可靠。從圖9第2列可看出,BUTPU方法解纏相位在殘差點分布較為密集的地方形成了大量無法解纏的封閉區域,造成了孤島現象的產生,導致解纏失敗。圖8第3列中ILS方法所得到的解纏相位較為平滑連續,但解纏相位重纏繞圖與實測干涉圖相比存在明顯不一致條紋,造成條紋細節信息的丟失,導致其解纏相位可靠性降低。與上述3類算法相比,本文算法解纏相位連續光滑,其解纏相位重纏繞圖條紋與實測干涉圖條紋基本一致,且在重纏繞圖中幾乎沒有噪聲,表明該算法有效抑制噪聲影響的同時具有較好的解纏結果。

表4 實測干涉圖噪聲等級

圖8 不同解纏方法對圖7(a)解纏結果

圖9 不同解纏方法對圖7(b)解纏結果

3 結束語

GAUPU算法把注意力上采樣GAU和PU-M-Net結合起來,通過構建纏繞相位與真實相位之間的映射關系來實現干涉圖解纏,完成訓練后的網絡可解纏不同噪聲量級的干涉圖。模擬干涉圖與實測干涉圖相位解纏實驗證明了本文算法的有效性,且與QGPU、BUTPU、ILS等傳統算法相比,在獲得較為穩健的相位解纏結果的同時,其時間消耗亦遠小于上述兩種算法。