中圖分類號:P752 文獻(xiàn)標(biāo)志碼:A 文章編號:1000-5137(2025)02-0209-06
Abstract:Anoptimized TransUNet framework stripe segmentationalgorithm was proposed toobtain oceaninternal wave informationfromremotesensing image,anditsefectivenessinsegmentingbrightanddark stripesinsyntheticapertureradar (SAR)images ofoceaninternal waves was verifiedcompared withtheoriginalTransUNetand UNet models.Thesegmentation resultsftheproposedmodelwererelativelycompletewithoutbreakage,andcouldadapttodiferentdatascalesbychangingthe complexityofthealgorithm,which layedthefoundation fortheinversionresearchofocean internal wavesandretainedgood application potential.
Key Words:internal wave stripe;synthetic aperture radar(SAR);TransUNet;deep learning;segmentation
0 引言
合成孔徑雷達(dá)(SAR)的成像原理是利用雷達(dá)波與微尺度海面波的共振而得到圖像,很多學(xué)者利用
SAR圖像數(shù)據(jù)對海洋內(nèi)波的檢測識別進(jìn)行了研究.RODENAS等[1提出了一種基于一維小波變換的SAR圖像海洋內(nèi)波檢測和特征描述方法,但該方法無法實現(xiàn)自動檢測.隨后RODENAS等[2提出了按尺度特征對局部梯度最大值進(jìn)行改進(jìn)的二維小波分析方法,可以很好地檢測出衛(wèi)星圖片中的內(nèi)波信息.KANG等[3]利用二維經(jīng)驗?zāi)B(tài)分解算法,從SAR遙感圖像中獲取海洋內(nèi)波.HOGAN等[4]利用Hough變換對SAR圖像中的海洋內(nèi)波進(jìn)行檢測,但是其對內(nèi)波條紋特征的檢測效果不理想.FAN等5利用Roberts算子對SAR圖像中的海洋內(nèi)波進(jìn)行檢測,但容易受噪聲的干擾,檢測效果不佳.鄭應(yīng)剛等[利用列分離鄰域處理和Canny算子邊緣檢測算法較好地解決了SAR圖像中斑點噪聲對Canny算子檢測結(jié)果的干擾,一定程度上提升了檢測效果.丁燦等通過統(tǒng)計海洋內(nèi)波在SAR圖像的功率譜特征,得出包含海洋內(nèi)波區(qū)域的功率譜值,結(jié)合多孔小波變換及多尺度融合方法,提取內(nèi)波特征并進(jìn)行反演.陳捷等8改進(jìn)了傳統(tǒng)的Randon變換,將改進(jìn)后的橢圓域歸一化Randon應(yīng)用到對SAR圖像海洋內(nèi)波的檢測中.
近年來,深度學(xué)習(xí)方法在遙感圖像識別和檢測等領(lǐng)域發(fā)揮著越來越重要的作用.孫宏亮等在快速基于區(qū)域的卷積神經(jīng)網(wǎng)絡(luò)(FastR-CNN)框架中,對不同微波波段、極化方式和分辨率的SAR圖像進(jìn)行自動檢測,取得了良好的檢測效果.JIANG等[1]通過設(shè)計一種基于優(yōu)化的深度卷積生成對抗網(wǎng)絡(luò)(DCGAN)的數(shù)據(jù)增強(qiáng)方法,實現(xiàn)了從遙感圖像中自動識別海洋內(nèi)波所發(fā)生的區(qū)域.TAO等1提出了一種改進(jìn)的you onlylookonce(Yolo) v5x 網(wǎng)絡(luò),在骨干網(wǎng)絡(luò)部分插入了一個坐標(biāo)注意力模塊,以增強(qiáng)骨干部分末端的學(xué)習(xí)特征,可以更準(zhǔn)確地定位海洋內(nèi)波的提取位置.范開國等[12通過將 Yolov8 與結(jié)合遷移學(xué)習(xí)的旋轉(zhuǎn)目標(biāo)檢測模型(ReDet)的檢測結(jié)果進(jìn)行對比,發(fā)現(xiàn)后者的訓(xùn)練效率優(yōu)于前者,在相同條件下,能夠獲得更好的檢測效果,可以自動檢測包含較大數(shù)據(jù)量的圖像.崔光曦等[13提出了一種基于超像素分割和全局顯著性特征的SAR海洋內(nèi)波檢測算法,在不降低SAR圖像空間分辨率的情況下,可以有效抑制斑噪的影響,實現(xiàn)高分辨率SAR海洋內(nèi)波條紋的準(zhǔn)確檢測.
本文結(jié)合UNet模型[14]的高分辨率空間信息和Transformer模型[15]的全局上下文特征學(xué)習(xí)特點,提出一種優(yōu)化的TransUNet框架條紋分割算法.為使TransUNet框架模型更適用于輕量級的海洋內(nèi)波條紋圖像,對其學(xué)習(xí)率和批處理大小進(jìn)行對比訓(xùn)練,并對Transformer層數(shù)和dropout參數(shù)進(jìn)行優(yōu)化.實驗結(jié)果顯示:相較于原始的TransUNet框架模型,所提模型能更有效地識別出遙感圖像中的海洋內(nèi)波條紋,且分割的精確度也更高.
1數(shù)據(jù)和模型
1.1數(shù)據(jù)數(shù)據(jù)預(yù)處理
本文的數(shù)據(jù)主要來源于Advanced Land Observing Satellite(ALOS)、哨兵1號(Sentinel-1)、The first/second European Remote Sensing Satelite(ERS-1/2)和 Envisat(Environmental Satellite)上的部分遙感影像.從相關(guān)網(wǎng)站(https://ww.nesdis.noaa.gov/; https://sentinel.esa.int/web/sentinel/copernicus/sentinel-1;https://www,eoportal.org/satelitemissions/ers-2;https://global.iaxa.ip/proiects/sat/alos4/)下載遙感圖像,保存為tiff格式,隨后對圖像進(jìn)行隨機(jī)水平翻轉(zhuǎn),隨機(jī)剪裁尺寸為512pixelx512pixel,并對其進(jìn)行數(shù)據(jù)量增強(qiáng)處理,將處理后的tiff格式圖像轉(zhuǎn)化為jpg格式.利用Labelme可視化軟件[16]對遙感影像數(shù)據(jù)集進(jìn)行海洋內(nèi)波和背景的數(shù)據(jù)標(biāo)記,生成png格式的標(biāo)簽數(shù)據(jù).
1.2TransUNet框架條紋分割算法
1.2.1 UNet模型
作為一種卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型,UNet網(wǎng)絡(luò)模型可以將高級語義信息和低級特征結(jié)合起來,實現(xiàn)特征的提取和細(xì)節(jié)恢復(fù).該網(wǎng)絡(luò)結(jié)構(gòu)中只有卷積層和池化層,沒有全連接層,網(wǎng)絡(luò)中淺層用來進(jìn)行像素定位,深層用來分類,從而實現(xiàn)圖像的語義分割.UNet的解碼部分采用反卷積方式,能夠克服編碼器在特征傳遞過程中所產(chǎn)生的特征丟失問題.
1.2.2 Transformer網(wǎng)絡(luò)模型
Transformer模型分為編碼器與解碼器兩部分.編碼器由自注意力層和前饋網(wǎng)絡(luò)組成,自注意力層能夠讓編碼器對全局上下文進(jìn)行建模.每個解碼器擁有同樣的結(jié)構(gòu),但所擁有的權(quán)重參數(shù)不同.
1.3 模型優(yōu)化
1.3.1學(xué)習(xí)率
采用學(xué)習(xí)率更新策略,使得其隨迭代次數(shù)的增長而逐漸衰減.在原始的TransUNet框架模型中,Transformer層數(shù)為12,訓(xùn)練時間過長,故本研究中,Transformer層數(shù)設(shè)置為2.分別對學(xué)習(xí)率為0.01,0.005,0.001和0.0001的模型進(jìn)行測試,如表1所示,

由表1可知:當(dāng)學(xué)習(xí)率為0.01與0.005時,模型收斂所需的執(zhí)行輪次與測試損失基本一致;當(dāng)學(xué)習(xí)率為0.001時,訓(xùn)練損失有所下降,但輪次上漲幅度較大;當(dāng)學(xué)習(xí)率為0.0001時,輪次最高且測試損失也最高,識別效果最差.因此,為了更好地驗證學(xué)習(xí)率對于最終結(jié)果的影響,選取學(xué)習(xí)率為0.01,0.005與0.001的模型檢測結(jié)果,如圖1所示.由圖1可知,當(dāng)學(xué)習(xí)率為0.01與0.005時,分割的海洋內(nèi)波條紋明顯存在斷裂,分割效果較差,故最終學(xué)習(xí)率選取0.001.
1.3.2 批處理大小
批處理大小即一次訓(xùn)練所抓取的樣本數(shù)量,與每輪訓(xùn)練次數(shù)有關(guān).適當(dāng)?shù)呐幚泶笮∮欣趫D形處理器(GPU)平穩(wěn)運行,提高訓(xùn)練速度,使梯度下降方向更加準(zhǔn)確.對批處理大小分別為4,8,16和32的模型進(jìn)行測試,如表2所示.由表2可知,當(dāng)批處理大小為8時,訓(xùn)練和測試損失均最小,批處理大小為16時次之,圖2為批處理大小為8和16時,模型的分割效果,

由圖2可見,與批處理大小為8時模型的分割結(jié)果相比較,無論在精度上還是訓(xùn)練效率上,批處理大小為16的模型都有一定的優(yōu)勢,故批處理大小設(shè)定為16.
1.3.3 隨機(jī)失活(Dropout)
Dropout是SRIVASTAVA等[17]在2014年提出的一種針對神經(jīng)網(wǎng)絡(luò)模型的正則化方法,在訓(xùn)練過程中按一定比例隨機(jī)忽略一些神經(jīng)元,使神經(jīng)元不再過度依賴于輸入特征,即每一個輸入設(shè)置的權(quán)重都不
會過大,提升了模型的泛化能力,且訓(xùn)練數(shù)據(jù)不易發(fā)生過擬合現(xiàn)象.在Transformer層后引人Dropout,其值分別設(shè)置為1.00,0.30,0.20,0.10及0.05進(jìn)行測試,如圖3所示.
由圖3可知,當(dāng)Dropout值設(shè)置為1時,模型訓(xùn)練的結(jié)果完全不收斂,無法進(jìn)行有效的分割;隨著Dropout值逐漸減小,模型的擬合效果逐漸變好.當(dāng)Dropout值介于0.05與0.20之間時,損失率基本趨于穩(wěn)定,在大約225個執(zhí)行輪次后,模型性能收斂到最佳.因此,Dropout很大程度上減少了過擬合的情況,提高了訓(xùn)練的精確度.

2實驗結(jié)果
2.1 實驗環(huán)境
使用顯卡為NvidiaRTX3060,操作系統(tǒng)為Windows的PrecisionTower7920計算機(jī),基于Python平臺實現(xiàn)模型.動量與權(quán)重衰減分別設(shè)置為0.9和0.000 5.將數(shù)據(jù)集劃分為訓(xùn)練集、驗證集和測試集,劃分比例為8:1:1,批處理大小為16,學(xué)習(xí)速率為0.001.輸入的原始圖像分辨率大小為
xel,在模型中將圖像分辨率大小調(diào)整為128pixel×128pixel.
2.2 可視化分析
將傳統(tǒng)TransUNet、優(yōu)化后的TransUNet和UNet三種模型的條紋分割圖進(jìn)行比較分析,其分割的Dice相似系數(shù)精度依次為0.770,0.846和0.828.圖4為明暗內(nèi)孤立波條紋分割圖.由圖4可知,傳統(tǒng)TransUNet模型未能完全分割出條紋的上邊緣輪廓,而UNet與優(yōu)化后的TransUNet模型分割出了上邊緣部分,且優(yōu)化后的TransUNet模型所分割的邊緣部分更加順暢.總結(jié)來說,三種模型都能夠分割出 SAR圖像中的明暗內(nèi)孤立波條紋,而優(yōu)化后的模型分割效果更好.
圖5為明亮內(nèi)孤立波條紋分割圖.由圖5可見,優(yōu)化后的TransUNet模型分割效果最優(yōu),傳統(tǒng)TransUNet模型未能完全分割出內(nèi)波條紋且存在部分?jǐn)嗔押驼`分割的現(xiàn)象,UNet模型未能分割完整的內(nèi)部條紋.


3結(jié)語
本文基于一種優(yōu)化的Transunet框架條紋分割算法,對遙感影像中的海洋內(nèi)波條紋進(jìn)行分割.為了使TransUNet模型能適用于分割輕量型海洋內(nèi)波條紋圖像,對TransUNet模型的學(xué)習(xí)率和批量處理的設(shè)置進(jìn)行了比較,對Transformer層數(shù)和Dropout參數(shù)進(jìn)行了優(yōu)化.利用傳統(tǒng)TransUNet,UNet和優(yōu)化的TransUNet模型分別對明暗和明亮內(nèi)孤立波條紋圖像進(jìn)行分割,驗證了優(yōu)化的TransUNet模型的分割結(jié)果最佳.未來可使用性能更好的設(shè)備,對大尺度海洋內(nèi)波條紋圖像進(jìn)行研究,并對海洋內(nèi)波進(jìn)行數(shù)值仿真和反演研究.
參考文獻(xiàn):
[1]RODENAS JA,GARELLO R.Wavelet analysis in SAR ocean image profiles for internal wave detection and wavelength estimation[J].IEEE Transactions on Geoscience and Remote Sensing,1997,35(4) :933-945.
[2]RODENAS JA,GARELLOR.Internal wave detection and location in SAR images using wavelet transform [J].IEEE Transactions on Geoscience and Remote Sensing,1998,36(5):1494-507.
[3]KANG J,ZHANG J,SONG JP,et al.The aplication of two-dimensional EMD to extracting internal waves n SAR images[C]/ InternationalConference on Computer Science and Software Enginering.Wuhan: IEEE,20o8:953-956.
[4] HOGAN G G,MARSDEN JB,HENRYJC.On the detection of internal waves in high resolution SAR imagery using the Hough transform[C]//Proceedings of Oceans.Honololu: IEEE,1991:1363-1369.
[5]FAN K G,HUANG W G,CHENP,etal.Automatic detection of ocean internal wave from SAR image [C]//Remote Sensingof the Ocean,Sea Ice,Coastal Waters,and LargeWater Regions.Prague:SPIE,2O11:817513.
[6]鄭應(yīng)剛,張洪生,李曉戀,等.基于遙感影像邊界特性對南海海洋內(nèi)波檢測算法研究[J].熱帶海洋學(xué)報,2020, 39(6) :41-56. ZHENG YG,ZHANG HS,LIX L,etal.Detection algorithmof internal waves in the South China Sea based on boundary characteristics of remote sensing image[J]. Journal of Tropical Oceanography,2O20,39(6):41-56.
[7]丁燦,張本濤,高國興,等.合成孔徑雷達(dá)圖像中海洋內(nèi)波的特征檢測[J].海洋測繪,2012(5):15-18. DING C,ZHANG B T,GAO G X,et al.Feature detection of ocean internal wave in SAR image[J].Hydrographic Surveying and Charting,2012(5):15-18.
[8]陳捷,陳標(biāo),許素芹.一種新的SAR圖像內(nèi)波檢測與參數(shù)估計方法[J].中國圖象圖形學(xué)報,2009,14(1):40-44. CHENJ,CHENB,XUSQ.Anovel methodon internal wave detectionand parameter estimationfromSAR images[J]. Journal of Image and Graphics,2009,14(1):40-44.
[9]孫宏亮,王怡然,賈童,等.基于FasterR-CNN的衛(wèi)星SAR圖像南海海洋內(nèi)波自動檢測[J].遙感學(xué)報,2023, 27(4):905-918. SUNHL,WANGYR,JIAT,et al.Faster R-CNNbased oceanic internal wave detection from SAR images in the South China Sea[J].National Remote Sensing Bulletin,2023,27(4):905-918.
[10]JIANGZY,GAOX,SHIL,et al.Detectionofocean internal waves basedonmodified depconvolutionalgenerative adversarial network and wave netinmoderate resolution imaging spectroradiometer images[J].Applied Sciences,2023, 13(20):11235.
[11]TAOMK,XUCJ,GUOLX,etal.Aninternal waves data set from Sentinel-1synthetic aperture radar imageryand preliminary detection[J].Earth and Space Science,2O22,9(12):1-14.
[12]范開國,王業(yè)桂,姜翰,等.基于深度學(xué)習(xí)的星載SAR海洋內(nèi)波自動檢測研究[J].數(shù)字海洋與水下攻防,2024, 7(5):521-528. FAN K G,WANG YG,JIANG H,et al.Automaticdetection of intemal waves from space-bomeSAR images based on deeplearning[J].DigitalOceanamp;UnderwaterWarfare,2024,7(5):521-528.
[13] 崔光曦,杜延磊,楊曉峰,等.聯(lián)合超像素分割和顯著性特征的SAR海洋內(nèi)波檢測[J].遙感學(xué)報,2024,28(9): 2335-2347. CUI G X,DU Y L,YANG XF,et al.Ocean internal wave detection in SAR images by combining superpixel segmentation and saliency features [J].National Remote Sensing Bulletin,2024,28(9):2335-2347.
[14] RONNEBERGER O,F(xiàn)ISCHER P,BROX T. U-net:convolutional networks for biomedical image segmentation [C]/ International Conferenceon Medical ImageComputingand Computer-Assisted Intervention.Munich:Springer,2015: 234-241.
[15] CHENJN,LUYY,YUQH,et al. TransUNet: Transformers make strong encoders for medical image segmentation[J/OL]. ArXiv,2021:2102.04306[2024-10-19]. https://arxiv.0rg/abs/2102.04306.
[16] RUSSELL BC,TORRALBA A,MURPHY KP,et al.LabelMe:a database and web-based tolfor image annotation[J] International Journal ofComputerVision,20o8,77:157-173.
[17]SRIVASTAVAN,HNTONG,KRIZHEVSKY A,et al,Dropout:a simple way to prevent neural networks fromoverfitting[J].Journal of MachineLearningResearch,2014,15:1929-1958.
(責(zé)任編輯:包震宇,郁慧)