楊俊鋼,穆佳棟,谷浩然,荀佳偉
(1.自然資源部第一海洋研究所,山東 青島 266061;2.自然資源部海上絲路海洋資源環境組網觀測技術創新中心,山東 青島 266580;3.青島大學 計算機科學技術學院,山東 青島 266071;4.中國石油大學(華東) 海洋與空間信息學院,山東 青島 266580)
71%的地球表面被海洋覆蓋,海洋運動變化與人類生活息息相關,認識和了解海洋物理屬性與運動特征對于海洋環境保護、海洋資源開發、海洋工程建設和海洋環境安全保障至關重要。溫度和鹽度是描述海洋物理屬性的基本參量,是海水密度的主要確定因素,在中緯度的上層海洋(0~500 m)中溫度是決定聲速的主要參數,鹽度在降雨多或海冰較多的高緯度地區至關重要。海水溫度和鹽度的變化與大洋環流、全球水循環、海洋-氣候系統變化密切相關,影響著海洋對全球氣候變化的調節能力。溫度和鹽度是最早被人類觀測的海洋參數,通過現場儀器或衛星遙感手段可以直接或間接觀測海水溫度和鹽度。海水溫度和鹽度現場觀測受觀測手段與條件的限制,存在觀測時空分布不均和觀測頻次和時間序列長度有限的不足。衛星遙感為海洋表層溫度和鹽度觀測提供了重要的手段,隨著傳感器和衛星平臺技術的發展,國內外出現了眾多用于海洋表層溫度和鹽度觀測的衛星及遙感器。海面溫度遙感觀測手段主要為微波和紅外輻射計,國內外相關衛星或傳感器有AVHRR、MODIS、VIIRS、TMI、GMI、SSM/I、AMSR/AMSR-E、AMSR2、Envisat AATSR、Windsat、Sentinel-3 SLSTR、HY-1/2等。海面鹽度遙感觀測手段為微波輻射計,相關衛星或遙感器主要有SMOS、Aquarius 和SMAP。此外,衛星遙感可獲取海面高度和海面風場等觀測數據,而海面高度和海面風場與海水溫鹽變化也密切相關。
海洋三維溫鹽場信息是描述海洋物理屬性特征和掌握海洋物理運動過程的重要參數,獲取準確的海洋三維溫度和鹽度信息對于認識海洋、開發利用海洋和海洋科學研究等具有重要意義。現場觀測手段獲取的海水溫鹽場信息時空分布稀疏且時間連續性差。衛星遙感可獲取全球海洋海面溫度和鹽度信息,但無法獲取海洋次表層三維溫鹽場信息。基于描述海水物理運動過程的水動力學方程組,采用一定的數值求解方式并同化海水溫鹽現場或衛星遙感觀測數據,建立海洋數值模型計算可得到時空分布均勻且連續的海水三維溫鹽場信息。但因海洋數值模型的物理規則不完整、部分物理過程只是近似計算,海水溫度和鹽度計算精度難以保證,特別在對于海洋動力環境復雜且變化劇烈的區域。因此,如何準確獲取海洋三維溫鹽場信息是海洋科學研究的重要方向之一。從豐富的海洋表層衛星遙感觀測數據(海面溫度、海面鹽度、海面高度和海面風場等)和稀疏的現場剖面觀測數據出發,國內外已開展了海洋三維溫鹽場反演或構建研究。三維溫鹽場構建的主要內容是基于海洋表層多源衛星遙感數據和溫鹽剖面實測數據建立由表層到水下的映射關系,最終實現基于海洋表層多源遙感數據的時空連續的次表層三維溫鹽場數據的獲取。基于海洋表層衛星遙感的次表層三維溫鹽場探測的主要方法可分為:統計類方法、動力學方法和基于聲傳播時間的經驗方法[1]。統計類方法是建立海洋表層衛星遙感觀測要素和次表層海水溫鹽信息的統計關系,主要包括回歸統計和經驗正交分解及變分方法。經驗正交分解將溫鹽剖面觀測數據進行EOF分解,找出某幾個模態所對應的振幅與海面溫度或海面高度建立回歸關系。變分法是采用數據同化方法將觀測數據與氣候態數據結合,生成三維溫鹽場。美國海軍于20 世紀90年發展的模塊化海洋數據同化系統(MODAS)[2]是動力學方法三維溫鹽場重構的成功案例,通過同化衛星遙感海面溫度和海面高度,并結合傳統靜態氣候態,可生成高分辨率的三維溫鹽場數據。動力學方法運用動力模型結合海面信息模擬海洋內部動力過程,一般采用一定的動力學約束條件或數值模式,將海表衛星遙感觀測數據轉化為動力學控制變量,實現表層數據到水下的映射。表面地轉(Surface Quasi Geostrophic,SQG)和iSQG 是具有代表性的動力學方法,該方法基于準地轉方程、將內部解投影到第一斜壓模態和正壓模態,利用海面觀測數據約束求解實現利用海面高度、海面溫度和海面鹽度等反演次表層參數。基于聲學傳播時間的經驗方法根據聲傳播時間建立經驗模型,反演水下溫鹽結構。
近年來,隨著人工智能與深度學習方法的發展,人們開始采用深度學習方法開展海洋次表層三維溫鹽場探測研究。本文從海洋溫鹽觀測數據集、傳統機器學習三維溫鹽智能探測、一般神經網絡三維溫鹽智能探測和深度學習三維溫鹽智能探測等方面對與海洋三維溫鹽場智能探測相關的研究進展進行綜述。
海水溫度和鹽度的現場和衛星遙感觀測數據是海水溫鹽場數據集的主要數據來源,首先針對基于多種現場觀測平臺和手段獲取的溫鹽現場剖面觀測數據、多源衛星遙感獲取的海面溫度和海面鹽度遙感數據所構建出的海洋溫鹽觀測數據集進行回顧,上述數據集是現有海洋三維溫鹽場數據集的主要數據源,也是進一步深入開展海洋三維溫鹽場重構的主要基礎數據。以下從溫鹽現場觀測數據集、海面溫度遙感觀測數據集和海面鹽度遙感觀測數據集分別展開介紹。
海水溫鹽剖面現場觀測的主要手段包括CTD、XBT、MBT 和ARGO 浮標,其中以ARGO 浮標最具代表性且觀測數據不斷豐富,圖1 是2023年12月10日的全球在用ARGO 浮標分布圖(來自https://argo.ucsd.edu/)。基于多種現場觀測手段獲取的全球海洋溫鹽剖面數據,主要形成了如下幾類溫鹽現場觀測數據集。

圖1 ARGO 浮標全球分布示意圖Fig.1 Global distribution of ARGO buoys
1)ARGO 網格數據。利用變分插值方法由時空分布不均勻的溫鹽剖面數據生成全球網格數據,數據空間分辨率為1°,垂向0~2 000 m 共分為27層,時間分辨率為月均,時間跨度為2005年至今。
2)WOD(World Ocean Database)。世界上最大的統一格式、質量可控、公開可用的海洋剖面數據集,是海洋學、氣候和環境研究的強大工具。WOD 數據涵蓋從1772年至今的海洋氣候分析資料,WOD 數據集可通過NCEI 獲得[3]。
3)GTSPP(Global Temperature and Salinity Profile Programme)。一些海洋科學組織發起的國際合作項目,旨在為研究人員和海洋業務化管理人員提供準確、最新的溫度和鹽度數據。世界氣象組織(WMO)和政府間海洋學委員會(IOC)共同管理該項目的數據獲取、歸檔和分發,以確保持續的質量控制、存儲和訪問,NCEI 提供存儲和質量控制服務。GTSPP 數據集包括經質量控制和重處理并保存為統一格式的CTD、XBT 和ARGO 溫鹽剖面數據。
4)EN4[4]。英國氣象局哈德利中心提供的一系列溫鹽剖面數據集,經質量控制和客觀分析形式的1900年至今的次表層溫度和鹽度數據。EN4 中的數據來自:ARGO、北極全流域天氣海洋學(ASBO)項目、全球溫度和鹽度剖面計劃(GTSPP)和2018年世界海洋數據庫(WOD18)。
除現場觀測外,衛星遙感是獲取大面積同步海洋溫鹽觀測的重要手段。海面溫度衛星遙感數據眾多,綜合多源衛星遙感數據已形成了多種海面溫度融合數據,特別是由高分辨率海面溫度小組(Group for High Resolution Sea Surface Temperature ,GHRSST)提供的數據。GHRSST 的成立旨在促進國際關注并協調新一代全球、多傳感器、高分辨率近實時SST 產品的開發,該小組匯集了國際航天機構、研究機構、大學和政府機構,總體目標是通過國際合作和科學創新,為短、中、十年的氣候時間尺度應用提供最優質的海面溫度數據。目前不同機構生成多種不同數據源、不同分辨率的海面溫度遙感數據產品,基本情況見表1。
海面鹽度衛星遙感數據主要來源于3 顆鹽度遙感衛星,分別為SMOS(Soil Moisture and Ocean Salinity,SMOS)、Aquarius 和SMAP(Soil Moisture Active and Passive),海洋鹽度遙感衛星及數據產品信息見表2。

表2 鹽度衛星信息表Table 2 Information of salinity satellite
受海洋物理過程約束,利用海洋表層遙感觀測數據反演次表層三維溫鹽場的傳統方法是一個復雜過程。機器學習方法在三維溫鹽場智能探測中的應用,為三維溫鹽場數據獲取提供了一種新的手段。用于三維溫鹽場智能探測的傳統機器學習方法主要有:支持向量機(Support Vector Machine,SVM)、支持向量回歸(Support Vector Regression,SVR)、隨機森林(Random Forest,RF)、基于提升樹的加法模型(XGBoost)和輕量級梯度提升機(Light Gradient Boosting Machine,LightGBM)等。
SU 等人[5]提出了一種支持向量機(SVM)方法,利用包括海面溫度異常(SSTA)、海面高度異常(SSHA)和海面鹽度異常(SSSA)等海洋表層遙感數據估計印度洋的次表層海水溫度異常(STA),ARGO STA 數據用于訓練和測試的現場觀測數據,結果表明SVM 很好地估計了印度洋上層1 000 m 的STA,除了SSTA 和SSHA 外,SSSA 也可以幫助探測和描述更深海洋的熱結構,并提高STA 估計的準確性。黎文娥等人[6]基于支持向量回歸(SVR)方法利用海面遙感觀測數據開展了海洋次表層海水溫度異常(STA)反演研究,該反演最優選取海面高度異常(SSHA)、海面溫度異常(SSTA)、海面鹽度異常(SSSA)和海面風速異常(SSWA)等海面遙感觀測數據的組合,利用ARGO數據進行結果精度驗證,研究表明SVR 模型可準確估算全球海洋1 000 m 以淺的STA。SU 等人[7]提出了一種基于隨機森林(RF)的機器學習方法,從多源衛星觀測數據中反演全球水下0~1 000 m 的溫度異常(STA),研究使用2010年全球海洋的月均海面高度異常(SSHA)、海面溫度異常(SSTA)、海面鹽度異常(SSSA)和海面風速異常(SSWA),使用ARGO 數據作為目標值來對RF 模型進行訓練和測試,反演不同深度的海水溫度異常。實驗結果表明,RF 可以準確反演全球海洋海水溫度異常,反演結果隨深度增加到500 m 后精度逐漸下降,與支持向量回歸(SVR)方法相比,RF 方法更準確。
SU 等人[8]基于極限梯度增強(XGBoost)提出了一種用于全球海洋上層2 000 m 的次表層海水溫鹽異常的反演模型,該模型使用海面衛星觀測和現場ARGO 數據進行估計,研究結果表明所提出的XGBoost 模型能夠反演海水溫鹽異常,且反演結果優于梯度增強決策樹模型,從反演結果中發現上層(0~500 m)海水溫鹽異常表現出明顯的季節變化信號且隨深度增加而變弱,不同季節模型性能存在差異,海面風速異常對海水溫鹽異常估計的貢獻大于其他表面參數。張天一等人[9]利用LightGBM 算法結合隨機森林方法開展了全球海洋次表層(0~1 000 m)海水溫度異常(STA)與鹽度異常(SSA)的重構研究,研究以海面遙感數據(海面高度異常(SSHA)、海面溫度異常(SSTA)、海面鹽度異常(SSSA)和海面風速異常(USSWA、VSSWA)并結合位置信息作為重構輸入變量,使用ARGO 次表層溫鹽數據作為模型訓練與測試數據,開展了不同模型輸入參數組合研究,結果表明經緯度位置信息在STA 和SSA 重構中發揮不同的作用,單時相和時序預測STA 中經緯度信息對模型的貢獻隨著深度的增加逐漸增大,該研究發現LightGBM 較隨機森林精度更高魯棒性更強。湯貴艷等人[10]提出一種融合高斯混合模型和輕量級梯度提升機(LightGBM)算法的海洋次表層溫度反演模型,利用2005-2018年的月均海面溫度、海面鹽度、海面高度和海面風速等遙感數據和ARGO 數據反演了印度洋海域的次表層海水溫度,結果表明所提出的模型可以準確反演印度洋海域的海水溫度分布特征和季節變化規律,采用所有海表參數的模型反演結果最好,反演結果優于極限梯度增強模型(XGBoost)。
綜合比較傳統機器學習方法的研究結果發現,模型輸入增加海面風速數據會略微提升三維溫鹽場的反演精度,加入經緯度信息也會提升反演精度;SVM、SVR 和RF 都可用于0~1 000 m 的三維溫鹽場重構,SVM 和SVR 反演結果類似,RF 模型反演結果稍優于SVR,LightGBM 模型的反演結果優于RF 和XGBoost。
除了常用的傳統機器學習方法已用于基于海洋表層遙感數據的三維溫鹽場智能探測外,已有研究基于聚類方法和BP 神經網絡、廣義回歸神經網絡等常規神經網絡開展了三維溫鹽場智能探測研究。
LU 等人[11]使用預聚類過程和神經網絡(NN)方法,利用全球海洋海面溫度、海面高度和海面風速觀測數據來探測海水溫度異常,月均ARGO 網格數據用于模型訓練與驗證,在大時間范圍(2004-2010年)和深度(0~1 900 m)內進行了測試,結果表明預聚類的神經網絡方法比沒有聚類的相同方法更好,也優于聚類線性回歸器和隨機森林方法。WANG 等人[12]基于多源海面遙感數據(海面溫度、海面鹽度、海面高度和海面風速),利用人工神經網絡(ANN)反演0~2 000 m 的海洋水下溫度場,分別選取2005-2015年和2016年的網格化月平均數據作為訓練集和測試集,研究發現海洋上層(0~200 m)存在明顯的季節變化信號且隨深度增加而逐漸減弱,同時比較發現ANN 模型精度高于隨機森林、MLR 和XGBoost。CHENG 等人[13]利用一種反向傳播神經網絡(BPNN)方法,通過選擇衛星觀測海面參數的最佳組合來反演北太平洋的次表層海水溫度,該研究除海面高度(SSH)、海面溫度(SST)、海面鹽度(SSS)和海面風速(SSW)外,還引入海面速度(SSV)作為新的參量,結果表明BPNN 模型可以準確地估計北太平洋1 000 m 以上的海水溫度,SSV 的輸入對BPNN 模型具有積極影響,并有助于提高估計的準確性。CHEN 等人[14]針對直接同化衛星觀測數據對數值模型次表層結構約束不足的問題,使用間接同化方法建立了一個三維溫鹽重建模型,該模型首先使用廣義回歸神經網絡與果蠅優化算法(FOAGRNN)合成T/S 剖面,然后利用增量強約束四維變分同化算法將合成的T/S 剖面同化到區域海洋模式系統(ROMS)中,實驗結果表明間接同化后的溫度和鹽度均方根誤差相對于直接同化分別降低26.0%和23.1%。聶旺琛等人[15]利用果蠅優化廣義回歸神經網絡算法(FOAGRNN)構建了海面溫度、海面鹽度、海面高度與次表層溫鹽場之間的投影關系模型,并在全球范圍使用SODA 和衛星遙感數據評估了模型的應用性能,2016年SODA 海面數據的理想全球重構試驗的溫鹽平均均方根誤差分別為0.36 ℃和0.08‰,衛星觀測海面數據的應用重構試驗結果與ARGO 剖面比較的溫鹽平均均方根誤差分別為0.79 ℃和0.16‰,重構溫度RMSE 從海面向下迅速增大,至100 m 達到峰值1.35 ℃后又迅速回落,躍層往下不斷減小,重構鹽度RMSE 基本隨深度增大而減小。
已開展的常規神經網絡三維溫鹽場智能探測主要針對全球或北太平洋海域,使用的海面遙感數據與第2 節介紹的一致,個別研究增加了海面流速數據后探測精度有所提高,總體海水溫度智能探測結果的均方根誤差為0.3~0.8 ℃左右。
隨著深度學習神經網絡模型與方法的不斷發展,海洋科學研究和數據處理中也廣泛應用了深度學習人工智能技術。次表層水下三維溫鹽場智能探測使用的深度學習方法有:卷積神經網絡(Convolutional Neural Networks,CNN)、生成對抗神經網絡(Generative Adversarial Networks,GAN)、長短時記憶網絡(Long Short-Term Memory,LSTM)、自組織映射(Self-Organizing Map,SOM)神經網絡以及將不同神經網絡相結合的組合網絡模型等。下面按照神經網絡分類綜述次表層三維溫鹽場智能探測研究進展。
CNN 是一類包含卷積計算且具有深度結構的前饋神經網絡,是一種多層的監督學習神經網絡,一般由卷積層、池化層、全連接層和激活函數組成,隱藏層的卷積層和池化層是實現卷積神經網絡的核心模塊。CNN 主要應用于計算機視覺和自然語言處理等領域,目前在三維溫鹽場智能探測方面也得到了較多應用。圖2 是CNN 模型三維溫鹽場智能探測流程的示意圖。
近年來已開展較多基于CNN 的三維溫鹽場智能探測研究。HAN 等人[16]提出了一種基于海面溫度、海面高度和海面鹽度數據預測次表層海水溫度的卷積神經網絡方法,建立了不同月份的CNN 模型用于預測和重建太平洋海洋次表面海水溫度,并與ARGO 現場數據進行比較驗證準確性,結果表明所建立的模型可以準確估計太平洋的海洋次表層溫度,平均均方誤差在0.26~0.52 ℃之間,研究發現0~300 m 海水溫度變化較大,所建立的模型在500 m 以下的深度預測準確性逐漸降低。SU 等人[17]基于CNN 模型提出了一種結合衛星遙感和剖面浮標觀測數據反演全球海洋0~1 000 m 高分辨率海水溫度場的方法,基于提出的方法將海水溫度場的空間分辨率從1°提高到0.25°,該研究分別基于單時間(2015年12月)建模和時間序列(2010年1月—2015年11月)的數據作為訓練數據集,2015年12月的數據作為測試數據集建模,分析了不同深度的反演結果,使用EN4 網格數據進行精度驗證,結果表明在大訓練樣本的情況下 CNN 優于LightGBM,平均均方根誤差為1.162℃,時間序列CNN 模型具有更高的精度且反演結果中包含更多尺度的動力過程。MENG 等人[18]基于CNN 模型開展了衛星觀測海面數據反演水下0~2 000 m 的不同深度溫度異常和鹽度異常的研究,提出了一種滑動區域方案從小區域估計網格點的水下溫鹽異常,將反演的溫鹽異常數據從ARGO 網格數據的水平分辨率1°提高到1/4°,使用的衛星海面觀測數據包括海面高度異常、海面溫度、海面鹽度和海面風速等數據。考慮到躍層存在對三維溫度預測精度會有很大影響,ZUO 等人[19]提出了立體時空四維卷積模型(SST-4D-CNN)來預測海水溫度,該模型充分考慮了時間序列和海洋空間關系以提高預測精度,該模型包括4D 卷積模塊、殘差模塊和重新校準模塊,其中4D 卷積模塊用于提取海洋時間和空間特征,重新校準模塊用于探索和量化各區域特征的貢獻以提高模型的質量,研究利用2016-2018年每日的西北太平洋海水溫度數據,預測了0~2 000 m 的緯向斷面和水平各層溫度,結果顯示SST-4D-CNN的準確率高于SVR、LSTM 以及3D-CNN 等模型。MENG 等人[20]基于多源衛星遙感觀測的海面高度異常、海面溫度、海面鹽度、海面風速數據和全球海洋再分析數據GLORYS12V1,提出了一種基于卷積神經網絡的海洋次表層溫鹽重構的深度學習方法,并開展了高分辨率(1/4)°和超高分辨率(1/12)°太平洋次表層海水溫度異常和海水鹽度異常重構,所提出的方法提高了從衛星觀測中估算海洋內部參數的分辨率和準確性,并且模型在更深的范圍也是可靠的。
CNN 雖然能夠更好地捕捉空間特征,但在卷積過程中不可避免地會丟失信息,這可能會丟失一些關鍵的細節特征,并導致重建精度降低。針對于此,MAO 等人[21]提出了一種基于雙路徑卷積神經網絡(DP-CNN)的智能方法,使用CMEMS 的月均再分析的海面溫度(SST)、海面鹽度(SSS)和海面高度(SSH)數據開展海洋溫鹽場重建研究,解決傳統CNN(卷積神經網絡)模型中細節信息丟失的問題,實驗結果表明DP-CNN 模型比CNN模型具有更高的重建精度,有效地減少了CNN 模型中詳細信息的損失。
作為經典深度學習方法,CNN 已在三維溫鹽場智能探測方面得到較多應用,已有研究使用的海面遙感數據同樣與第2 節介紹的相同,在考慮躍層影響和充分利用數據的時空特征方面嘗試對方法做了改進研究,因研究區域和使用數據的不同,不同研究結果得到的三維溫鹽場構建精度相差較大。
GAN 網絡是一種無監督學習算法,通過同時訓練2 個模型來實現捕捉訓練集分布的生成式模型、判別模型估計樣本來自訓練數據而非生成模型的概率。GAN 由2 個互相對抗的神經網絡組成,1個生成器和1 個判別器,它們彼此競爭推動整個模型學習。已有研究基于GAN 模型開展了次表層溫度場和鹽度場的預測。海洋內部溫度的預測通常是基于物理的數值模型或基于數據驅動的模型。數據驅動的預測模型其物理解釋性差且依賴訓練數據,泛化能力有限。MENG 等人[22]提出了一種基于生成對抗性網絡(GAN)和數值模型相結合來預測次表層溫度場的方法,該方法首先基于GAN 模型學習數值模型中海面溫度和次表層海水溫度間的簡化物理關系,然后使用ARGO 數據校準網絡模型參數以獲得更好的預測,該研究使用HYCOM 海洋再分析數據預訓練網絡模型,使用 ARGO 和OISST 數據微調部分網絡模型參數,并預測中國南海區域三維溫度場,結果顯示所提出的網絡框架有效地利用了數值模型和神經網絡的優點,提出的網絡模型性能優于PGsim、PGNN 和PGConvLSTM等模型,三維溫度場的均方根誤差為0.9~1.2 ℃。針對傳統海洋次表層海水鹽度重建方法經常受到附加約束、先驗物理假設和特定回歸系數等因素的影響,ZHANG 等人[23]提出了一種基于生成對抗網絡(GAN)的深度學習框架,從純數據驅動的角度直接構建近實時、高分辨率的每日三維海洋表層以下2~200 m(分為12 層)海水鹽度數據集;實驗使用HYCOM 再分析數據,在中國邊緣海域設計了一個原始3D-GAN 模型以及在此基礎上加入殘差結構、初始化結構和同時加入殘差及初始化結構的另外3 個3D-GAN 模型,研究結果表明加入殘差和初始化結構的3D-GAN 網絡模型性能最優,平均均方根誤差為0.135 psu,整體性能超過傳統的MODAS 模型。
基于GAN 網絡的水下三維溫鹽場智能探測研究較少,已有研究實現了對每日三維溫鹽場的智能探測,這是相對于其他智能方法最大的優勢,但目前研究探測的水深在200 m 以內。
LSTM 網絡是一種循環神經網絡的特殊形式,通過門單元的邏輯控制決定數據是否更新或丟棄,克服了循環神經網路權重影響太大、容易產生梯度消失和爆炸的問題。LSTM 包含遺忘門、輸入門和輸出門,遺忘門用于選擇性地遺忘之前的信息,輸入門決定新輸入的信息中哪些將被保留,并更新神經元狀態。輸出門使用更新后的神經元狀態和tanh激活函數更新隱藏狀態,隱藏狀態在每個時間步作為模型的輸出。LSTM 模型已廣泛應用到海洋次表層三維溫鹽場智能探測研究中了,具體應用流程如圖3所示。
使用衛星遙感數據大規模探測和預測海洋次表層溫度和鹽度結構是一項極具挑戰的任務。經典的機器學習方法難以顧及海洋數據的空間和時間序列特征,循環神經網絡的LSTM 模型已被廣泛應用于基于表層遙感的次表層水下三維溫鹽場重構研究。SU 等人[24]提出了一種基于雙向長短期記憶神經網絡(Bi-LSTM)的次表層溫躍層結構預測模型,該模型基于月均海面遙感數據(海面溫度異常、海面高度異常、海面鹽度異常、海面風速異常)、經緯度信息和ARGO 網格數據,預測全球海洋次表層海水溫度和鹽度異常,該研究測試了不同表層輸入參數組合下的精度,預測結果與ARMOR3D數據集具有較好的吻合度,研究結果表明更多輸入變量有利于提高網絡性能。
除了常規LSTM 網絡外,卷積LSTM 模型被廣泛應用到三維溫鹽場智能探測研究中。XIAO 等人[25]提出了一種卷積LSTM 模型用于預測長時間序列海洋內部溫度,基于BOA-ARGO 數據重構了南太平洋1年的海洋內部溫度,結果表明所提出模型在所有測試樣本和所有深度層的表現上均優于AdaBoost 模型和BPNN 模型,這表明所提出的網絡模型能夠較好地長期預測月均三維海洋溫度場。SONG 等人[26]基于卷積長短期記憶神經網絡提出了一種利用海面衛星觀測(海面溫度、海面鹽度、海面高度和海面風速)和ARGO 數據反演2 000 m深度以內海洋次表層溫鹽場的方法,通過考慮海洋變化的顯著空間和時間相關性特征來提高反演模型的穩健性和可推廣性,結果表明海面溫度異常、海面鹽度異常、海面高度異常和海面風速異常是獲得準確次表層水下溫鹽場估計的有價值參數,該研究提出的方法優于經典的隨機森林和LSTM 方法。SU 等人[27]提出了一種基于卷積長短期記憶神經網絡的全球海洋次表層海水溫度重構方法,將多源遙感觀測數據與 ARGO 網格數據相結合,生成了1993-2020年2 000 m 以淺全球海洋次表層海水溫度數據,利用ARGO 網格數據、EN4-Profile 數據驗證反演結果,研究結果表明ConvLSTM 模型可以學習海洋觀測數據的時空特征,反演結果優于LighGBM 模型。
以往基于深度學習方法預測海水溫度只局限于一些孤立點的時間序列預測,沒有考慮它們的空間聯系,同時將CNN 與LSTM 相結合成為LSTM網絡應用的一個方向。ZHANG 等人[28-29]提出了一個多層卷積長短期記憶神經網絡(M-convLSTM)模型,使用2005-2017年ARGO 浮標標準全球1°網格月均數據預測太平洋三維海水溫度,輸入數據為預測月份前28 個月的歷史溫度數據。該模型包括CNN 和LSTM 的多層疊加,模型使用27 個深度層的輸入數據集來預測海面到2 000 m 深度的水平和垂直月均溫度變化,研究結果表明隨深度增加預測精度略有下降,預測結果精度高于CFCCLSTM 模型。SU 等人[30]基于XGBoost 和RFs 集成學習與Bi-LSTM 和CNN 深度學習方法,通過將多源衛星觀測海面高度、海面溫度、海面鹽度和海面風速數據和ARGO 現場數據相結合,開展了不同方法的次表層溫躍層智能提取研究,研究結果表明適用于小數據建模的集成學習算法能夠很好地提取單一時刻的次表層溫躍層結構,而適用于大數據建模的深度學習算法則能夠很好地預測時序次表層溫躍層結構。
基于 LSTM 模型的智能探測方法從傳統的LSTM 發展到BiLSTM、ConvLSTM 以及與CNN結合等,三維溫鹽場探測精度有所提高。
除了主流的CNN、GAN 和LSTM 模型外,也有部分研究使用了SOM、U-net 或其他深度學習模型。WU 等人[31]為了從遙感數據中估計次表層海水溫度異常,采用自組織映射(SOM)神經網絡,使用ARGO 網格月均海面溫度(SST)、海面高度(SSH)和海面鹽度(SSS)異常數據進行訓練,以2005-2010年的ARGO STA 數據為目標特征,根據海面遙感數據估計北大西洋不同深度的海水溫度異常(STA),研究結果表明墨西哥灣流區域的STA 估計從海面到700 m 與現場測量一致性良好,SOM 訓練過程中SSS 異常數據揭示了SSS 信息的重要性,同時該研究根據遙感 SST 和測高時間序列估計了1993-2004年北大西洋中緯度的STA 時間序列。針對海洋內部溫度場重構沒有足夠重視估計結果的不確定性的問題,CHEN 等人[32]將DERN 方法與EOF 方法相結合提出了DERN-EOF 方法,利用WOD18 全球溫鹽剖面數據重構三維溫度場,首先對溫度剖面數據進行EOF 分解以得到EOF 系數和向量,然后通過DERN 方法建立EOF 系數與SST、SLA 間的回歸關系;使用WOD18 溫度剖面數據建立海面和水下溫度場間的回歸數據庫。XIE 等人[33]針對高精度地預測南海內部三維溫度場這一難題,提出了一種注意力U-Net 網絡,根據衛星觀測到的海面溫度、海面高度異常、海面風速以及風應力旋度重建高時空分辨率的南海三維溫度場,海洋再分析數據SODA 用于模型的訓練和評估,研究結果表明注意力U-Net 模型在中國南海上層100 m 的海水溫度重建中表現良好。SUN 等人[34]設計了一個3D U-Net 模型來提取過去12 個月內次表層溫度場的時空相關性,嘗試預測未來12 個月太平洋及其周邊海洋0~400 m 的次表層溫度場,將3D U-Net與季節性樸素模型、M-ConvLSTM 模型和簡單的3D-CNN(S3D-CNN)進行比較,所提出的方法能夠比以往方法更準確地預測大多數深度的海水溫度。
其他深度學習方法和經典方法的組合使用在三維溫鹽場智能探測中也進行了應用,使用的海面遙感數據與前述研究一致,三維溫鹽場的反演精度也類似。
基于海洋表層衛星遙感觀測數據,結合深度學習方法對次表層三維溫鹽場進行智能探測已成為海洋學研究的前沿熱點之一,為獲取時空分辨率和精度更高的三維溫鹽場數據提供了一種新的途徑。近年來已開展了較多基于各種機器學習和深度學習方法的次表層三維溫鹽場智能探測研究,次表層三維溫鹽場探測在不同的研究中表述為三維溫鹽場反演、重構或重建,有時也表述為次表層海水溫度和鹽度預測。總結相關研究可以發現:
1)使用的海洋表層衛星遙感數據主要有海面高度、海面溫度、海面鹽度和海面風速等的網格數據,個別研究使用了海面流速或增加了經緯度位置信息。用于構建訓練數據集的現場數據主要是ARGO 浮標溫鹽剖面網格化數據,EN4 等數據集用于方法精度評估。為了突出相關參數的變化特征,大多研究采用的均為各變量相對于平均態的異常值,如海面高度異常、海面溫度異常、海面鹽度異常等智能反演次表層溫度異常和鹽度異常。
2)已有研究均是純數據驅動,采用的智能方法包括傳統機器學習、一般神經網絡和深度學習等方法,機器學習方法主要包括SVR、SVM、RF、XGBoost 和LightGBM 等,一般神經網絡方法有NN、BPNN 等,深度學習方法主要包括CNN、GAN、LSTM 等及其相互結合使用的組合模型。
3)次表層三維溫鹽場智能探測的最大水深一般為500 m、1 000 m,最大至2 000 m,智能探測的三維溫鹽場絕大部分為月均數據,大多智能探測是按水深分層分別建立模型,探測結果在躍層和深海區域誤差較大。已有研究中各種智能探測方法的三維溫鹽場探測精度相差較大,三維海水溫度場最優可達0.02 ℃,一般為0.3~1.7 ℃左右;三維海水鹽度場最優達0.025 psu,不同研究差異較大的原因可能與使用的月均數據、研究區域和研究時間段的不同有關。
目前已開展的次表層三維溫鹽場智能探測都是基于網格化的海洋表層遙感數據,未使用原始遙感數據,而原始遙感數據網格化處理會平滑掉部分高頻小尺度信號,現場觀測數據使用的是ARGO剖面溫鹽網格數據而不是真實的ARGO 剖面溫鹽數據,智能方法均為純數據驅動。未來該研究方向應從原始海面遙感和現場溫鹽剖面數據出發,結合海水運動的動力和熱力學機制,發展物理機制約束下的次表層三維溫鹽場智能探測方法,實現基于表層遙感數據對每天或更高時間分辨率的次表層三維溫鹽場數據的同時獲取。