高 宇 李 爽 郝 鵬 宋金寶
基于ST-ConvLSTM的南海海表面CO2分壓的空間和時間序列預測*
高 宇 李 爽①郝 鵬 宋金寶
(浙江大學海洋學院 浙江舟山 316021)
海表面二氧化碳分壓(CO2)的未來變化趨勢, 對統計評估全球碳收支以及理解全球氣候變化背景下的海洋酸化現象至關重要。目前傳統的海面CO2預測方法大部分基于有限的實測數據, 然而實測數據存在著時間和地理方面的制約, 且計算成本較高。近年來, 隨著時空觀測數據的爆炸性增長, 基于深度學習的數據驅動模型在海表面CO2預測方面中表現出良好的潛力。然而, 由于多種環境因素與海表面CO2之間的關系錯綜復雜, 到目前為止尚無十分簡單有效的相關模型來對海表面CO2進行預測。為應對這一挑戰, 利用時空卷積長短時記憶神經網絡(ST-ConvLSTM)模型, 通過海面溫度(sea surface temperature, SST)、海面鹽度(sea surface salinity, SSS)、葉綠素濃度(chl)和海面CO2數據, 預測南海的海面CO2, 并將2019年1~12月的數據作為測試集對模型的表現進行了驗證。結果顯示, ST-ConvLSTM模型的預測因子均方根誤差、平均絕對誤差和決定系數分別為0.981 Pa、0.711 Pa和0.997。對比卷積LSTM (ConvLSTM)、隨機森林和廣義回歸神經網絡(generalized regression neural network, GRNN)三種方法, 證實本文所提出的方法在解決南海CO2預測問題上是可靠的。
ST-ConvLSTM模型; 中國南海; 海表面二氧化碳分壓; 深度學習
隨著過去幾十年內工業化的推進與發展, 大氣中二氧化碳等溫室氣體的含量急劇上升(Sabine, 2004; Le Quéré, 2009, 2010; Tyrrell, 2011; Ekwurzel, 2017; Wanninkhof, 2019), 伴隨著大氣中二氧化碳濃度的增加, 多組觀測數據顯示全球平均溫度總體呈現出上升的趨勢。根據美國國家航空航天局(NASA)的統計, 自1880年以來, 全球平均溫度上升了約1 °C, 而海洋作為一個重要的碳匯來吸收二氧化碳, 對全球碳循環以及氣候變化有重大的影響(Falkowski, 2000; Le Quéré, 2018; Rutgersson, 2011; Guemas, 2013)。如果海洋吸收二氧化碳的能力被削弱, 將可能加速大氣中二氧化碳水平的上升, 加速全球變暖的速度, 進而導致冰川融化、海平面上升、極端自然災害等一系列連鎖問題的出現。
海表二氧化碳分壓(CO2)作為全球變暖的重要指標之一, 指的是海洋表層水和大氣之間的二氧化碳交換處于動態平衡時CO2的含量, 海洋吸收了大約25%的人類排放的二氧化碳, 海表二氧化碳分壓的變化對于全球氣候和生態系統都具有重要影響(梁文浩, 2021)。大氣中的CO2和海面上的CO2之間的差異, 即ΔCO2, 決定了CO2氣體在海-氣界面的傳輸方向。此外,CO2作為海氣二氧化碳通量量化過程當中的重要物理量, 對研究全球碳循環具有重要的意義。然而, 大氣中的CO2變化很小, 呈現出相對穩定的狀態。因此, 海表面CO2對于分析海洋某一海域是否為大氣CO2的碳源還是碳匯具有十分重要的意義。據統計邊緣海的面積約占全球海洋總面積的10%, 而作為碳匯的海域可占全球海洋總面積的10%~25% (Borges, 2004; Cai, 2006)。陸架邊緣海作為連接大陸和海洋之間的紐帶, 是全球海洋碳循環系統的重要組成部分(Dai, 2004)。中國南海作為東南亞熱帶地區最大的邊緣海, 在當前全球氣候變化的背景下, 探索南海海表CO2的變化趨勢對分析和理解南海在區域碳收支方面的作用至關重要。除此之外, 南海的生化過程較為復雜, 海面溫度、鹽度和浮游植物初級生產力的變化都會對海面CO2產生重大影響(Tseng, 2005; Dai, 2009; Zhai, 2013)。此外, 海面CO2通常隨時間和區域的變化而變化, 具有明顯的時空變化特征, 這也給南海海面CO2的研究帶來了許多困難。
為了了解低緯度邊緣海域對大氣CO2濃度變化所做出的貢獻, 研究人員對南海的溫度、鹽度以及海表面CO2進行了多個航次的現場觀測研究, 對南海海表面CO2的時空變化特征有了較為清晰的認識(Thunell, 1992; Takahashi, 2009; Pfeil, 2013; 李騫, 2016; Li, 2020)。但是, 目前主要的海面CO2預測方法大多都是基于有限的實測資料, 而且這些資料所呈現的內容一般均會受到時間和空間的限制, 同時, 預測結果也會因所選研究方法的不同而呈現出很大的差異。鑒于衛星遙感技術在時空分辨率和覆蓋范圍上的進步, 以及衛星遙感海洋數據的廣泛使用, 衛星遙感已經成為預測海表面CO2的重要工具。越來越多的研究人員嘗試利用傳統的經驗回歸(即多元線性回歸、多元非線性回歸)、基于機器學習(即多層感知器神經網絡、自組織圖、廣義回歸神經網絡、隨機森林)以及主成分回歸、半分析法等經驗方法, 建立各大洋海表面CO2與海洋參數遙感衛星數據的相關性, 從而實現海面CO2的預測(Cosca, 2003; Lohrenz, 2010; Gregor, 2017; Fassbender, 2018; Chen, 2019; Reichstein, 2019; Fu, 2020; Krishna, 2020; Tu, 2021; Wang, 2021; Zhong, 2022)。
由于海洋生物地球化學和物理過程具有很強的非線性和動態性, 用上述方法預測海面CO2仍然是一項非常具有挑戰性的任務。隨著人工智能的發展, 深度學習(deep learning, DL)在海洋學領域的應用逐漸增多, 并有望成為從區域上升到全球進行研究的重要方法。可以為海面CO2的預測提供一種新方法。基于深度學習的預測模型并不事先明確給出物理規則, 而是讓模型在衛星遙感觀測數據上進行訓練, 模型通過從大量的訓練中學習, 從而深度學習模型可以弄清其固有的規則。以卷積神經網絡(convolutional neural network, CNN)為例, 研究者們利用歷史氣候和海洋環境數據來訓練CNN模型, 并對預測結果進行了評估, 研究發現, CNN模型可以準確地預測各種海洋要素的分布規律以及變化趨勢, 并且在噪聲數據的情況下也能夠保持較高的精度(郝瀅潔, 2017; 包興先等, 2021; 劉鵬等; 2021; 孫東洋等, 2021; 李凌霄, 2022)。另外, 遞歸神經網絡(recurrent neural network, RNN)也被用于建立海洋水溫要素的預測模型, 研究者們使用歷史數據來訓練RNN模型, 并通過不同的誤差函數來評估模型的性能。研究發現, RNN模型可以更準確地預測海洋水文要素, 并且能夠處理時序數據(朱貴重等, 2019; 覃夢嬌, 2021; 孟丁丁等, 2022)。此外, 人工智能的預測技術已經在各種預報和識別應用中取得了成功, 如降水、溫度、風速、海洋渦流、巨浪等方面(Shi, 2015; Wang, 2017a; Xiao, 2019; Xu, 2019; Li, 2021; Hao, 2022, 2023a, 2023b)。雖然研究人員在嘗試各種方法或建立模型方面做了很多努力, 但目前的工作(Sun, 2021; Wang, 2021; Gloege, 2022; Gregor, 2022; Joshi, 2022)大多仍集中在CO2的反演和重構上, 在利用衛星遙感數據預測海面CO2方面還存在一些問題。
海表面CO2的時空變化有兩個典型特征: 時空耦合性和地理相關性。時空耦合意味著海洋狀態的觀測數據同時具有時間和空間屬性。地理相關性是指觀測數據中存在鄰域效應, 即相鄰空間位置之間存在相關性。而如何同時考慮多維遙感衛星數據的時空耦合和地理相關特征, 進而深入全面地研究南海海表CO2的時空變化, 對準確預測南海碳匯能力至關重要。
本研究探索了一種新的深度學習方法(Wang, 2017b), 即時空卷積長短時記憶網絡(spatio-temporal convolutional long short-term memory, ST-ConvLSTM), 用于預測海表面CO2的時空變化, 以更準確地評估未來南海海面CO2的變化趨勢。本文利用SST、SSS、chl和海面CO2的衛星遙感數據, 通過對模型進行優化訓練, 在2019年1~12月的驗證數據集上對模型進行驗證。結果表明, 本文所采用的方法能夠較準確地預測南海海表面CO2的變化趨勢, 且各項性能指標也優于其他基準方法。
在本節中, 詳細介紹了ST-ConvLSTM架構的設計思路。該模型的整體流程如圖1所示。
對某一海域海面CO2的預測, 在本質上是一個時空序列預測問題, 以過去的時間序列數據為輸入, 以一定量的未來時間序列數據作為輸出。假設需要預測由行和列組成的×單元所代表的空間區域的海表面CO2, 網格中的每個單元可以映射個物理特征。

圖1 ST-ConvLSTM模型預測流程圖

在這項工作中, 每個時間步長是一個三維張量,= 4 (分別代表SSS、SST、chl和海面CO2), 網格大小為85×85。
深度學習的發展, 特別是遞歸神經網絡(RNN) (Zaremba, 2014)和長短期記憶模型(LSTM) (Hochreiter, 1997)的出現, 為時空預測提供了一些有益的解決方案。LSTM在以前的各種研究中已經證明了其在穩定性和長期依賴性方面的強大優勢, 時空長短時記憶網絡(spatio-temporal LSTM, ST-LSTM)作為一種特殊的RNN結構, 在LSTM各項優勢的基礎上更具備了良好的捕捉時空信息的能力。然而, 在預測海表面CO2的時空序列時, 涉及到時間和空間兩個維度。由于LSTM不能很好地捕捉空間信息, 而這一問題將導致空間特征信息的損失。

圖2 將二維圖像轉換為三維張量
注:表示行數,表示列數,表示物理特征量
針對上述LSTM存在的問題, 研究人員提出了卷積LSTM (convolutional long short-term memory, ConvLSTM)模型(Shi, 2015)。如圖3a所示, 輸入幀被送入ConvLSTM編碼器-解碼器網絡的第一層, 未來的預測序列在第四層被創建。在這個過程中, 隨著信息的逐層編碼, 隱藏狀態從下往上進行傳遞。然而, 這四層中的存儲單元是相互獨立的, 并且只在時域中不斷更新。在這種情況下, 如圖3a中的紅色和黃色方框所示, 底層將完全忽略頂層在前一個時間步驟中記憶的內容。

圖3 傳統的ConvLSTM架構(a)和 ST-ConvLSTM架構(b)
注: ConvLSTM表示卷積長短時記憶網絡(convolutional long short-term memory)

在本節中, 首先介紹了研究領域和本研究中使用的數據集的來源; 然后介紹了實驗中用于比較的指標和其他方法; 最后, 我們描述了實驗環境。
哥白尼計劃是歐盟的地球觀測計劃, 用于研究我們的地球及其環境, 提供來自全球衛星和陸基、機載和海洋測量系統的大量數據。本實驗中使用的所有詳細數據信息列于表1, 并基于長期氣候態的年際異常場的SST、SSS以及chl數據來計算CO2場。更詳細的數據信息可以通過以下鏈接訪問:
(1) https://data.marine.copernicus.eu/product/GLOBAL_ MULTIYEAR_BGC_001_029/description.
(2) https://data.marine.copernicus.eu/product/GLOBAL_ REANALYSIS_PHY_001_031/description.
表1 數據信息

Tab.1 Data specifications
我們使用以下三種措施來評估模型的性能。均方根誤差(RMS)、平均絕對誤差(MA)和決定系數(2)。公式(2)、(3)、(4)為上述三個指標的算法。



廣義遞歸神經網絡(generalized regression neural network, GRNN): 徑向基網絡的一種變形形式。GRNN的訓練過程相對簡單, 只需要將訓練數據輸入模型, 通過徑向基函數計算輸入變量與其對應樣本之間的距離, 并將結果反饋給模型進行參數更新。在訓練完成后, GRNN可以用于預測新的輸入數據。GRNN一般用于解決回歸問題, 而且沒有模型參數需要訓練。與其他神經網絡模型相比, GRNN的訓練速度較快, 且在小樣本問題上具有較好的表現。然而, 由于其采用的是非參數化方法, 因此在大數據集上的訓練會較慢, 且容易受到噪聲數據的影響。
隨機森林: 一種監督性學習算法。隨機森林非常簡單, 容易實現, 而且計算成本低。它在分類和回歸中表現出非常令人印象深刻的性能。隨機森林的訓練過程包括兩個階段: 隨機森林的構建和隨機森林的預測。而隨機森林在分類和回歸問題上都有廣泛的應用, 并且具有很好的性能表現。它可以有效地處理高維數據、缺失數據和非線性數據。同時, 由于隨機森林可以對特征的重要性進行評估, 因此它也被廣泛用于特征選擇和數據可視化。
ConvLSTM: LSTM的一個變種。LSTM用于解決時間序列的預測問題, 但LSTM不能很好地利用空間數據特征, 基于對LSTM的改進, ConvLSTM不僅可以建立類似LSTM的時間關系, 而且還具有類似卷積神經網絡的空間特征提取能力。與傳統的LSTM相比, ConvLSTM在輸入數據上使用卷積操作, 可以學習到更豐富的特征, 并保留了輸入數據的時空信息。同時, ConvLSTM的記憶單元也是通過卷積操作來實現的, 使得網絡可以在多個時間步長之間共享權重, 從而減少了網絡的參數數量。ConvLSTM在許多序列數據預測和生成任務中都表現出了很好的性能。它不僅可以處理靜態數據序列, 還可以處理包含動態過程和背景的時空序列, 并且可以捕捉到序列中的時空動態信息, 使得預測和生成結果更加準確。
所有的模型都是用Adam (Kingma, 2014)優化器進行訓練的, 起始學習率為10-3。訓練過程在10 000次迭代后停止, 所有的試驗都在NVIDIA 3060 GPU上進行, 并在Pytorch (Paszke, 2019)中實現。試驗中的其他詳細參數信息列于表2。
表2 參數設置

Tab.2 Parameters setup
本研究提出的方法可以實現端到端訓練, 整個計算過程不需要人工處理, 而是完全交給深度學習模型, 從學習原始數據到獲得結果。端到端訓練的優點是降低了計算處理的復雜性。在這項工作中, 首先, 將下載的NetCDF格式數據輸入到模型中, 將數據集分為訓練集(1993~2018年)和驗證集(2019年); 然后, 設置模型的參數, 對模型進行迭代訓練(10 000次), 通過記錄損失函數的值保存最優權重; 最后, 在驗證集上調用最優權重進行驗證, 輸出預測結果, 并輸出預測指標。
在本節中, 我們進行了多組試驗來評估每個模型對海面CO2的預測效果, 然后對結果進行分析和討論。
在本研究中, 采用ST-ConvLSTM模型來預測南海海表面CO2, 因為該模型可以更準確地計算出影響因素與目標變量之間的非線性關系, 而不需要明確知道函數依賴關系。SST和SSS作為與海洋環境變化高度相關的物理量, 被認為是海面CO2的最重要影響因素, 同樣, 以前的研究也表明, chl在海面CO2的生物活動中起著關鍵作用。
為了更直觀地顯示上述結論, 圖4顯示了1993~ 2019年期間研究區域內月平均SST、SSS、chl與海面CO2的相關性。在圖4中, 最接近1的色條值表示強正相關, 最接近-1的色條值表示強負相關。分析可知在大多數地區的SST與海面CO2有較強的正相關關系; 中國大陸沿海地區的SSS與海面CO2有負相關關系, 其他地區有正相關關系; chl與海面CO2有負相關關系。

圖4 SST(a)、SSS(b)、chl a (c)與海面pCO2的相關系數
當模型被訓練和驗證時, 數據集被分為兩組: 訓練集(1993~2018年)和驗證集(2019年)。RMS、MA和2被用來衡量海面CO2預測的準確性。圖5顯示了模型在訓練集和驗證集上的表現, 顏色表示數據密度。從圖6可以看出, 隨著迭代次數的增加, 雖然指標略有波動, 但總體而言, 模型在驗證集上的RMS和MA逐漸降低,2逐漸增加。
試驗過程中, 在保存模型的權重時采用的是最佳減重法, 模型會根據損失值自動保存最優權重。這樣做的目的是保證在模型訓練完成后, 得到的模型是訓練過程中的最優模型。
為了將ST-ConvLSTM與其他方法進行對比, 在同一訓練集和驗證集上進行了多組試驗, 以驗證不同方法在海面CO2預測中的性能, 并對試驗結果進行了分析和討論。基于不同方法在驗證集上的預測性能指標如表3所示。
從表3可以發現, 隨機森林模型對南海CO2的預測效果不佳, 其RMS、MA和2分別為3.612 Pa、4.419 Pa和-0.330, 誤差較大, 預測可靠性低。相比之下, GRNN預測南海海面CO2的性能指標RMS為2.964 Pa,MA為3.499 Pa, 與隨機森林相比有一定的提高;2作為衡量預測值與真實值的擬合程度的重要參數, 但GRNN模型的2指標僅為0.104, 仍然較低。此外, 兩種方法都存在著一定的其局限性: (1) 它們容易出現過擬合(在訓練集上預測效果較好, 但在驗證集上預測效果較差); (2) 它們忽略了數據時空關聯性的差異。

圖5 ST-ConvLSTM模型在預測南極洲海面的pCO2方面的表現
注: a: 訓練集; b: 驗證集;2為決定系數

注: a: 均方根誤差 b: 平均絕對誤差 c: 損失值 d: 決定系數
表3 模型性能對比

Tab.3 Model performance comparison
ConvLSTM模型將海面CO2預測定義為一個時空序列預測問題。為了更好地模擬時空關系, 它將FC-LSTM的思想擴展到ConvLSTM, 并通過堆疊多個ConvLSTM層形成編碼預測結構。用ConvLSTM模型預測南海海面CO2時, 其性能指標RMS為2.378 Pa,MA為2.011 Pa,2可以達到0.981, 高于GRNN和隨機森林兩種方法。通過改進ConvLSTM模型, ST- ConvLSTM模型對南海CO2的預測性能指標RMS和MA分別為0.981 Pa和0.711 Pa, 分別比ConvLSTM低58.8%和64.7%。
2019年1~12月不同方法的可視化預測結果如圖7~11所示, 它們分別為“Ground-Truth”、“ST-ConvLSTM”、“ConvLSTM”、“Random Forest”以及“GRNN”, 可以從圖中更直觀地看到模型的預測效果。“Ground Truth”代表輸入數據的真實值, 在時空預測學習中, 有兩個關鍵方面: 空間變化和時間變化。盡管ConvLSTM模型可以捕捉到數據的時空特征信息, 但在四層ConvLSTM結構中, 由于記憶單元是相互獨立的, 信息只在同層之間傳遞, 底層會完全忽略上一時間步長的頂層。從表3可以看出, 預測精度指標低于ST-ConvLSTM方法。改進后的ST-ConvLSTM方法解決了ConvLSTM模型的缺陷, 能夠充分把握多維遙感衛星數據的時空耦合和地理關聯特性, 能夠更準確地預測整個時期的海面CO2。

圖7 真實數據時空分布特征

圖8 ST-ConvLSTM模型結果時空分布特征

圖9 ConvLSTM模型結果時空分布特征

圖10 Random Forest模型結果時空分布特征

圖11 GRNN模型結果時空分布特征
隨機森林和GRNN這兩種方法忽略了數據在時間和空間尺度上的特征信息, 導致海面上的CO2預測值總是低于實際值。相關的研究工作試圖使用這兩種方法來反推局部地區的CO2。但在這項工作中不再僅僅考慮一個地點, 而是更多地考慮數據的時空變化信息來對未來的CO2變化進行合理預測。從圖10和圖11中也可以看出, 即使是在迭代預報的第一和第二個月, 誤差也很大, 預報的可靠性很低。
從以上結果分析得出, ST-ConvLSTM模型可以更準確地預測南海海面的CO2, 并且與其他方法相比, ST-ConvLSTM模型在預測中國南海海面的CO2方面顯示出很大的優勢。
本研究使用SST, SSS, chl和CO2的數據建立了基于ST-ConvLSTM的CO2預測模型, 并創建了南中國海面CO2與緯度和經度, 時間, 溫度, 鹽度和葉綠素的濃度之間的關系來預測南海海表CO2。該模型在訓練和驗證集上都表現出較好的結果。其中, 在驗證集中, ST-ConvLSTM模型的性能指標RMS、MA和2分別為0.981 Pa, 0.711 Pa和0.997。同時基于不同模型比較其他方法, 本研究中建立的模型在解決南海海表CO2預測問題方面具有很大的優勢。
ST-ConvLSTM模型為預測南海海表面CO2提供了良好的結果, 但它依然存在某些缺陷。一方面, 它像“黑匣子”一樣運行(Zhang, 2021), 輸入和輸出之間的運行機制不能清楚地了解, 并且很難清楚地解釋每個影響因素對海面CO2變化所帶來的影響。許多影響因素可能不會彼此獨立, 相反這些過程可能會共同起作用以產生對海面CO2變化的影響。使用ST-ConvLSTM模型預測南海海表的CO2具有廣泛的應用前景。這種基于AI的海面CO2的預測模型不僅可以應用于當前的研究區域, 還可以應用于其他海域當中。同時, 獲得更多衛星遙感數據, 進一步改善了ST-ConvLSTM模型預測海面長期CO2的能力, 并解釋了每個過程的相互作用機制也是未來的研究重點。
包興先, 范同軒, 張敬, 等, 2021. 基于卷積神經網絡的海洋平臺損傷識別實驗系統開發[J]. 實驗室研究與探索, 40(1): 49-52, 80.
戴民漢, 翟惟東, 魯中明, 等, 2004. 中國區域碳循環研究進展與展望[J]. 地球科學進展, 01:120-130.
郝瀅潔, 2017. 基于卷積神經網絡的海洋中尺度渦旋檢測算法研究[D]. 青島: 山東科技大學: 7-8.
李凌霄, 2022. 基于卷積神經網絡的海浪波高快速預報模型的設計與實現[D]. 濟南: 山東大學: 25-26.
李騫, 2016. 南海海表二氧化碳分壓及其影響過程分析——基于多年觀測結果[D]. 廈門: 廈門大學: 111-139.
梁文浩, 2021. 東海表層二氧化碳分壓及其海—氣界面二氧化碳通量的數值模擬研究[D]. 南京: 南京信息工程大學: 2-8.
劉鵬, 謝春華, 安文韜, 等, 2021. 卷積神經網絡在SAR遙感海島海岸帶地物信息提取中的應用綜述[J]. 海洋開發與管理, 38(8): 3-10.
孟丁丁, 陳曉東, 季順迎, 2022. 基于循環神經網絡的海冰彎曲強度預測分析[J]. 力學與實踐, 44(03): 580-589.
孫東洋, 劉輝, 張紀紅, 等, 2021. 基于深度卷積神經網絡的海洋牧場巖礁性生物圖像分類[J]. 海洋與湖沼, 52(5): 1160-1169.
覃夢嬌, 2021. 基于深度學習的海洋環境時空預測方法[D]. 杭州: 浙江大學: 45-48.
朱貴重, 胡松, 2019. 基于LSTM-RNN的海水表面溫度模型研究[J]. 應用海洋學學報, 38(2): 191-197.
BORGES A V, VANDERBORGHT J P, SCHIETTECATTE L S,, 2004. Variability of the gas transfer velocity of CO2in a macrotidal estuary (the Scheldt) [J]. Estuaries, 27(4): 593-603.
CAI W J, DAI M H, WANG Y C, 2006. Air‐sea exchange of carbon dioxide in ocean margins: A province‐based synthesis [J]. Geophysical Research Letters, 33(12): L12603.
CHEN S L, HU C M, BARNES B B,, 2019. A machine learning approach to estimate surface oceanCO2from satellite measurements [J]. Remote Sensing of Environment, 228: 203-226.
COSCA C E, FEELY R A, BOUTIN J,, 2003. Seasonal and interannual CO2fluxes for the central and eastern equatorial Pacific Ocean as determined from fCO2‐SST relationships [J]. Journal of Geophysical Research: Oceans, 108(C8): 3278.
DAI M H, LU Z M, ZHAI W D,, 2009. Diurnal variations of surface seawaterCO2in contrasting coastal environments [J]. Limnology and Oceanography, 54(3): 735-745.
EKWURZEL B, BONEHAM J, DALTON M W,, 2017. The rise in global atmospheric CO2, surface temperature, and sea level from emissions traced to major carbon producers [J]. Climatic Change, 144(4): 579-590.
FALKOWSKI P, SCHOLES R J, BOYLE E,, 2000. The global carbon cycle: a test of our knowledge of earth as a system [J]. Science, 290(5490): 291-296.
FASSBENDER A J, RODGERS K B, PALEVSKY H I,, 2018. Seasonal asymmetry in the evolution of surface oceanCO2and pH thermodynamic drivers and the influence on sea‐air CO2flux [J]. Global Biogeochemical Cycles, 32(10): 1476-1497.
FU Z Y, HU L S, CHEN Z D,, 2020. Estimating spatial and temporal variation in ocean surfaceCO2in the Gulf of Mexico using remote sensing and machine learning techniques [J]. Science of the Total Environment, 745: 140965.
GLOEGE L, YAN M, ZHENG T,, 2022. Improved quantification of ocean carbon uptake by using machine learning to merge global models andCO2data [J]. Journal of Advances in Modeling Earth Systems, 14(2): e2021MS002620.
GREGOR L, KOK S, MONTEIRO P M S, 2017. Empirical methods for the estimation of Southern Ocean CO2: support vector and random forest regression [J]. Biogeosciences, 14(23): 5551-5569.
GUEMAS V, DOBLAS-REYES F J, ANDREU-BURILLO I,, 2013. Retrospective prediction of the global warming slowdown in the past decade [J]. Nature Climate Change, 3(7): 649-653.
HAO P, LI S, GAO Y, 2023b. Significant wave height prediction based on deep learning in the South China Sea [J]. Frontiers in Marine Science, 9: 1113788.
HAO P, LI S, SONG J B,, 2023a. Prediction of sea surface temperature in the South China Sea based on deep learning [J]. Remote Sensing, 15(6): 1656.
HAO P, LI S, YU C C,, 2022. A prediction model of significant wave height in the South China Sea based on attention mechanism [J]. Frontiers in Marine Science, 9: 895212.
HOCHREITER S, SCHMIDHUBER J, 1997. Long short-term memory [J]. Neural Computation, 9(8): 1735-1780.
JOSHI A P, KUMAR V, WARRIOR H V, 2022. Modeling the sea-surfaceCO2of the central Bay of Bengal region using machine learning algorithms [J]. Ocean Modelling, 178: 102094.
KINGMA D P, BA J, 2014. Adam: A method for stochastic optimization [J]. arXiv preprint arXiv: 1412.6980.
KRISHNA K V, SHANMUGAM P, NAGAMANI P V, 2020. A multiparametric nonlinear regression approach for the estimation of global surface oceanCO2using satellite oceanographic data [J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 13: 6220-6235.
LE QUéRé C, ANDREW R M, FRIEDLINGSTEIN P,, 2018. Global carbon budget 2018 [J]. Earth System Science Data, 10(4): 2141-2194.
LE QUéRé C, RAUPACH M R, CANADELL J G,, 2009. Trends in the sources and sinks of carbon dioxide [J]. Nature Geoscience, 2(12): 831-836.
LE QUéRé C, TAKAHASHI T, BUITENHUIS E T,, 2010. Impact of climate change and variability on the global oceanic sink of CO2[J]. Global Biogeochemical Cycles, 24(4): GB4007.
LI Q, GUO X H, ZHAI W D,, 2020. Partial pressure of CO2and air-sea CO2fluxes in the South China Sea: Synthesis of an 18-year dataset [J]. Progress in Oceanography, 182: 102272.
LI S, HAO P, YU C C,, 2021. CLTS-Net: a more accurate and universal method for the long-term prediction of significant wave height [J]. Journal of Marine Science and Engineering, 9(12): 1464.
LOHRENZ S E, CAI W J, CHEN F Z,, 2010. Seasonal variability in air‐sea fluxes of CO2in a river‐influenced coastal margin [J]. Journal of Geophysical Research: Oceans, 115(C10): C10034.
PASZKE A, GROSS S, MASSA F,, 2019. PyTorch: An imperative style, high-performance deep learning library [C] // Proceedings of the 33rd International Conference on Neural Information Processing Systems. Vancouver, Canada: Curran Associates Inc.
PFEIL B, OLSEN A, BAKKER D C E,, 2013. A uniform, quality controlled Surface Ocean CO2Atlas (SOCAT) [J]. Earth System Science Data, 5(1): 125-143.
REICHSTEIN M, CAMPS-VALLS G, STEVENS B,, 2019. Deep learning and process understanding for data-driven Earth system science [J]. Nature, 566(7743): 195-204.
RUTGERSSON A, SMEDMAN A, SAHLéE E, 2011. Oceanic convective mixing and the impact on air‐sea gas transfer velocity [J]. Geophysical Research Letters, 38(2): L02602.
SABINE C L, FEELY R A, GRUBER N,, 2004. The oceanic sink for anthropogenic CO2[J]. Science, 305(5682): 367-371.
SHI X J, CHEN Z R, WANG H,, 2015. Convolutional LSTM network: A machine learning approach for precipitation nowcasting [C] // Proceedings of the 28th International Conference on Neural Information Processing Systems. Cambridge: MIT Press.
SUN H W, HE J Y, CHEN Y H,, 2021. Space-time sea surfaceCO2estimation in the North Atlantic based on CatBoost [J]. Remote Sensing, 13(14): 2805.
TAKAHASHI T, SUTHERLAND S C, WANNINKHOF R,, 2009. Climatological mean and decadal change in surface oceanCO2, and net sea–air CO2flux over the global oceans [J]. Deep Sea Research Part II: Topical Studies in Oceanography, 56(8-10): 554-577.
THUNELL R C, QINGMIN M, CALVERT S E,, 1992. Glacial‐Holocene biogenic sedimentation patterns in the South China Sea: Productivity variations and surface waterCO2[J]. Paleoceanography, 7(2): 143-162.
TSENG C M, WONG G T F, LIN I I,, 2005. A unique seasonal pattern in phytoplankton biomass in low‐latitude waters in the South China Sea [J]. Geophysical Research Letters, 32(8): L08608.
TU Z B, LE C F, BAI Y,, 2021. Increase in CO2uptake capacity in the Arctic Chukchi Sea during summer revealed by satellite‐based estimation [J]. Geophysical Research Letters, 48(15): e2021GL093844.
TYRRELL T, 2011. Anthropogenic modification of the oceans [J]. Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences, 369(1938): 887-908.
WANG H Z, LI G Q, WANG G B,, 2017a. Deep learning based ensemble approach for probabilistic wind power forecasting [J]. Applied Energy, 188: 56-70.
WANG Y B, LONG M S, WANG J M,, 2017b. PredRNN: Recurrent neural networks for predictive learning using spatiotemporal LSTMs [C] // Proceedings of the 31st International Conference on Neural Information Processing Systems. Red Hook: Curran Associates Inc.
WANG Y J, LI X F, SONG J M,, 2021. Carbon sinks and variations ofCO2in the Southern Ocean from 1998 to 2018 based on a deep learning approach [J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 14: 3495-3503.
WANNINKHOF R, PICKERS P A, OMAR A M,, 2019. A surface ocean CO2reference network, SOCONET and associated marine boundary layer CO2measurements [J]. Frontiers in Marine Science, 6: 400.
XIAO C J, CHEN N C, HU C L,, 2019. A spatiotemporal deep learning model for sea surface temperature field prediction using time-series satellite data [J]. Environmental Modelling & Software, 120: 104502.
XU G J, CHENG C, YANG W X,, 2019. Oceanic eddy identification using an AI scheme [J]. Remote Sensing, 11(11): 1349.
ZAREMBA W, SUTSKEVER I, VINYAIS O, 2014. Recurrent neural network regularization[J]. arXiv preprint arXiv: 1409.2329.
ZHAI W D, DAI M H, CHEN B S,, 2013. Seasonal variations of air-sea CO2fluxes in the largest tropical marginal sea (South China Sea) based on multiple-year underway measurements [J]. Biogeosciences Discussions, 10(4): 7031-7074.
ZHANG Y, TINO P, LEONARDIS A,, 2021. A survey on neural network interpretability [J]. IEEE Transactions on Emerging Topics in Computational Intelligence, 5(5): 726-742.
ZHONG G R, LI X G, SONG J M,, 2022. Reconstruction of global surface oceanCO2using region-specific predictors based on a stepwise FFNN regression algorithm[J]. Biogeosciences, 19(3): 845-859.
SPATIAL AND TEMPORAL PREDICTION OFCO2IN THE SOUTH CHINA SEA BASED ON ST-ConvLSTM
GAO Yu, LI Shuang, HAO Peng, SONG Jin-Bao
(Ocean College, Zhejiang University, Zhoushan 316021, China)
Understanding the future trends in the partial pressure of carbon dioxide (CO2) at sea surface is crucial to assess statistically the global carbon balance and ocean acidification in the context of global climate change. Most of the current traditional sea surfaceCO2prediction methods are based on limited real-world data, and require temporal and geographical constraints on the real-world data and high computational costs. In recent years, with the explosive growth of spatiotemporal observational data, data-driven models based on deep learning have shown good potential in sea surfaceCO2prediction. However, due to the complex relationship between multiple environmental factors and sea surfaceCO2, there is no simple and effective relevant model in this regard so far. We deveveloped a spatio-temporal convolutional long and short-term memory neural network (ST-ConvLSTM) model to predict sea surfaceCO2in the South China Sea from sea surface temperature (SST), sea surface salinity (SSS), chlorophyll a concentration (chl), and sea surfaceCO2data, and the model was validated using data from January to December 2019 as test set. Results show that the prediction factors, and Root Mean Square Error, Mean Absolute Error and Coefficient of Determination of the model are 0.981 Pa, 0.711 Pa, and 0.997, respectively. Among three methods of convolutional LSTM (ConvLSTM), random forest, and generalized regression neural network (GRNN), our method is most reliable in theCO2prediction in the South China Sea.
ST-ConvLSTM; the South China Sea; sea surfaceCO2prediction; deep learning
* 國家自然科學基金項目, 41830533號。高 宇, 碩士研究生, E-mail: gaoyu0211@zju.edu.cn
李 爽, 博士生導師, 副教授, E-mail: lshuang@zju.edu.cn
2023-03-30,
2023-06-13
P731.26
10.11693/hyhz20230300074