蔣松諭,何貞銘,周再文
(長江大學地球科學學院,湖北 武漢 430100)
隨著人類活動的加劇和社會的不斷發展,氣候變化帶來的影響越來越明顯,海平面不斷上升、颶風及干旱等直接或間接地影響著人類的生活,對人類健康、糧食安全和經濟穩定構成重大風險。如果能對氣溫做出準確預測,就可為農業、交通、能源、公共衛生及應急管理等領域帶來極大的便利。因此,挖掘氣溫變化的潛在規律,對于科學準確地預測氣溫變化具有重要意義。
如今,計算機技術的飛速發展和海量氣象數據的積累給氣溫預測帶來了新的可能,其中,較為廣泛使用的機器學習方法主要包括支持向量機(SVM)[1]、反向傳播神經網絡(BPNN)[2]、徑向基函數(RBF)[3]等,但這些方法在擬合非平穩、非線性的數據時表現欠佳。近些年,深度學習的方法快速進入時間序列預測領域,例如循環神經網絡(RNN)、長短期記憶神經網絡(LSTM)[4]和卷積神經網絡(CNN)等,但隨著對預測精度要求的不斷提高,單個模型逐漸無法滿足挖掘數據隱藏特征的需求,因此為了綜合各個模型的優點,越來越多的混合模型開始出現。例如,馬棟林等人[5]提出一種基于圖卷積網絡和門控循環單元的氣溫預測模型(GCN-GRU),更好地提取了氣溫變化的時空特征并獲得了較高的精度。陶曄等人[6]將隨機森林(RF)和LSTM 進行結合,在獲得較高精度的同時也獲得了較強的泛化性。陳嵐等人[7]將灰色關聯、卷積長短期記憶網絡和雙向長短期記憶網絡相結合,極大的增強了時空特征提取能力。雖然這些方法取得了越來越高的預測精度,但模型的復雜度和計算量也越來越龐大。氣溫作為一種隨時間明顯變化的天氣現象,具有非常強的時間相關性,尋找更好的方法提取其潛在的時間變化特征也是提高預測精度的關鍵。因此,該文結合信號處理領域的分析方法CEEMDAN 和更為先進的時間序列預測模型TCN,采用分解-集合的思想,選取氣象站點的日平均氣溫作為分析數據,以實現模型訓練和其短期預測。
自適應噪聲完備集合經驗模態分解(CEEMDAN)是一種基于經驗模態分解(EMD)改進的分解方法,可以將復雜的信號分解為多個具有不同尺度特征的本征模態(IMF),更容易提取數據中的潛在特征,其主要過程如下:
⑴將不同幅度的高斯白噪聲加到待分解信號得到新信號,對新信號EMD分解并平均得到第一個本征模態分量;
⑵計算去除第一個模態分量后的殘差,在殘差中加入正負成對高斯白噪聲得到新信號,以新信號為載體進行EMD分解,由此得到第二個本征模態分量;
⑶計算去除第二個模態分量后的殘差,重復上述步驟直至獲得殘差信號為單調函數,算法結束。
TCN 是一種新型的時間序列預測算法,其主要結構包含膨脹因果卷積和殘差模塊。TCN 的特點是可以并行計算,相較于LSTM 等模型具有訓練內存要求底和訓練速度更快等優點。當輸入一維序列x∈Rn,卷積核f:{0,…,k-1} →R,對該序列元素s經過膨脹因果卷積F的計算為:
其中,d為膨脹系數;k為卷積核大小;“*d”代表卷積運算。
TCN 中另一個核心模塊是殘差塊,可以有效解決網絡較深產生的梯度消失問題。假設x是殘差塊的輸入,殘差塊的輸出計算為:
其中,Activation()為激活函數,F(x)為殘差。
鯨魚優化算法是一種模仿座頭鯨捕獵方式的元啟發式優化算法。其迭代公式為:
其中,Xt是鯨魚位置向量,Xrand由當前鯨魚位置決定,隨著迭代,向量a從2 到0 線性減小,向量r在0 到1之間隨機變動,C為由向量r確定的系數矩陣,A是由a決定的系數矩陣。
開始迭代時,由于a向量值較大,|A|值將大于1,從而保證尋求最優解的可靠范圍;當 |A|值小于1 時,包圍獵物的過程開始,此時的計算公式為:
其中,為當前最佳位置,b為常數,用來確定鯨魚捕獵的螺旋路徑,L為螺旋系數;p是0到1之間的隨機數。
該文構建了一種用于氣溫預測的分解-集合模型CEEMDAN-WOA-TCN,圖1 顯示了模型的流程圖。首先對原始的氣溫數據進行分析和預處理,然后采用CEEMDAN 方法將數據分解為多個本征模態,對每個本征模態以均方誤差(MSE)作為適應度函數,采用WOA-TCN 進行訓練。隨著參數不斷更新,適應度函數的值也越來越小,由此得到最優的TCN 模型參數,使用最優模型參數進行預測即可得到每個IMF 的最優預測值,最后將所有預測值線性集合得到最終的預測結果。
本文選取了北京54511、上海58362 和廣州59287三個氣象觀測站點2001 年1 月1 日至2020 年12 月31日的日平均氣溫作為分析對象,數據均來自中國地面國際交換站氣候資料日值數據集(V3.0)。選取這三個氣象站點的原因在于它們都是我國的一線城市,在經濟發展與應對氣候變化方面具有引領作用,而且他們分別地處我國北部、中部和南部,在空間上具代表性,三個站點的基本信息和描述性統計如表1 所示。從表1可以看出,隨著維度的不斷升高,氣溫的最小值和均值也在逐漸上升,氣溫變化的標準差也越來越小。下面該文以北京54511 站點的氣溫數據為例,說明模型預測的基本過程。
為了更好地模擬氣溫變化的波動,保證數據的連續性,首先刪除數據中的極值,因為這些極值通常由觀測錯誤或儀器故障導致,然后再用插值重采樣的方式將數據缺失位置進行填充。由于氣溫不僅會隨著季節變化和早晚變化有明顯的周期性,還會受到重大事件或相關政策等的影響,所以接下來就要提取數據中不同尺度下的潛在信息,以此達到提高預測精度的目的。
CEEMDAN 作為一種分析復雜、非平穩和非線性數據的強大工具,具有自適應降噪和使用靈活等諸多優點。如圖2 所示,北京站點數據經過CEEMDAN 分解后,原始數據被分解為10 個本征模態。其中IMF-0到IMF-4 體現了氣溫在小尺度上的復雜變化,雖然不產生長期影響,但是伴隨著劇烈的波動,表現出高頻低幅的特征;IMF-5 到IMF-8 則反映了氣溫的季節性變化或外部環境、重大事件、相關政策影響產生的中長期變化;IMF-9作為趨勢項,描述了氣溫變化的整體性趨勢。經CEEMDAN 分解后,每個模態的數據閾值也隨著分解而變小,尤其是較難預測的高頻數據,這在一定程度上降低了較大誤差產生的可能。
針對分解后的10 個模態,本文采用帶有WOA 優化器的TCN 模型對其進行訓練和預測,選取TCN 中卷積層過濾器的數量、卷積核大小、殘差塊的堆棧數、兩個全連接層的神經元個數以及訓練次數六個參數進行優化。為了判別優化程度,選取MSE 作為整個優化過程的適應度函數。最后,由于電腦計算性能限制,設置鯨魚種群數量為5,最大迭代次數為10,通過不斷更新策略改變鯨魚的位置,得到TCN 的最優模型參數和結果。以其中一個模態數據為例,圖3 展示了IMF-5 在進行WOA 尋優過程中的適應度曲線變化。隨著迭代次數的增加,適應度函數值越來越小,對TCN 參數起到了很好的尋優效果。在進行TCN 模型訓練和預測過程中,為了防止梯度爆炸、梯度消失和過擬合現象的發生,在使用Adam 優化的同時,還引入學習率動態調整和早停機制,進一步提高模型訓練的效率。

圖3 北京站點IMF-5的WOA優化適應度曲線
經過上面的預測后,均已得到各個模態的預測結果,而由于CEEMDAN 是一種完全分解,分解后不存在殘差,所以將所有模態的結果線性集合即為最終的日平均氣溫預測結果。圖4展示了北京站點測試集單步預測下最終的預測效果。

圖4 北京站點測試集單步預測最終結果
為了評估模型的預測效果,本文采用了一些度量函數對結果進行評價,其中包括確定系數(R2),平均絕對誤差(MAE),均方根誤差(RMSE),它們的數學表達式如式⑺至⑼,其中,表示預測值,yi表示原始真實值,n是預測的總數,是原始值的平均值。
為了驗證所提出模型的可靠性,本文又建立了在時間序列預測中常用的LSTM 模型作為對比模型,并對CEEMDAN-WOA-TCN 進行消融實驗,分析每個模塊在預測模型中的重要作用,最終在三個氣象站點t+1 步、t+2 步和t+3 步上進行預測,并使用R2、MAE、RMSE作為評價指標,表2顯示了北京54511站點的評價結果,上海58362 站點和廣州59287 站點的評價結果如圖5和圖6的雷達圖所示。

圖5 上海站點相關模型精度評價雷達圖

圖6 廣州站點相關模型精度評價雷達圖
通過不同模型對各站點測試集的預測結果可以發現:①隨著預測步長逐漸增大,預測精度呈下降趨勢,這是由于時間序列步長越長,越不易捕捉之前時刻數據的相關性;②雖然LSTM 和TCN 兩種單個模型在預測精度上非常相近,但在實驗中TCN 的訓練時間會比LSTM 更短,效率更高,這與TCN 模型的并行運算有很大關系;③引入WOA 優化算法對TCN 模型參數優化后,其預測精度比未優化的單個模型有了一定程度的提高,表明WOA 優化算法的有效性;④采用CEEMDAN 分解方法,引入分解-集合的思想后,預測精度有了最為明顯的提升,表明分解-集合思想下CEEMDAN 在時間序列預測中具可靠性,是處理非平穩、非線性復雜數據的有力工具。
自從全世界齊心協力應對氣候變化問題以來,雖然當前氣候已經發生了一些積極的變化,但這依然是一個長期的問題,未來仍有可能面臨更大的挑戰。如果能對氣溫變化進行較為準確的預測,將對各個領域產生很大的影響,作為重要的輔助決策依據。本文采用Python3.6 及各個模塊,提出了一種CEEMDANWOA-TCN 氣溫預測模型,通過CEEMDAN 對原始數據的有效分解和TCN 模型的高效預測,獲得了相比單個模型更小的預測誤差。本文在預測過程中只考慮了單個站點和日平均氣溫單個變量,在接下來的工作中,將考慮多個站點之間的空間位置關系和其他氣象要素對氣溫的影響,進一步提高預測的準確性。