屠澤杰,邢喆,辛明真,樊妙,卜憲海,孫毅
(1.山東科技大學 測繪科學與工程學院,山東 青島 266590;2.國家海洋信息中心,天津 300171)
潮汐是海洋活動中最為顯著的動力現象,也是影響海洋經濟活動的重要因素。實時精準的水位預報能為大型船舶進出港口、潛水作業提供安全保障,同時也為航運編制提供決策依據。此外,利用水位變化較強的空間相關性,精準的水位預報能減少驗潮站布設數量、擴大預報范圍,從而節省成本支出。目前,調和分析法在水位預報中有著廣泛的應用,其原理是通過天文分潮調和常數回報潮位,以此產生了諸如潮汐表、區域潮汐模型(許軍等,2017)等潮汐預報工具。在生產應用中,潮汐表的預測精度較低(20~30 cm),而區域潮汐模型的構建需要大量的長期驗潮站資料和測區地形資料,增加了工程的實施難度。因此,高精度、易實施的實時水位預報模型在海洋工程中有著迫切需求。
在水位預報中,潮位是滿足潮汐(潮波)規律的部分,而由環境因素引起的余水位(水位異常)會使水位具有非確定性和時變性(方國洪 等,1986),其預測難點在于無法量化諸如風、氣壓、降水等短周期氣象因素以及季節性氣候因素引起的增減水,這是制約傳統水位預報模型精度的主要原因,為此,許多學者展開了研究分析。裴文斌等(2007)分析了相鄰驗潮站余水位的相關性,提出了差分方法,完成了兩站間的余水位傳遞,但并未實現余水位的預報。孫美仙等(2014)利用余水位分布特征進行統計分析,實現了余水位的短期預報,但僅從統計意義上的分析無法給出余水位變化規律的物理機制,因此具有一定的局限性。
隨著人工智能的發展,神經網絡、模糊邏輯推理也逐步應用到海洋水文要素預報中。李燕初等(2012)采用混沌理論提高了短期水位預報的精度。胡繼洋等(2006)將多年的驗潮站數據進行BP 神經網絡訓練,證實了神經網絡在水位預測中的可行性。薛明等(2019)比較了不同因子輸入的多種神經網絡模型,在臺風型風暴潮水位的短期預測中獲得了較好的預測效果。但是上述研究將水位或余水位序列作為整體去進行分析計算,會掩蓋不同成因所引起的變化規律,這是因為部分信號在一定的時間尺度下是接近平穩的。經驗模態分解(FMD)是處理非平穩信號的方法,能將信號中存在的不同尺度波動逐級分解出來。Pan 等(2018)利用該方法成功地捕獲了全日分潮、半日分潮和其他非平穩特征。張存勇等(2013)對連云港近岸海域的余水位數據進行FMD 分解,認為在該區域風和氣壓是導致余水位變化的主要因素。然而,使用FMD 對復雜的非平穩信號進行分解,會造成嚴重的模態混疊現象(Wu et al,2009)。集合經驗模態(FFMD)是FMD 的改進算法,能有效地減少FMD 中出現的模態混疊現象。
目前,FFMD 多用于對非平穩信號的分析,但在余水位預報方面應用較少,若能通過FFMD 完成對BP 網絡中余水位樣本數據的優化,就能有效提高BP 網絡模型的逼近和預測能力。基于上述分析,本文利用FFMD-BP 組合模型,從余水位序列中分離出平穩特征和非平穩特征,通過BP 網絡訓練和預測,以期提高余水位的短期預報精度。
為了解余水位的成分和變化規律,首先應對實測水位數據進行調和分析,用實測水位數據與天文潮回報的潮位之差作為余水位序列。由于復雜無序的余水位序列不利于網絡學習和預報,需通過集合經驗模態法進行分解,進而獲得有限個本征模函數(IMF)和一個剩余分量。FFT 變換后的IMF 分量頻譜特征有助于分析余水位的成因和變換規律。最后,通過BP 神經網絡對這些分量進行訓練并向后預報24 h,各分量的預測結果之和即為余水位的預測值,具體流程見圖1。

圖1 實驗流程圖
經驗模態分解(Fmpirical Mode Decomposition,FMD)是一種處理非平穩信號的方法,它基于信號局部特征尺度進行分解,無須預先設定基函數,可以將時域內的任意復雜信號分解為互不相同、有限的信號分量,每個分量稱為一個本征模函數(Intrinsic Mode Function,IMF) (Huang et al,1998)。FMD 分解是在時域展開,分量的振幅和頻率隨時間而變化,這對于后續余水位的預測工作是有利的。由于FMD 分解存在著模態混疊問題,產生了FMD 的改進算法—集合經驗模態分解(Fnsemble Fmpirical Mode Decomposition,FFMD)。利用高斯白噪聲頻譜均勻分布的特性,在待分解信號中加入高斯白噪聲,從而改變原序列的極值點分布,將每次獲得的IMF 分量做平均處理后作為最終結果,具體步驟如下:
①初始化高斯白噪聲序列的幅值為ξe,次數為N。
②在原始信號x(t)中加入該噪聲序列ni(t),則:

③設a(t)和b(t)分別為xi(t)的極大值和極小值擬合成的包絡線。則兩條包絡線的均值c1(t)可以表示為:

④若hi1(t)滿足如下兩個條件:在整個數據集里,極值點的數目與穿過零點的數目必須相等或者最多相差1 個;由局部極大值所構成的包絡線以及由局部極小值所構成的包絡線的均值為零。若不滿足則將hi1(t)當作原始時間序列,重復上述過程,經過k 次篩選后,直至其滿足給定的閾值Sd:

此時得到h1k(t)即為IMFi1(t),剩余信號r1(t)為:

⑤對r1(t)重復③~④步驟,直至n 次分解后rn(t)為單調函數時停止。
⑥此時,得到i 個IMF 分量和1 個剩余分量ri(t),即:

⑦重復上述步驟N 次,將對應的IMF 分量總體取平均值,則最終IMF 分量和剩余分量為:

于是,原始信號經FFMD 分解后可表示為:

BP 神經網絡是一種多層前向神經網絡,包含輸入層、輸出層和若干個隱藏層,具有較強的非線性映射能力和自學習自泛化能力。數學理論證明三層的神經網絡就能夠以任意精度逼近任何非線性連續函數。圖3 是典型的單隱含層BP 網絡,圖中x是輸入神經元,K 是隱含層神經元,Y 是輸出層神經元。從xm到Ki的連接權值為ωmi,從Ki到Yj的連接權值為ωij。

圖2 單隱含層BP 神經網絡
假設x(t)余水位信號由頻率為25、50、100 的正弦函數和高斯白噪聲a(t)簡單構成:

對該余水位序列x(t)進行FFMD 分解,取ξe=0.2,N=100。圖3(a)是余水位仿真信號經FFMD分解后的IMF 分量圖。原始信號被分解成了8 個IMF 分量和1 個剩余分量。不難發現,FFMD 從原始信號中成功捕獲了3 個規律性的IMF 分量,通過FFT 變換后(圖3(b)),驗證其為頻率100、50
為探究BP 神經網絡對不同IMF 分量的預測效果,本文選取平穩特征分量IMF2、非平穩特征分量IMF1 及IMF5 進行預測??紤]到IMF 分量中存在模態混疊問題,需對不同頻率組成的重構函數進行預測,其中:和25 的正弦函數,而高斯白噪聲則被分解成了其余5 個分量。RFS 為剩余分量,代表余水位整體變化趨勢。

圖3 EEMD 分解效果圖


圖4 BP 網絡對不同IMF 分量的預測效果
使用300 個仿真數據序列作為樣本,向后預報100 個序列,結果如圖4 所示??梢钥吹?,平穩特征分量的預測效果十分顯著,而非平穩特征分量的預測誤差隨著預報時長的增長逐漸累積,但整體變化趨勢與真值基本一致,且在短期內達到了較好的預報效果,驗證了該組合模型在短期預報中的可行性。
采用均方根誤差(rootmeansquareerror,RMSF)和平均絕對誤差(mean absolute error,MAF)來評定余水位預測結果的精度。

式中,Hi表示余水位觀測值,Hi.model表示模型預測值,n 表示待預測的余水位觀測值個數。
哥倫比亞河是美國第三大河,年平均流量約為7 500 m3·s-1,流域面積約為660 500 km2(Jay et al,1997),其潮汐具有全日潮和半日潮的混合特征(Jay et al,2011),天然徑流主要來自降雪,汛期集中在4-7 月,河道內建有多個水電站(J.W.弗格森等,2012)。下游河口處的水位日變化范圍為1.7 ~3.6 m,在Astoria 站 處 最 大 可 達2.0 ~4.0 m(Moftakhari et al,2016)。本文選取了哥倫比亞河下游河口處三個驗潮站(圖5):Astoria 站、Skamokawa 站以及Wauna 站兩年(2017 年1 月1日-2018 年12 月31 日)的逐時水位數據。水位數據來源于美國國家海洋和大氣管理局(NOAA)。

圖5 驗潮站位置概略圖
采用開源潮汐分析軟件T_tide(Pawlowicz et al,2002) 對各站兩年的水位數據進行調和分析,在95 %置信區間下,獲得包含半日分潮、全日潮、淺水分潮和長周期分潮在內的68 個分潮,并計算了后報潮位與原始水位數據的方差比,如表1 所示,基本消除了原始水位中潮位的影響。將水位觀測數據與天文分潮后報的潮位數據之差作為余水位,如圖6 所示。

表1 各站T_tide 調和分析結果
哥倫比亞河有兩個較強的河水流量調節期(Kukulka et al,2003),其中河水最大流量發生在5 月-7 月,主要是由于盆地內部的積雪消融所引起。11 月至次年3 月河水會有短暫的高流量,這是由于西部盆地出現了強烈的熱風暴,引起強降雨和融雪,因此河水流量會在幾天或幾周的時間尺度上發生較強波動。從各站的余水位變化趨勢上看,大致符合上述兩個時間窗口,且各站余水位變化趨勢大致相同,說明了余水位在復雜的河口地區仍具有較強的空間相關性。

圖6 哥倫比亞河下游Astoria 等站2017-2018 年逐時余水位
相比于開闊海域,河口處的余水位成因更為復雜,它是非線性的正壓海潮、地形、水流和其他因素相互作用的結果(Godin,1985)。對Astoria 站的余水位進行FFMD 分解,得到了13 個IMF 分量和1 個剩余分量(圖7(a))。采用FFT 變換對13個IMF 分量進行傅立葉頻譜分析。從圖7(b)中可以看到,雖然FFMD 能夠有效抑制模態混疊現象,但是并不能完全分離不同頻率的模態。與IMF2 分量相比,IMF1 分量除了具有半日潮的特征外,還混疊有周期為2.5~12.5 h 的高頻信號。除氣象因素外,主要是由于河口處受到海底地形摩擦力影響導致潮波變形,從而使分潮相互作用形成倍潮和復合潮;此外,就潮汐本身而言,通過調和分析展開的淺水分潮數量受限于水位觀測時長,很難用有限數目的淺水分潮來體現總的淺水效應(方國洪,1981)。表2 顯示了除IMF1 外的12 個分量的主頻率和振幅。IMF3 和IMF4 雖然具有相同的主頻率,但具有不同的振幅,顯示了FFMD 在處理模態混疊問題上的優勢。IMF2 的周期對應半日分潮周期變化;IMF3、IMF4 的周期對應全日分潮周期變化;IMF11 的周期對應Sa 分潮周期變化。上述IMF 分量存在著近似潮汐周期特征的原因有三點,第一點是由于天文潮和風暴潮的非線性耦合作用會導致信號疊加(馮士筰,1982);第二點是由于氣候、天氣變化以及人為因素造成的偽周期信號;第三點則是由于在調和分析中存在天文潮推算誤差(牛桂芝等,2009)。不可忽視的是,在河口地區余水位存在著較強的季節性和年度變化,IMF5、IMF6 的周期對應余水位的多日變化;IMF7 至IMF10 的周期對應余水位的季節性變化;由于受到水位數據長度限制,IMF12、IMF13 分量實際上可能對應余水位的多年變化;最后的剩余分量顯示了余水位的變化趨勢。

圖7 Astoria 站余水位EEMD 分解效果圖

表2 Astoria 站12 個IMF 分量的主頻率和振幅

表3 Skamokawa 和Wauna 站EEMD 分解結果與Astoria 站對應IMF 分量的皮爾遜相關系數
Skamokawa 和Wauna 站的IMF 分量與Astoria站對應IMF 分量的皮爾遜相關系數見表3。Wauna站相比Skamokawa 站的皮爾遜相關系數略低,但兩站的IMF2-IMF13 分量均與Astoria 站表現出了顯著的相關性,說明引起上述IMF 分量變化的因素是伴隨整個站區的,且隨著空間距離的增大而逐漸減弱。由于IMF1 是淺水分潮產生的復雜混疊信號,而淺水分潮的激發機制主要是海底摩擦力潮波形變以及各分潮引起的非線性耦合,不具有較強的空間相關性。因此,三站在IMF1 分量上的相關性較差。
本文使用樣本前24 個數據進行滾動預測,以樣本后50 個數據作為驗證數據,以“Tansig”作為隱含層的傳遞函數,以“Purelin”作為輸出層的傳遞函數。選取最小全局誤差為0.000 1,學習率為0.05,隱含層節點個數為30,最大訓練次數為6 000 次。
以Astoria 站為例,將實驗分成兩組,第一組實驗對Astoria 站2017 年1 月1 日0 時-2018 年12月30 日23 時余水位數據進行FFMD 分解。以各個IMF 分量為樣本,使用三層神經網絡結構進行訓練。
網絡的訓練擬合結果表明,除了IMF1 分量的皮爾遜相關系數略低(約0.8)外,其余分量的相關系數均接近1。訓練完成后的網絡向后預測24 h,并將獲得的各IMF 分量的預測結果相加(余水位的恢復過程)。第二組實驗則直接使用未分解的余水位數據進行訓練并向后預測24 h。Skamokawa 站和Wauna 站的實驗過程與Astoria 站相同。
將所得結果與各站2018 年12 月31 日的余水位觀測值進行對比(圖8),并計算其在6 h、12 h、24 h 時間段內的預測精度(見表4)。在第一組實驗中,各站在6 h、12 h 時間段內的均方根誤差均維持在厘米級;在24 h 時間段內,Skamokawa 站和Wauna 站的均方根誤差仍維持在厘米級,而Astoria 站的均方根誤差則逐漸增大至12.9 cm。在第二組實驗中,各站在不同時間段內的均方根誤差都超過了10 cm,最高達到19.6 cm。結果表明,實驗1 在余水位短期預測中的表現要優于實驗2,其精度在動力復雜的河口地區仍能接近厘米級,這是由于FFMD 能有效地將復雜信號分解成有限個本征模函數,從而使神經網絡獲得較好的訓練結果。
由于三站的余水位呈現較高的相關性,為研究不同時長的余水位數據在組合預報模型中的表現,選取Astoria 站1 年、半年及1 個月的水位數據按上述實驗步驟進行縱向對比,實驗結果見表5。結果表明,不同時長的余水位數據經組合模型預測后仍能達到較高的精度,其中時長為1 年的余水位預報結果最優,這是由于觀測時長為1 年的水位數據經調和分析后能有效消除潮位的影響,且與兩年時長相比,又能減少網絡因過擬合而導致的泛化誤差。

圖8 各站余水位預測值與觀測值對比圖

表4 各站余水位預測精度(cm)

表5 Astoria 站不同時長余水位數據的預測精度(cm)
本文通過哥倫比亞下游河口處3 組典型驗潮站的余水位數據,采用FFMD-BP 神經網絡組合模型預測了未來不同時段內的余水位值,通過實驗分析可總結如下:
(1)FFMD 分解能有效地將復雜的余水位數據分解成時域下有限個IMF 分量,通過FFT 變換,證明余水位中存在包括半日分潮、全日分潮在內的分潮和其他非平穩特征。
(2)各站的IMF1 分量的空間相關性較差,而其他IMF 分量具有顯著的空間相關性,且隨著各站距離的增大而逐漸減弱。
(3)FFMD-BP 神經網絡組合模型在6 h、12 h時間段內的各站余水位預測精度均達到了厘米級,在24 h 時間段內的預測精度接近厘米級,均優于直接使用原始余水位數據進行預測的結果。此外,不同時長的余水位數據對組合模型預測精度有一定影響,其中1 年時長余水位的預測精度優于2 年、半年及1 個月。
(4)實驗表明,該模型在處理非平穩特征的余水位短期預測中有著較好的效果,這是復雜的余水位時間序列被分解成了相對簡單的IMF 分量的緣故。若要實現高精度的余水位預測,則必須結合包含氣象資料在內的多種資料,從本質上研究各成因的變化規律。