湯 俊 李垠健 鐘正宇 高 鑫
1 華東交通大學土木建筑學院,南昌市雙港東大街808號,330013 2 華東交通大學土木工程國家實驗教學示范中心,南昌市雙港東大街808號,330013
電離層總電子含量(TEC)是研究電離層結構特征的重要參數,其變化趨勢具有非線性、不平穩性及周期性等特點。準確預報TEC變化對衛星導航定位、航天器的控制和安全及自然災害探測具有重要意義。
電離層TEC預報模型主要分為經驗模型和數理統計模型,經驗模型是根據電離層的結構和物理性質通過大量觀測資料建立的,通常用于長期預報,預報精度較低[1-2];而數理統計模型是通過數學方法對TEC時間序列進行擬合建立的,在短期預報領域精度較高[3-9]。
隨著人工智能的興起,研究人員發現,深度學習在電離層TEC預報領域具有得天獨厚的優勢[10-12]。長短期記憶(LSTM)神經網絡通過獨特的設計避免了長期依賴問題,特別適合處理和預報長時間的TEC序列,但單一的神經網絡預報模型難以完全利用時間信息,易受冗余信息影響導致預報誤差偏大。因此,本文利用經驗正交函數(empirical orthogonal function,EOF)有效分解時間特征與空間特征的特性[13],與LSTM神經網絡相結合構建一種新的電離層TEC預報模型,簡稱EOF-LSTM模型。
EOF分解是一種分析矩陣數據結構特征并提取主要信息的方法,在因子場統計組合、動力模型參數化、因子時間序列分析中已得到廣泛應用,在統計預報領域往往作為統計組合的基礎[14]。EOF分解可以將場的時間序列分解為不隨時間變化的空間特征和隨時間變化的時間系數,繼而通過方差貢獻率剔除冗余信息,提取集中在若干個模態分量的主要信息。主要步驟為:
1)設變量場X由m個測站的n組觀測數據組成,可表示為矩陣形式:
(1)
2)將X轉置并計算交叉積得到:
(2)
3)計算方陣C的特征值λ(λ1,λ2,…,λm)和特征向量V,將特征值λ按大小順序排列,即λ1>λ2>…>λm,此時每個非0的特征值即代表對應的空間特征向量,稱為EOF。將空間特征向量投影到原始資料上,得到時間系數Y:
Y=VT×X
(3)
4)利用各時間系數的方差貢獻率剔除冗余信息,計算公式為:
(4)
LSTM神經網絡是一種特殊的循環神經網絡(recurrent neural network,RNN),其在RNN的基礎上增加了隱藏神經元,解決了長序列訓練過程中的梯度消失和梯度爆炸的問題[15],其內部結構如圖1所示。

圖1 LSTM神經網絡內部結構Fig.1 Internal structure of LSTM neural network
LSTM神經網絡單元通過遺忘門、輸入門和輸出門共同決定數據信息的流動,其中遺忘門的作用是篩選冗余信息,即將xt和ht壓縮為0~1之間的數字以表示“遺忘”信息的程度,0表示“遺忘”所有信息,1表示保留所有信息。具體計算公式為:
ft=σ(wf·[ht-1,xt]+bf)
(5)
式中,ht-1為前一時刻的神經元輸入,xt為當前時刻的輸入,wf為遺忘門的權重矩陣,bf為偏置項。
輸入門利用sigmoid函數決定需要的信息并與tanh函數共同創建一個更新候選值Ct,然后將遺忘門保留下來的信息、上個單元的狀態信息及更新候選值相加得到的新的候選值Ct。具體計算公式為:
it=σ(wi·[ht-1,xt]+bi)
(6)
(7)
(8)

輸出門則通過sigmoid函數決定單元狀態中的輸出部分,通過tanh函數將單元狀態壓縮在0~1之間,再乘以sigmoid函數運行結果得到單元的輸出。具體計算公式為:
ot=σ(wo·[ht-1,xt]+bo)
(9)
ht=ot·tanh(Ct)
(10)
經過遺忘門、輸入門和輸出門等一系列運算反復訓練后,可得出數據序列之間的函數關系,最后將隱藏層的輸入值進行全連接運算得到預報值。具體計算公式為:
yt=Whyht+by
(11)
EOF-LSTM預報模型的具體步驟為:
1)將區域格網點的TEC時間序列組成矩陣并進行EOF分解,得到空間特征矩陣和時間系數向量;
2)分別計算各時間系數的方差貢獻率,剔除方差貢獻率小于0.001的冗余信息,并利用LSTM神經網絡預測主成分時間系數向量;
3)將空間特征矩陣與預測得到的主成分向量重構,得到各格網點的TEC預測值。
本文利用歐洲定軌中心(CODE)提供的GIM產品進行分析,通過內插得到云南及其周邊地區(98°~106°E,22°~28°N)20個格網點數據,空間分辨率為2°×2°。研究區位于中低緯度地區,全年光照充足,TEC的晝夜變化較大,可代表中低緯度地區的TEC變化規律。分別選取3月、6月、9月及12月前20 d時間分辨率為1 h的TEC數據進行分析,對應年積日為60~79、152~171、244~263及335~354,利用4個時段內前15 d的數據構建模型預測后5 d的TEC變化趨勢,并利用均方根誤差(RMSE)、平均殘差(Δ)及平均相對精度(P)3個指標對結果的精度進行評定。具體計算公式為:
(12)
(13)
(14)

為驗證模型精度,分別利用單一LSTM神經網絡模型和EOF-LSTM預報模型對20個格網點4個時段的數據進行預測。首先將20個格網點的TEC序列組成矩陣;然后利用EOF分解為空間特征和時間系數,并對時間系數剔除掉方差貢獻率小于0.001的冗余信息,其余主要時間系數利用LSTM神經網絡進行預報;最后用空間特征矩陣乘以時間系數的預報結果得到20個格網點的預測結果。受篇幅所限,文本僅選取部分結果進行展示。
圖2和圖3分別為2種模型在(98°E,22°N)、(100°E,24°N)、(102°E,26°N)及(104°E,28°N)等4個格網點年積日為259~263共5 d的預測結果和殘差分布。從圖2可以看出,隨著緯度的增加,TEC呈減小趨勢,最大值在后2 d發生擾動,5 d內的最小值均保持穩定,2種預報模型的預測值分布在實際值兩側,均可較準確地預測TEC的變化趨勢,與單一的LSTM神經網絡模型相比,EOF-LSTM預報模型的TEC預測結果與實際值更吻合。從圖3的殘差分布來看,2種模型的預報殘差基本分布在5 TECu以內,單一LSTM神經網絡模型的部分殘差接近10 TECu,與其相比,EOF-LSTM預報模型的總體殘差更小,預測效果更穩定。

圖2 不同格網點預報效果Fig.2 Schematic diagram of forecast effect of different grid points

圖3 不同格網點TEC殘差分布Fig.3 TEC residual distribution of different grid points
表1為4個格網點預測值與實際值的精度評價,可以看出,單一LSTM神經網絡模型的RMSE均在2 TECu以上,最大為2.49 TECu,最小為2.18 TECu;而EOF-LSTM預報模型的RMSE均小于2 TECu,最大為1.88 TECu,最小為1.83 TECu,僅相差0.05 TECu,表明EOF-LSTM預報模型的預測效果更穩定。單一LSTM神經網絡模型的平均殘差最大為1.79 TECu,最小為1.56 TECu;EOF-LSTM預報模型的平均殘差均小于1.5 TECu,最大為1.33 TECu,最小為1.21 TECu。在預報準確度方面,單一LSTM神經網絡模型的最優精度為87.04%,最低精度為84.63%;EOF-LSTM預報模型的平均相對精度均在90%左右,最優精度為91.56%,最低精度為89.35%,明顯優于單一LSTM神經網絡模型。綜上所述,EOF-LSTM預報模型的3個精度評價指標均優于單一LSTM神經網絡模型,驗證了該模型的預測結果具有更穩定的可靠性和更高的精度。

表1 不同經緯度地區2種預報模型的評價指標
地磁活動指數Kp和太陽活動指數F10.7是影響TEC變化的2個重要因素。圖4為4個時段的Kp和F10.7變化情況,可以看出,在年積日為60~79時段的后5 d中,Kp指數有1 d大于2,在年積日為335~354時段的后5 d中Kp指數有1 d 大于2、1 d接近于2,其他2個時段中均僅有1 d的Kp指數大于2。表明年積日為60~79時段的地磁活動最為劇烈,年積日為335~354時段的地磁活動較劇烈,其他2個時段的地磁活動相對平靜。而F10.7指數只有在年積日為152~171時段中的后2 d超過80,其余時段均在80以下,說明4個時段的太陽活動均不劇烈。

圖4 不同時段的Kp指數和F10.7指數Fig.4 Kp index and F10.7 index in different time periods
為進一步驗證本文預報模型的可靠性,選取4個不同時段的預測結果進行分析。圖5和圖6分別為4個不同時段的預測結果和殘差分布??梢钥闯?,在地磁活動劇烈的2個時段,TEC變化有明顯波動,與磁靜日相比在極大值處擾動劇烈,日周期性更顯無序,預測結果在極值點處的誤差明顯偏大,反映地磁活動對電離層TEC的日變化有很大影響。從圖6還可看出,地磁活動劇烈的2個時段的預報殘差明顯比地磁平靜時期的預報殘差大,單一LSTM神經網絡模型的預報殘差最高達15 TECu,EOF-LSTM預報模型的預報殘差則基本穩定在10 TECu以內。

圖5 (104°E,24°N)觀測點預報效果Fig.5 Schematic diagram of forecast effect at observation point (104°E,24°N)

圖6 (104°E,24°N)觀測點不同時段TEC殘差分布Fig.6 TEC residual distribution diagram in different time periods at observation point (104°E,24°N)
計算4個時段的精度評定指標和殘差百分比,統計結果見表2和表3(單位%)。可以看出,在地磁活動最劇烈的時段(年積日75~79),單一LSTM神經網絡模型預測結果的RMSE為4.47 TECu,平均相對精度為82.27%,平均殘差為3.31 TECu,|Δ|>4.0的預報值高達34%;而同一時段EOF-LSTM預報模型預測結果的RMSE為3.55 TECu,平均相對精度為84.53%,平均殘差為2.46 TECu,|Δ|>4.0的預報值僅為20%。在地磁活動較為劇烈的時段(年積日350~354),單一LSTM神經網絡模型與EOF-LSTM預報模型預測結果的RMSE分別為2.62 TECu和1.93 TECu,平均殘差分別為1.75 TECu和1.33 TECu,平均相對精度分別為83.88%和87.11%,|Δ|>4.0的預報值分別為13%和9%,進一步驗證在地磁活動劇烈的條件下,EOF-LSTM預報模型具有更高的可靠性。

表2 不同時段2種預報模型的評價指標

表3 不同時段殘差百分比統計
在地磁活動較平靜的時段(年積日167~171和259~263),EOF-LSTM預報模型預測結果的RMSE分別為2.22 TECu和1.86 TECu,平均殘差分別為1.55 TECu和1.29 TECu,平均相對精度分別為87.62%和90.74%;而單一LSTM神經網絡模型預測結果的RMSE分別為2.71 TECu和2.48 TECu,平均殘差分別為1.92 TECu和1.83 TECu,平均相對精度分別為83.59%和84.24%。就殘差分布而言,2個時段EOF-LSTM預報模型|Δ|<1.0的預報值分別為48%和58%,1.0≤|Δ|<2.0的預報值均為23%,高于單一LSTM神經網絡模型;當平均殘差較大時,2個時段EOF-LSTM預報模型2.0≤|Δ|<3.0的預報值分別為11%和8%,3.0≤|Δ|<4.0的預報值分別為10%和7%,|Δ|≥4.0的預報值分別為8%和4%,均小于單一LSTM神經網絡模型,說明在地磁平靜時期,EOF-LSTM預報模型預測結果的殘差分布基本在±2 TECu以內,優于單一LSTM神經網絡模型。
本文針對區域格網點電離層TEC的預測提出EOF-LSTM預報模型,并利用CODE提供的TEC數據對云南及周邊地區的TEC值進行預報分析,得出結論:
1)首先利用EOF分解將TEC格網數據矩陣分解為空間特征和時間系數,剔除時間系數冗余信息,只針對主要時間向量進行預測重構,提高了計算效率并可更好地把握TEC序列的時間性。
2)通過對同一時段不同地點及同一地點不同時段的TEC值進行預報分析發現,EOF-LSTM預報模型在不同經緯度、不同地磁活動和不同太陽活動條件下的預測結果均能體現出TEC的變化趨勢,精度和穩定性均優于單一LSTM神經網絡模型。