黃文喜 祝芙英 翟篤林 林 劍 卿 蕓 李新星 楊 劍
1 中國地震局地震研究所地震大地測量重點實驗室,武漢市洪山側路40號,430071
電離層通常指高度在60 ~ 2 000 km的大氣層,是組成近地空間環境的關鍵要素之一。電離層總電子含量(TEC)是表征電離層形態結構、延遲特性的關鍵參數,電離層TEC的精確測定對于導航定位、地震前兆識別具有重要意義。當前國內外求取TEC的預測模型主要包含兩類:第1類是基于統計經驗的模型[1],該類模型因使用方便且計算簡單被廣泛應用,但受電離層日夜變化、地域跨度等因素影響,預測效果并不理想[2];第2類是基于TEC 觀測數據,通過人工智能或數據挖掘等方法建立的模型,常用的有神經網絡模型、時序分析模型等[3-5]。
機器學習與時序分析雖已廣泛應用于TEC預測領域并取得良好效果,但對兩者在不同外部環境下預測效果的對比分析較少。本文利用 IGS 中心提供的高精度TEC數據,分別采用BP神經網絡及ARMA時序模型對武漢地區不同季節、電離層平靜期和活躍期的TEC進行預測,并對不同樣本長度對模型預測精度的影響進行分析,對健全和完善TEC預測體系具有積極意義。
BP神經網絡是模擬人腦神經系統結構特征而建立的函數模型,由大量神經元廣泛互連形成,不同層神經元間通過權重連接。該模型具有非線性建模、函數逼近等功能,能以任意精度逼近任意N維到M維的映射,被廣泛應用于電離層TEC預測領域[6]。作為一種單向傳播的前向神經網絡,BP神經網絡模型一般包括輸入層、隱含層(一個或多個)和輸出層,并以誤差平方和作為目標函數,采用梯度下降算法交替處理,隨著“模式前向傳播”和“誤差反向傳播”,直至目標函數取得最小值[7]。
任意連續函數均可僅用1層隱含層的BP神經網絡進行逼近[8],因此本文進行TEC預測時選取只含1個隱含層的3層BP神經網絡模型,以前7 d的電離層TEC值(共84個歷元)作為輸入,以后續3 d的電離層TEC值作為期望輸出。在研究過程中,輸入數據按照5∶1∶1隨機分為3組,分別用于訓練并調試網絡、檢驗網絡泛化能力及獨立測試網絡性能。綜合考慮具有不同隱含層神經元個數的模型在驗證集上的均方根誤差,將隱含層神經元個數選定為25個,采用sigmoid函數作為激活函數(式(1)),輸出層采用線性函數,設定初始學習速率為0.000 2,正則化系數為0.1:
(1)
式中,z為輸入因數x與權重因數w的向量積。確立模型結構后,利用BP網絡對訓練樣本xm進行訓練,以獲取輸入/輸出參數間的權重系數w,并通過不斷調試使模型訓練達到要求,進而根據權重系數和預測時刻的輸入參數確定預測結果(圖1)。

圖1 BP神經網絡預測流程Fig.1 Prediction flow chart of BP neural network
自回歸移動平均方法(ARMA)是一種應用廣泛且精確度較高的時序預測方法,對于時間序列{xt},若其零均值平穩且滿足式(2)結構,則可稱其為自回歸移動平均模型,記作ARMA(p,q):
(2)
式中,θq為模型系數,{εt}為白噪聲序列。θq≠0可確保模型最高階數為q,其余限制條件可確保{εt}為零均值白噪聲。
在實際應用中,TEC受緯度、季節、地方時及太陽和地球活動等因素影響,呈現明顯的年、季、日周期變化和隨機波動,因此需要對TEC時序數據進行平穩化檢驗及差分處理。鑒于部分時間序列經多次差分均無法轉為平穩序列或平穩性不明顯,本文將TEC固定的周期性變化視為“周期效應”,采用式(3)分析并最大限度地減弱TEC序列中的周期性變化:
(3)

對于包含n個周期,且每個周期含有m個時刻的目標序列(長度為m×n),各周期內各時刻的均值即為該時刻的長期平均值,可表示為:
(4)
(5)
各時刻周期指數Sk可表示為:
(6)
當TEC序列滿足零均值和平穩條件后,即可利用 ARMA 模型對其進行分析和建模,主要流程見圖2。

圖2 ARMA模型預測流程Fig.2 Prediction flow chart of ARMA model
本文利用IGS發布的武漢地區經緯度為115.0°E、30.5°N的TEC時間序列數據,選取不同時段TEC序列,分別采用BP神經網絡和ARMA模型進行不同季節時段、不同電離層活躍程度、不同樣本長度對比預測,并將預測結果與 IGS TEC發布值進行比對分析,通過定義相對精度P、日均相對精度Pave和均方差RMSE來評價預測效果[9-10]:
(7)
(8)
(9)
式中,Ipre為預測值,IIGS為 IGS 發布的TEC觀測值,N為當天觀測的歷元數。
分別選取2017-03-20~30、06-20~30、10-20~30、12-20~30四個不同季節時段的數據作為TEC預測建模數據,每個時段均以前7 d 的IGS TEC數據作為樣本序列預測后3 d的TEC值。兩種模型不同季節時段的TEC預測結果如圖3所示,圖4為模型預測值與IGS TEC值的殘差。

圖3 兩種模型4個時段的預測結果Fig.3 Predicted results in four periods of two models

圖4 兩種模型4個時段的預測殘差Fig.4 Residual of predicted values in four periods of two models
由圖3可以看出,BP神經網絡和ARMA模型在不同季節時段均表現優異,預測結果與IGS TEC發布值具有良好的一致性,初步印證兩種模型在TEC預測建模中的合理性。結合圖4發現,兩種模型在春、夏時段殘差較小,預測效果優于秋、冬時段。從單時段表現來看,兩種模型在春、夏時段的預測精度相當,但ARMA模型的預測殘差在秋季時段波動較大,可能與9月初爆發的太陽耀斑對電離層的強擾動作用有關,而BP神經網絡模型在冬季的預測效果最差。
為更加詳細地比較BP神經網絡和ARMA模型的預測精度,分別統計兩種模型在不同季節時段的預測值殘差分布情況(表1,單位%)。
由表1可知,兩種模型在4個時段的預測殘差約85%在3 TECu以內,約1/3小于1 TECu,殘差大于3 TECu的部分約占10%。結合模型預測值的相對精度和均方根誤差(表2)可知,ARMA模型的總體預測精度略優于BP神經網絡。分時段來看,ARMA模型在春、冬時段的預測效果明顯優于BP神經網絡,而BP神經網絡在秋季時段的預測效果略優于ARMA模型,兩者在夏季時段的預測效果相差較小。

表1 不同時段TEC預測殘差

表2 不同時段TEC預測值均方根誤差和相對精度統計
選取2017-07-06~15、09-06~15兩個時段的數據分別作為電離層平靜期與活躍期的TEC預測建模數據,每個時段均以前7 d 的TEC數據作為樣本序列預測后3 d 的TEC值,兩種模型的建模方案與數據處理方法不變,預測結果如圖5 所示,圖6為模型預測值與原始值的殘差。
綜合圖5和圖6發現,兩種模型在電離層平靜期和活躍期均能較好地反映TEC的變化特征。從整體效果來看,兩種模型在平靜期的預測效果優于活躍期;從模型自身表現來看,兩種模型在活躍期的精度相當,預測殘差大部分在3 TECu以內,而BP神經網絡模型在活躍期的擬合精度明顯優于ARMA模型,說明ARMA模型對電離層活躍期的TEC不規則變化更加敏感,從而影響預測精度。統計BP神經網絡和ARMA模型在平靜期和活躍期預測殘差,結果見表3(單位%)和表4(單位%)。

圖5 平靜期與活躍期兩種模型TEC預測結果Fig.5 Comparison of predicted results in ionospheric quiet and active period

圖6 平靜期與活躍期兩種模型預測結果殘差Fig.6 Residual of predicted values in ionospheric quiet and active period

表3 平靜期TEC預測殘差
由表3和表4分析發現,在平靜期BP神經網絡的預測殘差約31.1%在1 TECu 以內,約12.1%大于3 TECu;ARMA模型的預測殘差約31.8%小于1 TECu,殘差超過3 TECu的部分約占12.5%。由此可知,在平靜期ARMA模型的預測效果略優于BP神經網絡。在活躍期BP神經網絡的預測殘差約26.9%小于1 TECu,殘差超過3 TECu的部分約占21.5%;ARMA模型中這兩項數據分別為25.0%和24.5%,表明在活躍期BP神經網絡的預測效果明顯優于ARMA模型。兩種模型的預測殘差低于3 TECu的部分均占70%以上,因此無論在平靜期或是活躍期,BP神經網絡和ARMA模型都是較為理想的TEC預測方法。

表4 活躍期TEC預測殘差
分析兩種模型在不同時期的均方根誤差RMSE和相對精度Pave(表5)發現,ARMA模型在平靜期整體Pave高于BP神經網絡,而Pave值在活躍期差異不明顯。從單日表現來看,BP神經網絡在首日預測精度最佳,而ARMA模型預測精度則在預測第2天達到峰值,推測該現象可能與預測樣本長度有關,即7 d樣本長度難以支撐預測精度的持續提升。

表5 平靜期和活躍期兩種模型的預測值均方根誤差和相對精度統計
選取2017-04-06~05-05電離層平靜期武漢地區經緯度為115.0°E、30.5°N處的TEC時間序列數據,分別基于BP神經網絡和ARMA模型采用7 d樣本、14 d樣本、21 d樣本、28 d樣本4種模式預測后3 d的TEC值,探究兩種模型在不同樣本長度下的預測效果,結果見圖7和圖8,表6為不同預測模式的均方根誤差與相對精度統計。

圖7 不同模式下BP神經網絡預測結果Fig.7 Prediction results of BP neural network with different sample length

圖8 不同模式下ARMA模型預測結果Fig.8 Prediction results of ARMA model with different sample length
綜合圖7和表6可以看出,樣本長度對預測精度存在明顯影響。ARMA模型在7 d樣本處精度達到峰值,隨著樣本長度的增加,預測精度反而開始降低;BP神經網絡模型在14 d樣本處精度最高,但其RMSE較21 d樣本明顯偏大。21 d樣本處3 d預測精度分別為92.2%、92.7%、92.6%,精度平穩可靠且RMSE最小。由此推斷,BP神經網絡模型在21 d樣本處預測效果最佳。

表6 不同模式下兩種模型均方根誤差與相對精度統計
因此可以推測,對于天數既定的TEC預測,當樣本長度超過閾值后,兩種模型的預測精度都難以進一步提升。同時也反映出對于3 d的TEC預測,ARMA模型在短樣本模式下效果較好,而BP神經網絡在較長樣本模式預測中才能發揮明顯優勢。
本文基于BP神經網絡模型和 ARMA 模型,利用 IGS 中心發布的武漢地區電離層TEC樣本數據分別進行不同季節時段、不同太陽活動情況、不同樣本長度下的TEC 3 d預測實驗,并將預測結果與IGS 中心提供的實測數據進行對比分析,得到如下結論:
1)7 d樣本模式下,兩種模型在4個季節時段中的預測精度都能較好地反映武漢地區TEC的變化特征。從各時段預測殘差可知,兩種模型在春、夏時段的預測效果優于秋、冬時段;而從單時段表現來看,兩種模型在夏季時段的預測精度大致相同,ARMA模型在春、冬時段的預測效果優于BP神經網絡。
2)7 d樣本模式下,兩種模型在電離層平靜期的預測精度相當;而在電離層活躍期,由于BP神經網絡具有良好的非線性預測與抗波動干擾能力,其預測精度優于ARMA模型。
3)ARMA模型在7 d樣本模式下的平均精度最高,而BP神經網絡在21 d樣本模式下的預測效果最佳,即ARMA模型和BP神經網絡的最佳樣本長度分別為7 d和21 d。 ARMA 模型的短樣本模式預報精度更高,BP神經網絡在較長樣本模式預測中才能發揮較好的效果。