李 磊 黎 競 楊 晨
1 大連海事大學理學院,大連市凌海路1號,116026
電離層作為近地空間的重要組成部分,一直是與人類社會發展和生活息息相關的重要環境區域[1]。電離層總電子含量(total electron content,TEC)是描述電離層性質的重要參量之一,測量電離層總電子含量,研究其變化規律,并對其進行預測,是電離層研究的重要內容[2],因此建立高精度的電離層TEC短期預報模型具有重要的科學和應用價值[3]。根據建模方法的不同,基于時間序列的電離層TEC短期預測模型通常分為經典數學統計法和人工智能法兩大類,其中經典數學統計法模型主要包括時間序列法、相關分析法、自回歸移動平均模型等[1-3];人工智能法有模糊理論、支持向量機、灰度模型、反向傳播神經網絡、遞歸神經網絡、門限循環單元神經網絡、長短期記憶神經網絡等[4-7]。由于電離層TEC數據具有非線性、非平穩性等特點,人工智能法憑借較強的學習能力及處理非線性與時變性問題的巨大優勢,近年來在電離層TEC短期建模中得到越來越多的應用。其中,長短期記憶神經網絡(long short-term memory,LSTM)是一種特殊結構的神經網絡模型,解決了長序列數據訓練過程中的梯度消失和梯度爆炸問題,適合處理和預報電離層TEC序列[4-8]。
卡爾曼濾波(Kalman filter,KF)是利用線性系統狀態方程對系統狀態進行最優估計的算法,作為一種基于時域離散的自回歸優化算法,能夠有效去除噪聲并還原數據,減少隨機噪聲對觀測數據的影響,可在去除突變數據的同時保持數據原有的變化趨勢,是應用非常廣泛的數據預處理方法[2]。與均值濾波和中值濾波相比,卡爾曼濾波的數據平滑效果更好,具有更強的普適性[9]。因此,卡爾曼濾波適合處理包含隨機噪聲的電離層TEC數據。
本文采用卡爾曼濾波對電離層TEC數據進行預處理,并對處理后的數據采用LSTM建模,構建一種新的電離層TEC短期預測模型(KF-LSTM組合模型),通過與其他3種模型的預測結果進行比較,分析該模型在不同緯度地區的預測效果及特點。
利用卡爾曼濾波算法,只要獲知上一時刻狀態的估計值及當前狀態的觀測值,就可以通過反饋環路計算出當前狀態的估計值。反饋環路包含預測和更新兩個部分,其中預測部分公式為:
(1)
(2)

(3)
(4)
(5)

與傳統遞歸神經網絡(recurrent neural network,RNN)和一般神經網絡相比,LSTM連接神經元的方式具有顯著不同的特點。在RNN基礎上,LSTM增加了輸入門、遺忘門和輸出門3個邏輯控制單元門,這3種門結構分別執行不同的功能,主要通過sigmoid(σ) 函數和tanh函數實現對信息的控制和保護,并根據歷史狀態不斷更新調節輸出數據[11]。
LSTM神經元工作過程主要包括4步,具體見文獻[10]。本文在LSTM模型設計時,激活函數采用tanh函數,損失函數采用均方誤差(mean-square error,MSE),優化器采用Adam優化器。
采用預測結果均方誤差最小的原則構建KF-LSTM組合模型,對電離層TEC進行短期預測。具體流程如下:
1)數據獲取。選取格網點位置連續42 d的TEC小時數據,將其分為訓練集數據和預測集數據。
2)卡爾曼濾波預處理。利用卡爾曼濾波算法對TEC數據進行預處理,平滑TEC數據,減小TEC數據中隨機噪聲對組合模型建立和預測的影響,提升TEC數據的質量。
3)超參數選優。選取同一時段的TEC數據,構建不同超參數的KF-LSTM組合模型預測電離層TEC。結合模型復雜度、訓練時間等因素,比較不同超參數模型的預測效果,選擇最優超參數。
4)模型訓練與預測。根據最優超參數構建KF-LSTM組合模型,輸入訓練集數據進行模型訓練,利用訓練后的KF-LSTM組合模型預測測試集數據。
5)預測結果比較分析。將KF-LSTM組合模型的TEC預測結果與BP神經網絡、LSTM、C1PG(CODE′s 1-daypredicted GIM)產品的預測結果進行比較,分析模型預測效果。
本文所用數據為歐洲定軌中心(CODE)發布的全球電離層TEC數據。CODE基于IGS全球GNSS臺站的觀測數據,利用球諧函數構建了全球電離層TEC地圖,其經緯度分辨率為5°×2.5°,時間分辨率為1 h。為驗證組合模型的有效性,分別選取高、中、低緯度及赤道共6個不同緯度(75°N、60°N、45°N、30°N、15°N、0°)與6個不同經度(15°E、60°E、120°E、40°W、90°W、160°W)進行組合,總共得到36個網格點288組數據,時間范圍為2016年和2018年的4個時段(doy40~81、67~108、220~261、247~288)。
選取2018年doy67~108不同位置的9個格網點 TEC數據確定KF-LSTM組合模型超參數,超參數及其選取范圍分別為隱藏層數L∈[1,2,3]、隱藏層神經元個數S∈[50,100,200,400]、輸入數據長度R∈[120,168,240]。以此參數設置為基礎,以預測結果均方根誤差最小為目標,確定KF-LSTM組合模型的最優超參數。
表1給出不同超參數的KF-LSTM組合模型預測結果對比,由表中數據可知,輸入數據長度R=168(7 d)的模型預測效果優于輸入數據長度R=120(5 d)和R=240(10 d)的模型預測效果。計算結果表明,L=2、S=200的模型訓練時間較短且精度較高,因此將其設定為優選參數。

表1 KF-LSTM組合模型的前5組最優參數組合及其均方根誤差
基于上述結果,本文選用4層LSTM模型,具體設置為隱藏層2層,第1、2層隱藏神經元個數均為200個;輸入神經元個數為168個,即前7 d TEC數據;輸出神經元個數為24個,即預測數據為1 d(24 h);模型迭代次數為500次。
為分析KF-LSTM組合模型預測電離層TEC的效果,在2016年和2018年各選取4個時間段,從高、中、低緯度及赤道地區選取不同的經度,總計36個格網點共288組數據,分別采用BP神經網絡模型、LSTM模型、KF-LSTM組合模型進行TEC建模和預測,同時引入CODE發布的C1PG產品,對4種模型的TEC預測結果進行對比。圖1為4種模型對2018年doy77 共18個格網點TEC的預測結果。
總體而言,各模型都能較好地預測電離層TEC在24 h內的變化。為定量分析各模型預測TEC的效果,引入 均方根誤差(root mean square error,RMSE)、平均絕對誤差(mean absolute error,MAE)和平均絕對百分比誤差(mean absolute percentage error,MAPE)3個指標評價預測結果。各指標計算方法如下:
(6)
(7)
(8)
式中,TECci為某時刻的CODE-TEC數據,TECmi為某模型對該時刻的預測值,N為預測TEC的樣本個數。
表2(單位TECu)為各模型對36個格網點288組TEC數據預測的均方根誤差、平均絕對誤差和平均絕對百分比誤差統計結果。可以看出,從均方根誤差角度而言,KF-LSTM組合模型預測TEC的RMSE值為2.867 TECu,與C1PG預測結果的差值僅為0.047 TECu,整體上比BP神經網絡模型、LSTM模型分別小0.549 TECu和0.179 TECu,減小幅度分別為16.1%和5.9%。從平均絕對誤差角度來說,KF-LSTM組合模型預測TEC的MAE值為1.794 TECu,與BP神經網絡模型、LSTM模型、C1PG模型相比分別減少了0.348 TECu、0.173 TECu和0.112 TECu,降低幅度分別為16.2%、8.8%和5.9%。從平均絕對百分比誤差來看,KF-LSTM組合模型預測TEC的MAPE值為16.8%,同BP神經網絡模型、LSTM模型、C1PG模型相比,分別減少了3.5%、1.6%和3.4%。

表2 4種模型的誤差統計結果
綜上分析,在電離層TEC短時預測方面,LSTM模型優于BP神經網絡模型,與熊波等[12]的測試結果一致。KF-LSTM組合模型在3項評估指標上均優于BP神經網絡模型和LSTM模型,預測效果總體上優于C1PG模型。說明通過KF-LSTM組合模型預測電離層TEC是可行的,其預測結果在4種模型中也是最佳的。
為進一步評估各模型在不同緯度地區的預測效果,引入絕對誤差Δ和相對誤差Ur對TEC的預測結果進行評價,其定義分別為:
Δ=|TECci-TECmi|
(9)
(10)
式中,TECci為某時刻的CODE-TEC數據,TECmi為某模型對該時刻的預測值。
表3(單位%)給出4種模型預測TEC的絕對誤差和相對誤差的分類百分比統計結果,圖2為分布直方圖,可以看出,對于不同緯度地區,4種模型預測TEC的效果顯著不同。從絕對誤差角度分析,KF-LSTM組合模型顯示出最好的預測效果,82.93%的預測絕對誤差控制在Δ<3.0 TECu之內,分別比C1PG模型、BP神經網絡模型、LSTM模型高2.35%、4.9%和5.73%;其中,KF-LSTM組合模型TEC預測數據的48.41%控制在Δ<1.0 TECu的較高精度范圍內,分別比C1PG模型、BP神經網絡模型、LSTM模型高5.15%、6.74%和8.51%。

圖2 4種模型預測TEC的絕對誤差和相對誤差的分類百分比統計

表3 4種模型預測TEC的絕對誤差Δ和相對誤差Ur的分類統計
從相對誤差角度分析,KF-LSTM組合模型同樣具有最好的預測效果,86.26%的預測相對誤差控制在Ur<30%,分別比LSTM模型、BP神經網絡模型、C1PG模型高2.94%、6.44%和6.60%;其中,KF-LSTM組合模型TEC預測數據的23.00%控制在Ur<5%的較高精度范圍內,分別比C1PG模型、LSTM模型、BP神經網絡模型高1.91%、2.56%和3.48%。
綜上,無論從絕對誤差還是相對誤差的角度分析,KF-LSTM組合模型預測電離層TEC的效果均優于其他3種模型。
由表3數據可得,除赤道地區外,對于Δ<1.0 TECu、Δ<2.0 TECu的數據占全部統計數據的比例,KF-LSTM組合模型均高于其他3種模型;對于赤道地區,KF-LSTM組合模型的預測結果僅低于C1PG模型,高于LSTM模型和BP神經網絡模型。對于Δ<3.0 TECu的數據統計情況,除15°N和赤道地區外,KF-LSTM組合模型同樣高于其他模型;而對于30°N、45°N、75°N來說,KF-LSTM組合模型中Δ<3.0 TECu的數據占比范圍為82.81%~96.96%,明顯高于其他模型的77.17%~95.22%。對于15°N和赤道地區,4種模型TEC預測結果中Δ<3.0 TECu的數據,KF-LSTM組合模型仍僅低于C1PG模型,高于LSTM模型 和BP神經網絡模型。由表3還可以看出,相對于C1PG模型,KF-LSTM組合模型預測TEC的絕對誤差在赤道區域較大,隨著緯度的升高,絕對誤差逐漸變小,相對于LSTM模型和BP神經網絡模型來說,KF-LSTM組合模型預測電離層TEC更為準確。
從相對誤差角度分析,除赤道地區外,Ur<5%、Ur<10%、Ur<15%、Ur<20%、Ur<25%、Ur<30%的數據中,KF-LSTM組合模型占比高于其他3種模型;對于赤道地區來說,與絕對誤差統計結果一致,KF-LSTM組合模型的占比僅低于C1PG模型,高于LSTM模型 和BP神經網絡模型。對于Ur<30%的數據,除赤道地區外,KF-LSTM模型的比例最低為76.04%,最高可達93.57%,明顯優于其他3種模型。在赤道地區,KF-LSTM模型Ur<30%的數據占比為89.32%,比C1PG模型低3.13%。同樣,對于Ur<5%的高精度來說,在赤道地區,KF-LSTM模型的比例較C1PG模型低2.08%。總體來說,KF-LSTM組合模型預測TEC的相對誤差在赤道區域略低于C1PG模型,優于LSTM模型和BP神經網絡模型,但在其他緯度地區,KF-LSTM組合模型的預測效果更優。
本文選取2016年和2018年4個時間段36個格網點共288組CODE-TEC數據,利用卡爾曼濾波對數據進行預處理,并融合LSTM神經網絡模型,構建KF-LSTM短期電離層組合模型預測TEC。將預測結果與BP神經網絡模型、LSTM模型、C1PG模型的預測結果進行對比,結果顯示:
1)從均方根誤差角度分析,KF-LSTM組合模型與C1PG模型預測結果相當,整體上優于BP神經網絡模型和LSTM模型;從平均絕對誤差和平均絕對百分比誤差角度來說,KF-LSTM組合模型預測結果好于BP神經網絡模型、LSTM模型和C1PG模型。總體來說,KF-LSTM組合模型的預測效果更優。
2)利用絕對誤差和相對誤差評估4種模型在不同緯度地區的預測效果,總體來說,KF-LSTM組合模型預測電離層TEC的效果均要優于其他3種模型。但從各模型對不同緯度的具體預測效果分析來看,在赤道地區,KF-LSTM組合模型預測結果的相對誤差和絕對誤差略低于C1PG模型,優于LSTM模型和BP神經網絡模型;對于15°N~75°N地區,KF-LSTM組合模型預測電離層TEC更為準確。
致謝:感謝歐洲定軌中心提供的數據支持。