鄭敦勇, 姚宜斌, 聶文鋒, 林東方, 梁繼, 陳春花
1 湖南科技大學地理空間信息技術國家地方聯合工程實驗室, 湖南湘潭 411201 2 湖南科技大學地球科學與空間信息工程學院, 湖南湘潭 411201 3 武漢大學測繪學院, 武漢 430079 4 廣西空間信息與測繪重點實驗室, 桂林 541006 5 山東大學空間研究院, 山東威海 264209 6 湖南省測繪科學技術研究所, 長沙 410007
電離層位于地面上約60~1000 km范圍內,是地球高空大氣受太陽高能輻射以及宇宙線的激勵而被電離的區域,主要由帶電粒子、中性原子及分子組成,在整個日地空間環境中,電離層是直接影響人類空間活動的最重要環節之一(Liu et al. 2021).GNSS電離層層析技術(Computerized ionospheric tomography, CIT)作為監測和研究電離層的一種重要手段,其重構的電子密度分布能同時反映電離層水平結構和垂直結構的變化,從而克服了二維電離層模型的局限性,因此,在近20余年來得到了突飛猛進的發展.目前,這些模型大致可以分為兩類:一類是函數基電離層層析模型(Hansen et al., 1997);另一類是像素基電離層層析模型(Rius et al., 1997; 徐繼生和鄒玉華, 2003).相比之下,函數基CIT模型可以用少量的模型參數去反演大范圍的電離層電子密度,且反演結果較穩定,但缺點是反演結果過于平滑,有時會掩蓋一些電離層的小尺度擾動結構特征.而在像素基CIT模型的反演過程中,也存在一個比較棘手的問題:可利用的觀測數據不足或分布不均,從而導致待反演的電離層空間離散化后部分像素沒有信號射線穿過,這也就意味著電離層電子密度的反演問題是一個不適定問題(聞德保, 2013).為了克服上述問題給像素基CIT模型帶來的不利影響,國內外許多學者提出了解決方法,其主要分為算法改進、多源數據融合以及神經網絡模型等三類.
針對層析算法的改進,目前主要包括基于奇異值分解(Singular Value Decomposition, SVD)、截斷奇異值分解(Truncated SVD, TSVD)的非迭代算法,基于代數重建算法(Algebraic Reconstruction Technique, ART)、乘法代數重建算法(Multiplicative ART, MART)、同步迭代重構算法(Simultaneous Iterative Reconstruction Technique, SIRT)、Kalman濾波以及正則化的改進迭代算法,其中,非迭代算法的優點是不需要初值,但由于可用的觀測數據不足以及離散誤差和觀測噪聲的影響,若單獨使用會導致其反演結果精度不高(聞德保, 2013),因此,目前主要用于顧及數據權比因子的多源數據融合反演(湯俊, 2014),另外,非迭代算法一般都涉及大規模矩陣求逆,從而對硬件要求也較高.
相較于非迭代算法,目前在像素基CIT研究中使用改進迭代算法相對較多.如Yavuz等(2005)提出了聯合整體最小二乘法和ART的混合算法,其中利用整體最小二乘法為ART算法提供初值;肖宏波等(2008)發展了一種聯合最速下降法和MART的改進算法,該算法有效降低了MART算法對迭代初值的敏感度,提高了電離層層析的可靠性;Liu等(2010)提出了附加約束的同步迭代代數重構(Constrained CSIRT, CSIRT)算法;Kunitsyn等(2011)提出了基于Sobolev正則化約束的同步迭代重構算法;聞德保(2013), 聞德保等(2014)以及Wen等(2015)先后提出了改進ART算法、基于Phillips平滑約束和MART的二步算法、基于TSVD和ART的組合算法、約束MART算法、約束ART算法、約束自適應聯合迭代重構算法以及選權擬合重構算法;Yao等(2013a, b, 2018)先后提出了基于函數基與像素基模型的組合算法、混合正則化迭代算法以及附加側面射線的CIT算法;湯俊(2014)提出了基于多源數據融合的CIT算法以及基于總變差最小化的CIT算法;霍星亮等(2016)通過改進迭代算法及其松弛因子來提高CIT的反演精度,相對于傳統ART算法,該方法反演的電子密度剖面更接近于實測數據;Wang等(2016)提出一種基于Tikhonov正則化的CIT方法,利用模型函數方法去確定最優的正則化參數,以此來平衡觀測數據和背景模型值之間的權重,并提高算法的全局收斂速度;Yin等(2017)發展了多程層析迭代算法,該算法通過構建不同的像素分辨率來實現多次反演,從而提高反演精度;趙海山等(2018)提出自適應層析算法(Adaptive MART, AMART),其中根據有信號射線像素中的截距和電子密度值的綜合影響,合理分配算法的迭代差值,并提出與電子密度值相關的自適應松弛因子,有效克服傳播噪聲對電子密度反演的影響;Jin和Li(2018)提出了改進的二步算法,首先用NeQuick模型對背景模型進行精化,然后結合MART算法進行反演;Chen等(2019)提出了一種參數化電離層層析方法,根據像素八個角處的電子密度值(Ionospheric electron density, IED),利用垂直指數插值和水平反向距離加權插值獲取像素內任意位置的IED;除此之外,Zheng等(2015, 2016, 2017, 2018, 2021b)也先后提出了基于多尺度剖分、可變像素高度、可變像素尺度、松弛因子自動搜索技術以及有序子集約束ART的電離層層析算法,均表現出良好的層析效果和效率.總的來說,通過增加約束條件或組合其他算法得到的這類改進迭代算法,其性能較之前有大幅度提高,但離完全克服不適定性問題仍有較大差距,主要表現在無信號射線像素的反演電子密度對初值比較依賴,而初值通常是由精度不高的經驗模型給出,從而拉低了電離層層析的整體精度.
Stolle等(2003)在基于GPS數據的CIT反演中,提出融合掩星數據來提高電子密度的垂直分辨率;Bust等(2004)基于三維變分同化技術3DVAR,發展了三維電離層數據同化算法(IDA3D),IDA3D可以同化GNSS、低軌信標以及測高儀等多類觀測數據;Garca-Fernández等(2005)利用日本密集的GPS網數據,融合SAC-C掩星和測高儀數據,反演了日本上空的三維電離層電子密度,其中掩星和測高儀數據以及改進的Abel算法被用來構造電子密度剖面的背景分布,以此來提高電子密度的垂直分辨率;徐繼生等(2005)建立了融合GPS和掩星數據的時變CIT模型,并利用實測數據對模型進行了仔細驗證;Lee等(2007)融合GPS和測高儀數據,基于Tikhonov和總變分TV算法,得到兩種不同的CIT模型,并利用測高儀數據和Chapman函數構造電子密度垂直剖面模型來驗證反演精度;Angling(2008)基于最優化線性無偏估計理論,融合GPS和掩星數據,發展了電離層電子密度同化模型;Chartier等(2012)發展了融合GPS和電離層測高儀數據的CIT方法,其中利用測高儀數據構建垂直方向的基函數,自適應地在反演中提供電子密度信息;Li等(2012)發展了一種融合地基GPS和COSMIC掩星數據的CIT方法;Zhao等(2013)提出了一種融合三頻GPS、地面垂測和斜測數據以及頂部探測儀數據的CIT方法;Yu等(2014)發展了電離層數據同化系統IDAAS,并對東南亞上空的電離層三維電子密度結構進行了重構,被同化的數據包括地基GPS和測高儀數據;Semeter等(2016)提出了融合GPS和非相干散射雷達ISR數據的CIT方法,其中把插值的ISR密度場作為反演初值,然后使用最大熵正則化方法求解;Aa等(2016)利用三維變分數據同化算法以及地基GPS和掩星數據,得到中國及相鄰區域上空電離層的三維電子密度結構,其結果證明了該同化技術在提高區域電離層形態規范方面的有效性;歐明等(2016)提出了一種融合天地基多源數據的CIT算法,其多源數據包括地基GNSS、LEO掩星、衛星信標及測高儀等數據,并利用改進的Kriging插值與MART算法實現多源數據的有效融合;She等(2017)提出了一種基于多源數據同化技術的CIT算法,該方法在水平和垂直方向上分別采用球諧函數和經驗正交基函數來進行電子密度估計,其同化數據包括地基GPS、LEO掩星、海洋測高衛星數據等;dos Santos Prol等(2019)提出融合測高儀、掩星、以及垂直方向總電子含量(Vertical Total Electron Content, VTEC)數據的層析方法,其中利用測高儀和掩星數據對背景模型進行精化,然后把通過投影函數得到的VTEC數據加入到層析方程中,從而提高層析精度.盡管上述研究表明多源數據融合技術的發展使陸上大范圍的層析精度有了一定提高,但仍存在兩個主要問題:①部分研究中,直接將各類觀測數據按等權處理,這顯然是不合理的,而另一部分研究中,利用方差分量估計對觀測數據的權重進行了確定,但其過程略顯復雜,且實施起來有一定難度,如很多學者利用Helmert方差分量估計法來確定權重,但在實際應用時,各類方差因子相等的收斂條件是難以滿足的;②由于受時空分辨率的限制,多源數據融合技術并不能完全克服不適定性問題,特別是針對陸上的小范圍層析以及海域層析時,可利用的多源數據不多甚至缺失,因此,不適定性問題依然會較嚴重.
神經網絡以其自身的自組織、自適應和自學習等特點被廣泛應用于各個領域,Ma等(2005)首次提出利用BP神經網絡重構區域電離層電子密度的思想,并融合測高儀數據來提高電子密度垂直分辨率;陳必焰等(2012)基于傳統層析模型的反演結果,利用神經網絡對電子密度進行預測,在建模過程中,用當前反演的全部電子密度及其像素特征構建學習樣本,然后用訓練好的模型預測下一時段的電子密度,其預測精度明顯高于IRI(International Reference Ionosphere)模型;Razin和Voosoghi(2016)設計了一種多隱含層神經網絡CIT算法,并基于IRI2012模型構造了一個經驗正交基函數作為神經網絡訓練的目標函數,以此來提高電離層垂直方向的分辨率,在此基礎上,Razin和Voosoghi(2019)發展了基于粒子群優化訓練的小波神經網絡CIT算法,該算法不僅能改善層析模型的不適定問題,且能保證效率和全局收斂.盡管這些基于神經網絡的層析算法對促進CIT技術的發展起到了一定的推動作用,但仍存在三個主要問題:①把精度不高的經驗模型(IRI)值當做真值去構建學習樣本,這勢必會導致最終神經網絡模型的預測精度也不高;②用傳統層析算法的全部反演結果構建學習樣本,沒有顧及那些無射線穿過像素的反演電子密度對初值的依賴問題;③學習樣本的輸入參數和時間跨度沒有考慮全面.鑒于此,Zheng等(2021a)提出了基于AdaBoost-BPNN算法的電離層層析模型,該模型利用有信號射線像素的特征及其電子密度反演值對機器學習模型進行訓練,然后預測無信號射線像素的電子密度,有效避免傳統層析算法中仍然存在的不適定性對層析結果的影響,進而提高電離層層析的整體精度.然而在該模型中,仍然存在未完全顧及層析初值的影響,且其機器學習算法有待進一步優化等問題,為此,本文提出使用機器學習集成算法XGBoost對層析初值進行預測,最終建立一種高精度的機器學習電離層層析模型(簡稱XGB-CIT模型),并以獨立的電離層測高儀數據為參考值,對XGB-CIT模型進行有效驗證.
GNSS信號路徑上的總電子含量(Total Electron Content, TEC)可表示為電子密度沿信號傳播路徑的線性積分,在電離層層析過程中,首先利用相位平滑偽距方法(Jin et al., 2012)獲取信號路徑上的TEC,然后對上述線性積分進行離散化后并利用相應的反演算法獲取其像素的IED(聞德保, 2013).
如Zheng等(2018)所示的改進IART算法在本文中被使用,一方面可以為機器學習模型提供輸入數據,另一方面把機器學習模型預測的電子密度作為初值,然后反演得到最終的電離層電子密度,其具體的流程圖如圖2所示,同時IART算法還可以作為參考方法進行對比分析.本文中對IART算法施加水平和垂直平滑約束,以避免相鄰像素之間電子密度值的突然變化,其中水平約束采用高斯加權函數構造(Wen et al., 2015),垂直約束利用Chen等(2019)中的方法,并結合機器學習模型預測的電子密度得到.
集成學習(Ensemble learning)是通過構建并結合多個個體學習器來完成學習任務(圖1),從而獲得比單一學習器顯著優越的泛化性能(周志華, 2016).根據個體學習器的生成方式,目前的集成學習方法大致可分為兩大類:基于Boosting的和基于Bagging的,前者的代表算法有AdaBoost、GBDT、XGBoost、LightGBM以及CatBoost,后者的代表算法主要是隨機森林(RF).通過對比分析,本文選擇XGBoost算法并使用Python軟件來實現電離層層析重構.

圖1 集成學習示意圖Fig.1 The schematic diagram of ensemble learning
XGBoost(Extreme Gradient Boosting)是由Chen和Guestrin于2011年首次提出的機器學習模型,并在眾多學者的后續研究中不斷優化和改進(Chen and Guestrin, 2016; Li et al., 2019).XGBoost對損失函數進行二階泰勒展開,可以自動使用CPU的多線程進行并行計算,且使用多種方法避免過度擬合.下面簡要介紹XGBoost算法,更多詳細信息可參考文獻Chen和Guestrin (2016).
XGBoost中用加法將所有樹模型集成,假設總共有K個樹,則有
(1)
q(x)表示將樣本x分到了某個葉子節點上,在本文中,針對如表1所示的樣本數據,若我們以輸入變量Lon<112.75°E為分裂點,則可得到左右兩個葉子節點,其中左葉子節點中的樣本有3,右葉子節點中的樣本有1、2、4、5;w是葉子節點的權重,在本文中即為電子密度預測值,最終根據(5)式計算得到.

表1 樣本數據示例Table 1 Sample data example
XGBoost的目標函數如下:
(2)

(3)
Ω是防止過擬合以及控制模型復雜度的正則化函數:
(4)
其中T是樹的葉子總數,γ和λ分別為L1和L2正則的懲罰項.為了使得目標函數最小,正則項越小越好,因此,一方面要使葉子節點個數T最少,這樣樹就簡單,從而提高計算效率,實際應用時,T由樹的深度max_depth決定;另一方面要對葉子節點的值w進行L2正則,這樣才會把w的解約束在一個范圍內.
通過對目標函數(4)的改寫、泰勒展開以及求導,可分別得到第j個葉子的最優權重(式(5))和相應的最優目標函數值(式(6)):
(5)
(6)
這里Ij={i|q(xi)=j}表示i樣本落在第j個葉子節點上,
通常不可能枚舉所有可能的樹結構q,取而代之的是一種貪婪算法,該算法迭代地添加樹,一直到K顆樹停止,實際應用中,弱分類器數目n_estimators即為樹的顆數,具體迭代過程如下:
(7)

另外,假設IL和IR是拆分后左右節點的實例集,設I=IL∪IR,則分割后的損失函數由下式給出:
(8)
如圖2所示,XGB-CIT的流程大致可分為3部分.

圖2 XGB-CIT流程圖Fig.2 The flow chart of XGB-CIT
(1)訓練樣本構建
基于傳統層析IART算法,利用多個連續時段(滑動窗口內)中有信號射線像素的特征及其電子密度反演值(IED1)構建XGBoost的訓練樣本,其輸出參數即為IED1,輸入參數來源于與電子密度變化相關的幾類變量,結合Zheng等(2021a)的介紹以及大量試驗,本文最終確定12個輸入參數,包括像素中心的緯度(Lat)、經度(Lon)以及像素中心距地面的高度H,世界時的正弦(UTS)和余弦(UTC)分量(sin(2π·UT/24), cos(2π·UT/24)),太陽仰角的正弦(ELES)和余弦(ELEC)分量(sin(2π·ELE/360), cos(2π·ELE/360)),太陽方位角的正弦(AZIS)和余弦(AZIC)分量(sin(2π·AZI/360), cos(2π·AZI/360)),地磁指數Dst、ap和AE值.
(2)機器學習模型訓練
目標函數是判斷機器學習模型質量的基礎,因此構造合理的目標函數是XGB-CIT成功的關鍵,本文的總目標函數(total objective function, OF)定義如下:
OF=model_gs.best_score+rmse_score,
(9)
式中model_gs.best_score與rmse_score分別是交叉檢驗的最優得分和檢驗樣本(未參與訓練)的TEC正演誤差.
由于XGBoost在使用時需要調整的參數較多,根據相關研究(Li et al., 2019)和實踐經驗,本文調整了如表2中所示的參數以使模型發揮最佳性能,其具體的調整流程如圖3所示,即針對不同參數,依次找到最優值;同時,在參數調整過程中使用了交叉驗證(GridSearchCV)方法,其主要參數設置為:模型評估方法scoring=‘neg_mean_squared_error’,分割次數cv=5.

圖3 XGBoost的參數調整流程圖Fig.3 Parameter adjustment flow chart of XGBoost

表2 XGBoost的參數及其調整范圍Table 2 Parameters of XGBoost and its adjustment range
(3)電離層電子密度最終輸出
利用訓練好的XGBoost預測下一時段中所有像素的電子密度IED0,并以此作為迭代初值,再次結合IART算法進行層析反演,從而得到最終的電子密度IED2,同時,IED2又參與下一個滑動窗口內的訓練樣本構建.
總的來說,如表3所示,相較于傳統層析方法,盡管XGB-CIT的建模過程相對復雜,但其優點也比較明顯.

表3 XGB-CIT與IART的構建方法比較Table 3 Comparison of construction methods between XGB-CIT and IART
利用湖南省CORS網的GNSS觀測數據對XGB-CIT的性能進行驗證,如圖4所示,重構區域的經緯度范圍分別為108.5°E—114.5°E和24.5°N—30.5°N,共包含73個GNSS測站和2個電離層測高儀站.重構區域的高度范圍設為70~1000 km,并采用0.5°×0.5°×15 km的像素尺度對電離層區域進行剖分,最終共有8928個像素.實驗中使用了2015-12-30—2015-12-31連續兩天(每小時中只采用半小時數據,且每天23∶00—23∶59都沒有數據)共46個時段(UT1, …, UT46)的數據.同時,圖5給出了2015年12月30日和12月31日的ap、Dst和AE等地磁指數的時間序列,由圖可知,12月30日電離層處于平靜狀態,而12月31日則相反.

圖4 重構區域及測站分布圖Fig.4 The reconstructed area and observation stations distribution

圖5 連續兩天的ap (a)、Dst (b)和AE (c)指數序列圖Fig.5 ap (a), Dst (b) and AE (c) index sequence diagram of two consecutive days
在討論XGB-CIT的性能之前,利用Jin等(2012)中的載波相位平滑偽距方法得到GNSS信號路徑上的TEC,反演區域的每個像素由IRI2016模型初始化.基于XGB-CIT的流程,利用每個反演周期的TEC數據,首先采用IART算法對重建區域的IED進行反演,然后利用有觀測信息像素的反演IED以及像素特征,得到XGBoost的學習樣本,隨后對2015年12月31日23個時段內每個像素的IED進行滾動預測,兩種樣本的結構如表4所示.

表4 學習和預測樣本的時間跨度Table 4 Time span of learning and prediction samples
針對12月31日的每個反演時段,利用XGBoost與IRI2016預測的IED重新計算TEC并進行比較,表5分別列出了23個反演時段內TEC的均方根誤差(RMSE)和平均絕對誤差(ΔE),其計算公式如下:
(10)

由表5可知,XGBoost的兩項誤差在所有的時段中都遠低于IRI2016模型的,其中IRI2016與XGBoost的平均RMSE分別為6.97 TECU和2.23 TECU、平均ΔE分別為6.58 TECU和1.82 TECU,由此可知,基于RMSE統計,XGBoost的IED預測精度相較于IRI2016平均提高了68%,因此,初步驗證了XGBoost算法結果用于XGB-CIT模型迭代初值的可行性.
由圖2可知,在XGB-CIT模型中,把XGBoost算法得到的IED作為迭代初值,并再次與IART算法相結合,得到最終的IED.結合(10)式,圖6分別

圖6 GNSS觀測值和層析模型獲取的TEC在23個層析時段的誤差比較Fig.6 Errors comparison between GNSS observations and TEC obtained by tomography model in 23 tomography periods
給出了傳統層析算法IART與XGB-CIT模型在23個反演時段內TEC的反演誤差柱狀圖.由圖可知,除了UT26、UT37、UT38時段,XGB-CIT的RMSE和ΔE均小于或等于IART,其中IART與XGB-CIT的平均RMSE分別為0.55 TECU和0.53 TECU、平均ΔE分別為0.33 TECU和0.32 TECU,盡管基于平均RMSE和ΔE,XGB-CIT相較于IART的提高幅度不大,但由圖7可知,由于迭代初值的改

圖7 兩種層析方法的迭代次數比較Fig.7 Iteration times comparison of two tomography methods
進,XGB-CIT的收斂速度比IART提高了20%,因此,這初步證明了XGB-CIT模型的優良性能,同時進一步驗證了XGBoost算法的可行性.
圖8中給出了6個歷元中不同反演方法的電子密度廓線比較情況,其子圖從上往下分別代表UT26、UT27、UT33、UT34、UT41、UT42,每個子圖的左側是邵陽測高儀站(111.3°E, 27.1°N),右側是武漢測高儀站(114.4°E, 30.5°N),總的來說,相對于IRI2016和IART,XGB-CIT的電子密度廓線與測高儀的真實數據更加符合.由圖4可知,由于邵陽站位于研究區域的中心位置,其垂直方向的像素都有信號射線穿過,因此,除了子圖(f),IART和XGB-CIT的電子密度廓線在邵陽站幾乎是重合的,這也說明,當像素有信號射線穿過時,即使提高迭代初值精度,但其最終的反演精度也不會大幅提高,這也是對圖6中反演精度的一個直觀反映;然而武漢站位于研究區域的邊緣位置,其垂直方向的像素幾乎都沒有信號射線穿過,因此,當迭代初值精度提高后,似乎會直接導致反演電子密度的精度提高幅度較大,但實際上并非如此.圖9中顯示了不同歷元中無信號射線像素的反演電子密度比較,每個子圖中從左往右,分別是IART與IRI2016的比較、XGBoost獲得的層析初值與IRI2016的比較、以及XGB-CIT與IRI2016的比較,其中子圖(a)、(b)、(c)和(d)分別代表歷元UT24、UT29、UT36和UT39,且他們的無信號射線穿過的像素比例分別為78.47%、63.89%、37.67%和32.46%.由圖可知,無信號射線像素的比例越大,其反演結果與初值越接近,而UT36和UT39中,盡管反演結果在初值基礎上有所改變,但其幅度也不大,因此,我們認為對于無觀測區域的電子密度反演,其本質是電子密度在時間和空間上的預測問題.總的來說,在有觀測信息像素的反演精度提高空間有限的情況下,能大幅提高無觀測信息像素的初值精度,這也是我們利用機器學習對迭代初值進行精化的一個主要目的.

圖8 不同層析歷元的電子密度廓線對比Fig.8 Comparison of electron density profiles in different tomography epochs

圖9 無信號射線像素的反演電子密度比較Fig.9 Comparison of inversion ionospheric electron density of pixels without signal ray
圖10給出了IRI2016(左)、IART(中)、XGB-CIT(右)三種反演方法在UT34(上)和UT42(下)的電子密度三維示意圖,其中UT34和UT42的地方時分別是18∶00—18∶30 LT和02∶00—02∶30 LT,由圖5可知,UT34處于磁暴發生的上升階段,而UT42處于磁暴的短暫下降階段,因此導致兩個歷元中電子密度的差別較大.在兩個子圖中,由IART獲取的電子密度剖面圖在邊緣位置幾乎都與它的迭代初值IRI2016相同,而XGB-CIT的電子密度剖面圖中則不存在這個問題,結合圖8的分析可知,邊緣地帶的像素中由于缺少信號射線,是導致這種現象的主要原因.因此,這充分證明了利用機器學習進行迭代初值精化的必要性和可行性.另外,圖11中顯示了四個反演歷元中由XGB-CIT獲取的VTEC與CODE的電離層格網產品(http:∥ftp.aiub.unibe.ch/CODE/IONO/2015/)對比情況,其中子圖(a)、(b)、(c)和(d)分別代表歷元UT24、UT31、UT34和UT37,但由于CODE提供的格網產品分辨率是2.5°×5°,而我們的層析像素分辨率是0.5°×0.5°,因此能覆蓋我們研究區域(24.5°N—30.5°N, 108.5°E—114.5°E)的CODE電離層格網點只有15個,特別是在有些歷元中,CODE提供的這15個格網值都是相同的,這導致CODE-VTEC圖并不能完全反映出我們研究區域內電離層的真實變化,毫無疑問,我們利用XGB-CIT反演方法得到的電離層精度肯定高于CODE產品,這也充分說明在局部區域建立電離層模型的必要性和利用層析模型獲取高精度電離層信息的可行性.

圖10 IRI2016(a)、IART(b)和XGB-CIT(c)三種反演方法在兩個歷元UT34(A)和UT42(B)中的電子密度三維示意圖Fig.10 Three-dimensional schematic diagram of the electron density in two epochs UT34 (A) and UT42 (B) by three inversion methods, IRI2016 (a), IART (b) and XGB-CIT (c)

圖11 XGB-CIT獲取的VTEC (右)與CODE (左)的電離層格網產品比較Fig.11 Comparisons of the VTEC from XGB-CIT (right) with the CODE ionospheric grid product (left)
圖12、13分別給出了2015年12月31日XGB-CIT方法在120°E經度面和25.5°N緯度面上的電子密度剖面圖,總的來說,兩個圖都很好地展現了電子密度的日變化,且電子密度在經度面和緯度面上的變化比較一致,都在UT33(17∶00—17∶30 LT)達到峰值,一方面UT33處于磁暴的上升階段,另一方面本地時17∶00—17∶30 LT也是電離層比較活躍的階段,因此圖12—13中電子密度峰值出現的時間與實際情況也是比較吻合的.由圖12可知,在該磁暴期間,其南部的電子密度明顯大于北部的,但在緯度面上,電子密度有比較明顯的從東向西的轉移現象,另外,兩個圖中的電子密度從UT41(01∶00—01∶30 LT)開始又出現了短暫的回升,我們認為這是受磁暴影響導致的異常情況.綜上所述,本文提出的新方法在磁暴期間能很好地重構電離層電子密度三維結構,且其三維結構能精確地反映出電子密度的日變化及其異常情況,這有助于后續的電離層探測以及電離層異常擾動研究.

圖12 XGB-CIT在120°E經度面上的電子密度剖面圖Fig.12 Electron density profile of XGB-CIT on 120°E longitude plane

圖13 XGB-CIT在25.5°N緯度面上的電子密度剖面圖Fig.13 Electron density profile of XGB-CIT on 25.5°N latitude plane
針對因觀測數據不足或分布不均導致的反演不適定性問題,本文提出了一種基于機器學習集成算法(XGBoost算法)的電離層層析新方法(XGB-CIT),其中利用XGBoost算法獲取的迭代初值,相較于常用的IRI2016模型值,其精度提高了68%,而基于該初值構建的XGB-CIT模型,在最終的反演精度上也展現了優良的性能,尤其對無觀測信息像素的電子密度反演,其精度有了大幅提高,同時,根據其電子密度的二維和三維剖面圖分析可知,該方法也能精準地反映出電子密度的日變化,另外,由于該方法可以對電離層未來的變化提供相對精準的信息,因此其預測的電子密度還可以為電離層異常擾動的探測提供準確的背景值,因此,我們認為XGB-CIT是一種新的、可靠的電離層探測手段.
致謝感謝湖南省測繪科技研究所提供的GNSS觀測數據,感謝地球物理數據中心——地球系統科學數據共享平臺提供電離層測高儀數據.