宮 哲 鄒自明 陸 陽
1(中國科學院國家空間科學中心 北京 100190)
2(中國科學院大學 北京 100049)
太陽質(zhì)子事件是一種空間天氣現(xiàn)象。太陽活動例如耀斑和日冕物質(zhì)拋射(CME)等爆發(fā)時,會噴射出大量的高能粒子,其中一部分會從太陽低層大氣傳播到近地空間,并被地球附近的衛(wèi)星或飛行器探測到[1]。當高能粒子通量達到一定標準時,便認為發(fā)生了太陽質(zhì)子事件。中國空間環(huán)境預測中心將太陽質(zhì)子事件定義為:在地球同步軌道上探測能量大于10 MeV 的質(zhì)子,每5 min 計算一次平均積分通量,單位pfu(1 pfu=1 cm–2·s–1·sr–1)。當連續(xù)三次積分通量大于10 pfu 時,便認為發(fā)生了太陽質(zhì)子事件。太陽質(zhì)子事件中,大量的高能粒子會對航天器和宇航員產(chǎn)生嚴重危害,因此準確的太陽質(zhì)子事件短期預報對航天活動災害預防是非常必要的。
根據(jù)預報方法的不同,可以將太陽質(zhì)子事件的預報模式分為物理預報模式和經(jīng)驗預報模式兩種。物理預報模式是基于太陽質(zhì)子事件發(fā)生的物理機制建立預報模型。例如,SOLPENCO 模型[1]根據(jù)從太陽質(zhì)子事件開始到激波到達拉格朗日點(L1)的時間計算質(zhì)子事件的通量變化趨勢對太陽質(zhì)子事件進行預報;SEPMOD 模型[2]通過計算給定位置的高能粒子通量曲線實現(xiàn)太陽質(zhì)子事件的預報。經(jīng)驗預報模式是基于質(zhì)子事件相關(guān)的太陽活動與現(xiàn)象,例如利用太陽黑子,太陽耀斑,日冕物質(zhì)拋射等,對太陽質(zhì)子事件進行預報。2006 年美國空軍實驗室(AFRL)以IMP 系列衛(wèi)星于1997-2001 年觀測到的21 個質(zhì)子事件與對應耀斑之間的關(guān)系為基礎(chǔ),建立了質(zhì)子預報系統(tǒng)(Proton Prediction System,PPS)[3],其報準率能達到85.71%,但是虛報率高達50%;2009 年,Laurenza等[4]選取了1995-2005 年的70 個太陽質(zhì)子事件,以耀斑經(jīng)緯度、耀斑重要性等級、軟X 射線積分通量和射電噪暴積分通量等作為輸入建立預報模型,該預報模型將虛報率降低至42%的同時,報準率也下降至63%;Nú?ez[5]提出了UMASEP 模型,該模型通過分析第22 和第23 太陽活動周期間軟 X 射線和近地空間的 9~500 MeV 的微分質(zhì)子通量等數(shù)據(jù),預報太陽質(zhì)子事件發(fā)生與否,其報準率為80.72%,虛報率為33.99%。Huang 等[6]使用集成學習的方法,基于耀斑和CME 相關(guān)數(shù)據(jù)建立了兩個隱樸素貝葉斯模型,并將這兩個模型集成對太陽質(zhì)子事件進行預測,取得了78.57%的報準率和50%的虛報率。Zhong 等[7]通過分析地球靜止運行環(huán)境衛(wèi)星5 min 平均軟X 射線通量和差分積分質(zhì)子通量,預測在未來24 h 內(nèi)是否會發(fā)生太陽質(zhì)子事件,其報準率為80.00%,虛報率為25.85%。
現(xiàn)存太陽質(zhì)子事件短期預報方法的局限性主要在于:在獲得較高的報準率時,虛報率依然較高。針對這個問題,本文提出一種基于集成學習的太陽質(zhì)子事件短期預報方法,選取了8 種具有不同特點的機器學習模型,以現(xiàn)存方法中廣泛使用的太陽黑子數(shù)據(jù)、耀斑數(shù)據(jù)、CME 數(shù)據(jù)作為輸入對模型進行訓練,并通過一定的決策方式將8 個模型集成為一個協(xié)同作業(yè)系統(tǒng),用以預報太陽質(zhì)子事件24 h 內(nèi)是否發(fā)生。本文選取了完整的第23 太陽活動周的數(shù)據(jù)進行實驗,并在完整覆蓋太陽活動高年和低年的數(shù)據(jù)上進行了模型構(gòu)建與測試,取得了80.95%的報準率的同時,將虛報率降低至19.05%,相比現(xiàn)有的預報系統(tǒng)具有較為明顯的優(yōu)勢。
使用包括太陽耀斑、CME、太陽黑子三類數(shù)據(jù)用于太陽質(zhì)子事件的短期預報,選取依據(jù)和使用的參數(shù)如下。
(1)太陽耀斑。太陽耀斑是發(fā)生在太陽大氣層局部區(qū)域的一種劇烈的爆發(fā)現(xiàn)象。根據(jù)Kahler[8]提出的大耀斑假說,耀斑的大小與高能粒子事件的發(fā)生有著密切的聯(lián)系。Le 等[9]的研究也表明,太陽耀斑對于能量大于10 MeV 的質(zhì)子加速有明顯貢獻。本文所使用的耀斑數(shù)據(jù)主要包括X 射線耀斑等級和耀斑位置兩項參數(shù)。
(2)CME。CME 是日冕磁場以及積聚在日冕中的等離子體團在較短時間內(nèi)向行星際爆發(fā)的現(xiàn)象。根據(jù)Kahler 等[10]的研究,CME 與太陽質(zhì)子事件中高能粒子的峰值通量有很強的相關(guān)性。Wang 等[11]也曾提出,速度大且源區(qū)位置距離日面上連接地球磁力線足點近的全暈CME 極易引發(fā)太陽質(zhì)子事件。本文所使用的CME 數(shù)據(jù)主要包括中心位置角、角寬度、線速度和加速度四項參數(shù)。
(3)太陽黑子。太陽黑子是太陽光球?qū)颖砻嫔钌膮^(qū)域,是日面強磁場的產(chǎn)物,與耀斑和CME 都具有密切的聯(lián)系。Mariachiara 等[12]和Aoife 等[13]曾采用太陽黑子相關(guān)數(shù)據(jù)進行耀斑預測。Howard[14]曾提出太陽黑子處的強磁場與CME 的形成緊密相關(guān)。Bai 等[15]的研究也表明了太陽黑子與太陽質(zhì)子事件之間較強的相關(guān)性。本文使用的太陽黑子數(shù)據(jù)主要包括黑子群的磁極性分類、McIntosh 分類[16]、黑子群位置、黑子群面積、黑子數(shù)目以及經(jīng)度范圍6 項參數(shù)。
本文所使用的太陽質(zhì)子事件、太陽耀斑和CME的數(shù)據(jù)來源于美國協(xié)作數(shù)據(jù)分析工作室(CDAW),太陽黑子的數(shù)據(jù)來源于美國國家地球物理數(shù)據(jù)中心(NGDC)官方網(wǎng)站。為了使預報系統(tǒng)全面地學習太陽活動高年和太陽活動低年中太陽質(zhì)子事件的活動規(guī)律,選用了一個完整的太陽活動周——第23 個太陽活動周(1997-2007 年)的數(shù)據(jù)。該選擇參考了Xu 等[17]對太陽活動周的劃分。該活動周內(nèi)有記錄的太陽質(zhì)子事件共105 次,由于設(shè)備的故障造成數(shù)據(jù)殘缺,有25 次事件未被使用。數(shù)據(jù)的總量為654 條,每條數(shù)據(jù)由相關(guān)聯(lián)的CME、太陽耀斑和太陽黑子的參數(shù)組成。數(shù)據(jù)的關(guān)聯(lián)工作由CDAW 完成。其中有80 條數(shù)據(jù)對應了太陽質(zhì)子事件的發(fā)生,574 條無太陽質(zhì)子事件發(fā)生。
選取在多個領(lǐng)域中廣泛使用的機器學習模型,采用太陽質(zhì)子事件預報中常用的評價指標,以交叉驗證的方式計算每個模型的指標并依此為模型賦予權(quán)重,然后通過加權(quán)投票的方式將其集成為一個模型。集成模型能夠綜合所有單一模型的優(yōu)點,擁有更強的預報能力。
本質(zhì)上,太陽質(zhì)子事件的短期預報(發(fā)生與否)是機器學習領(lǐng)域中常見的二分類問題。近些年來,一些機器學習分類模型(下稱模型)在太陽質(zhì)子事件預報中得到了一定的應用,但是僅限于單個模型的使用,普遍存在虛報率較高的問題。表1 給出了本文選用的用于太陽質(zhì)子事件的短期預報8 種模型。每個模型經(jīng)過訓練后,對于一條輸入數(shù)據(jù),會預報24 h 內(nèi)發(fā)生質(zhì)子事件的概率,當概率大于50%時,認為24 h 內(nèi)會有太陽質(zhì)子事件發(fā)生。

表1 本文使用的8 種機器學習模型Table 1 Machine learning models applied in this study
2.2.1 評價指標
模型對太陽質(zhì)子事件的預報能力需要一定的指標來進行衡量。目前太陽質(zhì)子事件短期預報中廣泛采用的評價指標包括報準率(Rpd)和虛報率(Rfa),即

其中:NTP為真正例(True Positive,TP),表示將正類(發(fā)生了太陽質(zhì)子事件的數(shù)據(jù))正確預測為正類的數(shù)量;NFP為假正例(False Positive,FP),表示將負類(未發(fā)生太陽質(zhì)子事件的數(shù)據(jù))錯誤預測為正類的數(shù)量;NFN(False Negative,FN) 為假負例,表示將正類錯誤預測為負類的數(shù)量。
但是單獨使用報準率和虛報率兩項指標之一,并不能完全反映一個模型對質(zhì)子事件的預測能力。因此引入了F1值作為綜合評價指標,其計算方式如下:

2.2.2 評價方法——交叉驗證
交叉驗證是用于評價一種機器學習模型是否適用于當前應用場景(在本文中是太陽質(zhì)子事件短期預報)的實驗方法。交叉驗證的第一步即是將數(shù)據(jù)集按照特定規(guī)律劃分。根據(jù)機器學習領(lǐng)域中的慣例,結(jié)合本文數(shù)據(jù)集規(guī)模,表2 給出了本文數(shù)據(jù)集的劃分方式。

表2 實驗數(shù)據(jù)的劃分方式Table 2 Dataset division strategy
(1)將數(shù)據(jù)集按照約3∶1 的比例劃分為訓練集和測試集。這種劃分并非是隨機劃分,而是采用時序分層劃分的方式。首先將數(shù)據(jù)按照時間順序排列,取前4 條出列,從中隨機取3 條劃入訓練集,剩余1 條劃入測試集。重復此過程,直至整個數(shù)據(jù)集被劃分完畢。采用這種劃分方式,可以使太陽活動高年和太陽活動低年的數(shù)據(jù)被均勻地分配到訓練集和測試集中,使模型對于太陽高年和太陽活動低年的太陽質(zhì)子事件均有較強的預報能力。
(2)將訓練集按照4∶1 的比例進一步劃分為交叉訓練集和交叉驗證集。需要注意的是:在訓練集的劃分中,交叉訓練集和交叉驗證集不是固定的,而是將訓練集平均分為5 個子集后隨機取4 個子集合并作為交叉訓練集,剩余1 個子集作為交叉驗證集,共有5 種不同的組合。這里的5 等分同樣采用時序分層的劃分方式,將數(shù)據(jù)按照時間順序排列后,取前5 條出列,并將其隨機劃分到5 個子集中。重復此過程,直至整個數(shù)據(jù)集被劃分完畢。因此每種組合中都等比例地包含太陽活動高年和太陽活動低年的數(shù)據(jù)。
將交叉訓練集輸入到某個模型對其進行訓練,并將其對應的交叉驗證集輸入到訓練后的模型中進行預報,則可以獲得一組報準率,虛報率和F1值用于評價該模型的預報能力。在訓練集5 種不同的組合上均進行一次實驗,稱為一次交叉驗證。每次交叉驗證,都會獲得5 個報準率,虛報率和F1值,以其均值表征模型預報的準確性。
模型評價完成后,需要根據(jù)評價結(jié)果對模型進行集成,以綜合利用多個模型的優(yōu)點。由于F1值綜合了一個模型報準率與虛報率,更能代表一個模型的預報能力,因此選用F1值作為每個模型的權(quán)重用來對模型進行集成。集成采用了一種加權(quán)投票的方式。
設(shè)定一條數(shù)據(jù)輸入集成模型后預報所得的輸出(即質(zhì)子事件發(fā)生的概率)為,則有

其中,N為單個模型的數(shù)量,wi為單個模型的權(quán)重,pi為單個模型的輸出。預報閾值設(shè)置為0.5,若0.5則認為短期內(nèi)會發(fā)生太陽質(zhì)子事件;反之則認為不會。
為了使集成模型輸出的取值范圍在0 和1 之間,需要對每個模型的F1值做歸一化處理得到權(quán)重

集成后的模型首先使用訓練集數(shù)據(jù)進行訓練,訓練得到的模型即是最終的預報模型。使用測試集對其預報能力進行測試。測試集則是從未參與過預報模型訓練的數(shù)據(jù),預報模型對其未知,性質(zhì)等同于生產(chǎn)環(huán)境中新到來的數(shù)據(jù),因此可以很好地用來測試集成模型的能力。
根據(jù)表2 的數(shù)據(jù)集劃分,在訓練集上對選用的8 種模型進行交叉驗證后得到的報準率,虛報率和F1值的均值列于表3。

表3 八種模型各自在交叉驗證中的表現(xiàn)Table 3 Performance of 8 individual models on cross-validation dataset
獲取到F1值的均值之后,利用2.3 節(jié)中介紹的模型集成方法,將8 種模型集成為一個最終的預報模型,在訓練集上訓練后,在測試集上對集成模型測試。
測試集數(shù)據(jù)共164 條,有21 條數(shù)據(jù)對應了太陽質(zhì)子事件的發(fā)生。表4 為集成模型對測試集中太陽質(zhì)子事件的預報結(jié)果。其中17 次被集成模型正確預測,而2001 年11 月17 日,2002 年8 月14 日,2003年12 月2 日,2004 年11 月1 日發(fā)生的4 次太陽質(zhì)子事件被漏報。由表4 可以看出,漏報的4 次太陽質(zhì)子事件峰值通量均在10~100 pfu 之間。

表4 集成模型對測試集中的太陽質(zhì)子事件的預報結(jié)果Table 4 SPEs prediction result of the ensemble model on the test set
此外,有4 條并未對應太陽質(zhì)子事件發(fā)生的數(shù)據(jù),被虛報為有太陽質(zhì)子事件發(fā)生。將測試結(jié)果匯總列于表5,計算得到報準率為80.95%,誤報率為19.05%。

表5 集成模型在測試集上的預報結(jié)果Table 5 Result of the ensemble model on the test set
為了直觀地說明本文預報方法的性能,表6 給出了本文實驗結(jié)果與美國空軍實驗室的PPS 系統(tǒng),Laurenza 模型,Nú?ez 等開發(fā)的UMASEP 模型,以及Qiuzhen 等方法預報性能的對比情況。由表6 可以看出,本文方法在保證80%以上報準率的基礎(chǔ)上,進一步降低了虛報率,模型綜合表現(xiàn)(F1值)有了明顯的提升。

表6 本文模型與現(xiàn)行其他預報方法的對比Table 6 Comparison with other current prediction methods
根據(jù)上述的實驗與結(jié)果進行分析,本文在以下幾個方面取得了一定成果。
(1)提出了一種基于集成學習的太陽質(zhì)子事件短期預報的方法。該方法選用了8 種廣泛使用的機器學習模型,通過交叉驗證評價和加權(quán)投票機制獲得了一個集成的預報模型。
(2)本文模型在對太陽質(zhì)子事件預報的報準率高達80.95%的同時,進一步將虛報率降低至19.05%。相比現(xiàn)有的預報方法性能有較大的改善。
(3)本文使用了一個完整的太陽活動周的數(shù)據(jù),并且通過時序分層劃分的方式,保證了模型訓練和模型測試的數(shù)據(jù)中都包括了太陽活動高年與太陽活動低年的數(shù)據(jù)。因此,本文模型對于太陽活動高年和低年的太陽質(zhì)子事件均具有較好的預報能力。
本文的集成預報模型在太陽質(zhì)子事件短期預報任務中擁有較強的能力,如果能夠?qū)⒃摷赡P瓦M行工程化,形成功能完備的業(yè)務預報系統(tǒng),并應用于實際航天任務中,則能更加有效地進行航天任務的規(guī)劃,規(guī)避或減少對航天器與航天員的傷害。此外,本文中僅應用了太陽黑子、太陽耀斑、CME 相關(guān)數(shù)據(jù)進行太陽質(zhì)子事件短期預報。然而太陽質(zhì)子事件的形成是一個極為復雜的物理過程。高能粒子的產(chǎn)生,粒子的加速機制與行星際運輸過程等,均受到日地空間多重因素影響。近地X 射線背景、總太陽輻照度、太陽射電通量以及射電噪暴等現(xiàn)象都與太陽質(zhì)子事件的形成密切相關(guān)。相關(guān)輸入數(shù)據(jù)集的選擇、擴充和完善,則有機會獲得更為精準的太陽質(zhì)子事件短期預報模型。這些都將是下一步研究的方向。
致謝國家科技資源共享服務平臺國家空間科學數(shù)據(jù)中心(http://www.nssdc.ac.cn)提供計算服務,美國協(xié)作數(shù)據(jù)分析工作室(CDAW)提供太陽耀斑與CME 相關(guān)數(shù)據(jù),美國國家地球物理數(shù)據(jù)中心(NGDC)提供太陽黑子相關(guān)數(shù)據(jù)以及太陽質(zhì)子事件列表。