胡旻,姚東升
(陜西省突發(fā)事件預(yù)警信息發(fā)布中心,陜西西安 710016)
雷電災(zāi)害是自然災(zāi)害中較為嚴(yán)重的一種,其對(duì)當(dāng)前日趨智能化的社會(huì)發(fā)展有著巨大的影響。因此,預(yù)測(cè)雷電的活動(dòng)情況成為了氣象機(jī)構(gòu)及研究人員關(guān)注的熱點(diǎn)[1-2]。但雷電數(shù)據(jù)量龐大且復(fù)雜,故難以建立精確的數(shù)學(xué)模型。因此,如何根據(jù)氣象數(shù)據(jù)構(gòu)建精準(zhǔn)的雷電災(zāi)害預(yù)測(cè)模型具有重要意義[3]。
由于雷電災(zāi)害會(huì)對(duì)人們的日常生活及生命財(cái)產(chǎn)安全造成威脅,近年來諸多研究人員開展了雷電災(zāi)害的預(yù)測(cè)研究[4-5]。目前,已設(shè)計(jì)了眾多預(yù)測(cè)模型。早期研究中,大多采用線性回歸、聚類分析等方法進(jìn)行雷電預(yù)測(cè)。后期隨著人工智能、深度學(xué)習(xí)(Deep Learning,DL)等技術(shù)的興起,逐漸將其用于預(yù)測(cè)雷電活動(dòng),并取得了一定的效果[6-9]。但上述預(yù)測(cè)方法普遍存在未考慮雷電時(shí)空特性、模型單一等問題。為此,文中基于氣象特征數(shù)據(jù)分析技術(shù)設(shè)計(jì)了一種智能識(shí)別與評(píng)估雷電災(zāi)害的預(yù)測(cè)模型。該模型通過對(duì)氣象特征的智能識(shí)別與評(píng)估來確定雷電的特征數(shù)據(jù),并將其輸入由人工魚群算法(Artificial Fish Swarm Algorithm,AFSA)改進(jìn)的Elman 網(wǎng)絡(luò)中進(jìn)行學(xué)習(xí)分析,從而得到精準(zhǔn)的雷電災(zāi)害預(yù)測(cè)結(jié)果。
為了智能識(shí)別雷電的相關(guān)時(shí)空特征,所提模型采用數(shù)據(jù)挖掘方法分析氣象數(shù)據(jù)[10]。再根據(jù)獲取的特征計(jì)算其本身與預(yù)測(cè)量的皮爾森相關(guān)性系數(shù)(Pearson Correlation Coefficient),從而確定輸入雷電災(zāi)害預(yù)測(cè)模型的特征量。
由于雷電活動(dòng)具有較強(qiáng)的時(shí)空特性,且雷電氣象數(shù)據(jù)存在明顯的時(shí)序性,因此基于季節(jié)與區(qū)域數(shù)據(jù)進(jìn)行特征識(shí)別。其中,時(shí)間屬性的值域?yàn)閧全年,春,夏,秋,冬};空間屬性的值域?yàn)閧全體,城市1,…,城市d}。同時(shí),數(shù)據(jù)樣本為30 min 時(shí)間片內(nèi)的大氣電場(chǎng)強(qiáng)度值。若將全部電場(chǎng)強(qiáng)度值作為模型的輸入量,會(huì)導(dǎo)致信息冗余,所以利用數(shù)據(jù)挖掘的方法獲取電場(chǎng)強(qiáng)度的最值、反轉(zhuǎn)頻率等可以體現(xiàn)時(shí)序性的聚合特征。
針對(duì)識(shí)別的氣象特征,利用相關(guān)性分析獲得此類特征預(yù)測(cè)因子X與預(yù)測(cè)發(fā)生雷電活動(dòng)Y的相關(guān)性。X和Y的皮爾森相關(guān)性系數(shù)計(jì)算如下:
式中,μx、μy為協(xié)方差;σx、σy為標(biāo)準(zhǔn)差;E(·)為期望。
通過對(duì)全部特征預(yù)測(cè)因子和雷電活動(dòng)發(fā)生相關(guān)性的統(tǒng)計(jì)分析,得到電場(chǎng)探測(cè)量、電場(chǎng)全距、極性反轉(zhuǎn)、電場(chǎng)值差分最大值、電場(chǎng)值差分絕對(duì)值均值及接近閃電這六個(gè)預(yù)測(cè)因子的Px,y均大于0.3,由此便可將其作為預(yù)測(cè)模型的輸入量。
由于雷電天氣復(fù)雜且多變,為了能準(zhǔn)確掌握其變化趨勢(shì),從而減少經(jīng)濟(jì)損失,故構(gòu)建AFSA-Elman網(wǎng)絡(luò)模型進(jìn)行預(yù)測(cè)。其中,Elman 網(wǎng)絡(luò)[11-13]能夠處理雷電的時(shí)序數(shù)據(jù),且經(jīng)過AFSA 算法[14-16]優(yōu)化提高了其預(yù)測(cè)性能。
Elman 神經(jīng)網(wǎng)絡(luò)具有內(nèi)部反饋與前饋相連的結(jié)構(gòu)特點(diǎn),因此具備了記憶特性,能有效解決具有時(shí)序依賴關(guān)系的時(shí)間序列預(yù)測(cè)問題。該網(wǎng)絡(luò)的結(jié)構(gòu)如圖1 所示。Elman 網(wǎng)絡(luò)通過在隱含層中增加一個(gè)承接層,并將其作為一步延時(shí)算子,收集與存儲(chǔ)隱含層的輸出值,從而具備了適應(yīng)時(shí)變特性的能力。

圖1 Elman神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
假設(shè)Elman 網(wǎng)絡(luò)有n個(gè)輸入及輸出,而隱含層也包含n個(gè)神經(jīng)元,則其非線性狀態(tài)可表示為:
式中,x(t)、xc(t)、u(t-1)分別為隱含層節(jié)點(diǎn)量、反饋狀態(tài)量和輸入量;ω1、ω3分別為輸入層與隱含層、隱含層與承接層的連接權(quán)重;f(?)為隱含層的激活函數(shù),模型選擇了S 型函數(shù),即:
則m維輸出節(jié)點(diǎn)量y(t)表示為:
式中,ω2為隱含層與輸出層的連接權(quán)重;g(?)為輸出層的激活函數(shù),同樣也選擇了Sigmoid 函數(shù)。
AFSA 采用模擬魚群覓食、聚群、追尾及隨機(jī)等四種行為方式尋找全局最優(yōu)解。假定在一個(gè)k維空間里人工魚的個(gè)體狀態(tài)是Q=(q1,q2,…,qk),則魚群的尋優(yōu)行為表述如下:
1)當(dāng)處于覓食行為狀態(tài)時(shí),若存在一個(gè)狀態(tài)Qj的目標(biāo)函數(shù)比當(dāng)前狀態(tài)Qi小,則根據(jù)設(shè)置的步長(zhǎng)向Qj移動(dòng),數(shù)學(xué)表達(dá)為:
式中,υ、s分別為人工魚的視野和最大步長(zhǎng);rand(t)為t時(shí)刻隨機(jī)數(shù)生成的函數(shù)。
否則,維持原狀態(tài)Qi。并在選取的視野范疇內(nèi)反復(fù)搜尋狀態(tài)Qj,若仍未移動(dòng),則進(jìn)行隨機(jī)行為。
2)當(dāng)處于聚群行為狀態(tài)時(shí),在視野范疇內(nèi)搜尋毗鄰的人工魚數(shù)量kf以及統(tǒng)計(jì)中心位置Qc。若在寬松環(huán)境下,Qc的目標(biāo)函數(shù)Cc比原始位置的Ci小,則根據(jù)設(shè)置的步長(zhǎng)向Qc移動(dòng),數(shù)學(xué)表達(dá)為:
式中,γ為擁擠程度的因子。
否則,進(jìn)行覓食行為。
3)當(dāng)處于追尾行為狀態(tài)時(shí),若毗鄰人工魚的目標(biāo)函數(shù)Cj比當(dāng)前位置的Ci小,即向毗鄰的人工魚移動(dòng);否則,進(jìn)行覓食行為。
4)隨機(jī)行為是一種隨機(jī)游動(dòng),并在更大的范圍內(nèi)尋找食物或同伴的行為,其數(shù)學(xué)表達(dá)為:
由于Elman 神經(jīng)網(wǎng)絡(luò)采用梯度下降法(Gradient descent)更新權(quán)重,易陷入局部極值。因此,利用AFSA 優(yōu)化Elman 神經(jīng)網(wǎng)絡(luò)的權(quán)值及閾值,并通過將雷電特征值輸入訓(xùn)練完成的最優(yōu)Elman 神經(jīng)網(wǎng)絡(luò)中進(jìn)行分析,從而得到高精度的預(yù)測(cè)結(jié)果?;贏FSA-Elman 模型的雷電災(zāi)害預(yù)測(cè)流程如圖2所示。

圖2 該文模型的雷電災(zāi)害預(yù)測(cè)流程
首先,初始化種群和網(wǎng)絡(luò)參數(shù),利用AFSA 算法優(yōu)化Elman 網(wǎng)絡(luò)模型的權(quán)重和閾值,其中各人工魚選擇執(zhí)行行為并生成新的魚群,再通過適應(yīng)度值的比較確定最優(yōu)解;然后,將AFSA 算法輸出的最優(yōu)解賦給Elman 網(wǎng)絡(luò)模型的權(quán)重與閾值,再經(jīng)過迭代更新獲得最優(yōu)的Elman 網(wǎng)絡(luò)模型;最后,將選取的六個(gè)雷電數(shù)據(jù)特征輸入訓(xùn)練好的Elman 網(wǎng)絡(luò)模型中進(jìn)行學(xué)習(xí)分析,進(jìn)而得到最終的雷電災(zāi)害預(yù)測(cè)結(jié)果。
實(shí)驗(yàn)中的氣象雷電數(shù)據(jù)來源于中國(guó)氣象局公布的相關(guān)數(shù)據(jù),以及閃電監(jiān)測(cè)定位系統(tǒng)實(shí)時(shí)獲取的雷電數(shù)據(jù)。具體而言,選擇上海、鄭州、武漢、成都、九寨溝和拉薩這六個(gè)城市2021 年的雷電相關(guān)數(shù)據(jù),如發(fā)生雷電的天數(shù)等。
實(shí)驗(yàn)在Windows10 和Python3.7.6 的環(huán)境下進(jìn)行,為實(shí)現(xiàn)GPU 加速訓(xùn)練,還基于Nvidia 顯卡安裝Cuda Tookit(9.1.243)以及cuDNN(7.5.0.32)。
實(shí)驗(yàn)中采用平均絕對(duì)百分比誤差(Mean Absolute Percentage Error,MAPE)作為評(píng)估指標(biāo),計(jì)算公式如下:
式中,、Yt分別為預(yù)測(cè)值和真實(shí)值。
利用AFSA-Elman 模型對(duì)成都地區(qū)一年內(nèi)各個(gè)月份的雷電災(zāi)害進(jìn)行預(yù)測(cè)。雷電災(zāi)害發(fā)生的概率如圖3 所示。

圖3 雷電災(zāi)害月預(yù)測(cè)結(jié)果
從圖3可以看出,雷電最初發(fā)生于3月下旬,大約在11 月上旬結(jié)束,且大多集中于夏季,即6-8 月。這是由于夏季酷熱,易形成強(qiáng)對(duì)流天氣,從而導(dǎo)致雷電頻發(fā)。此外,所提模型得到的預(yù)測(cè)值變化趨勢(shì)與真實(shí)值基本一致,且數(shù)值較為接近。然而,6月和8月的預(yù)測(cè)值與真實(shí)值相差較大,這可能是因?yàn)橥话l(fā)極端天氣或天氣轉(zhuǎn)好所造成的??傮w而言,AFSA-Elman模型能夠達(dá)到理想的預(yù)測(cè)效果。
以一年為計(jì)算周期,不同地區(qū)雷電發(fā)生百分率實(shí)際值與預(yù)測(cè)值的結(jié)果如表1 所示。

表1 不同地區(qū)的預(yù)測(cè)結(jié)果
由表1 可知,隨著海拔的升高以及地形的變化,雷電災(zāi)害發(fā)生概率也在呈上升趨勢(shì),如拉薩市達(dá)到了20.71%,而平原地區(qū)的鄭州市僅為6.19%。由于在特殊地形與環(huán)境下強(qiáng)對(duì)流天氣活動(dòng)頻繁,常伴有雷電、冰雹等天氣,因此導(dǎo)致預(yù)測(cè)效果有所降低,故拉薩市的預(yù)測(cè)誤差為2.12%。但該模型在中東部地區(qū)的預(yù)測(cè)精度是可靠的,預(yù)測(cè)誤差均不超過0.1%。
為論證所提模型對(duì)于雷電災(zāi)害的預(yù)測(cè)性能,將其與反向傳播(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò)、Elman網(wǎng)絡(luò)、長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(Long Short Term Memory,LSTM)進(jìn)行對(duì)比分析。四種模型對(duì)于2018-2021 年上海地區(qū)雷電災(zāi)害預(yù)測(cè)結(jié)果的MAPE 值如圖4 所示。

圖4 雷電預(yù)測(cè)誤差結(jié)果對(duì)比
從圖4 可知,相比于其他網(wǎng)絡(luò)模型,所提模型預(yù)測(cè)結(jié)果的MAPE 值最小,且均小于0.03。原因在于,該模型在利用統(tǒng)計(jì)法獲取雷電特征的基礎(chǔ)上進(jìn)行預(yù)測(cè)分析,能夠較好地保證預(yù)測(cè)結(jié)果,并具有良好的預(yù)測(cè)穩(wěn)定性,此外時(shí)間的變化還不會(huì)對(duì)預(yù)測(cè)結(jié)果造成較大的波動(dòng)。而采用BP 神經(jīng)網(wǎng)絡(luò)獲得的預(yù)測(cè)結(jié)果誤差較大,其MAPE 均超過了0.06,最大值甚至接近0.09。Elman 及LSTM 網(wǎng)絡(luò)則均可有效處理時(shí)序數(shù)據(jù),因此預(yù)測(cè)精度與BP 神經(jīng)網(wǎng)絡(luò)相比有一定的提升。但由于網(wǎng)絡(luò)本身結(jié)構(gòu)存在不足,故相較于該模型,兩者預(yù)測(cè)結(jié)果的MAPE 均較高。
綜合來看,所提模型利用AFSA 算法優(yōu)化Elman網(wǎng)絡(luò),可使結(jié)構(gòu)更加合理,神經(jīng)元也更為敏感,能夠更準(zhǔn)確地預(yù)測(cè)雷電災(zāi)害。同時(shí)其還利用皮爾森相關(guān)性系數(shù)篩選雷電特征數(shù)據(jù),進(jìn)一步保證了預(yù)測(cè)的可靠性。由此說明,該模型可實(shí)現(xiàn)對(duì)雷電災(zāi)害的有效預(yù)測(cè)。
由于雷電數(shù)據(jù)量龐大且復(fù)雜,傳統(tǒng)數(shù)據(jù)分析方法難以實(shí)現(xiàn)精準(zhǔn)預(yù)報(bào),因此,該文設(shè)計(jì)了一種基于氣象特征數(shù)據(jù)分析的雷電災(zāi)害預(yù)測(cè)模型。通過計(jì)算氣象特征的皮爾森相關(guān)性系數(shù)完成對(duì)雷電特征的識(shí)別,并將其輸入至AFSA-Elman 模型中進(jìn)行預(yù)測(cè)分析,以實(shí)現(xiàn)對(duì)雷電災(zāi)害的可靠預(yù)測(cè)。結(jié)合各地區(qū)的氣象與雷電相關(guān)數(shù)據(jù)進(jìn)行的實(shí)驗(yàn)分析結(jié)果表明,所提模型能夠?qū)崿F(xiàn)時(shí)、空兩方面的精準(zhǔn)預(yù)測(cè),且整體預(yù)測(cè)的MAPE 小于0.03,優(yōu)于其他對(duì)比模型,進(jìn)而為雷電災(zāi)害的發(fā)生情況提供了參考。但該模型并未對(duì)雷電災(zāi)害的實(shí)時(shí)發(fā)生情況進(jìn)行精準(zhǔn)定位及預(yù)測(cè),因此這也將是下一步的研究重點(diǎn)。