劉暉,向諄,周恩澤,周洋卓君,黃宇,向坤軒,周游
(1.長沙理工大學(xué)電氣與信息工程學(xué)院智能電網(wǎng)運行與控制湖南省重點實驗室,長沙 410114;2.廣東電網(wǎng)有限責(zé)任公司電力科學(xué)研究院,廣州 510080)
近年來,隨著“退耕還林”政策的實施,以及人民生產(chǎn)生活用火習(xí)俗和各種極端天氣等因素影響,輸電走廊附近易爆發(fā)大范圍山火災(zāi)害,嚴(yán)重影響電網(wǎng)安全穩(wěn)定運行[1-3]。山火分布規(guī)律研究表明,輸電走廊山火具有時空分布不均衡特性[4-6]。在時間上呈現(xiàn)較強(qiáng)的季節(jié)和時節(jié)性特點,每年9 月至翌年4 月是相對高發(fā)期,并隨著春節(jié)、清明等民俗節(jié)氣因素而呈現(xiàn)逐日增長的爆發(fā)性趨勢;在空間上具有明顯地域性特征,靠近人類生活和交通運輸區(qū)域的輸電走廊區(qū)段通常發(fā)生山火的概率也會高于偏遠(yuǎn)地區(qū)。開展輸電走廊山火時空分布研究,確定特定時段的山火高發(fā)生風(fēng)險區(qū)域,有助于運維單位開展針對性的防山火工作,提升電網(wǎng)安全穩(wěn)定運行性。
早期氣象和林業(yè)部門根據(jù)天氣因素和歷史火災(zāi)數(shù)據(jù)建立森林火險氣象指數(shù),預(yù)測大范圍區(qū)域火險等級[7-10],但是該類方法不適用于目標(biāo)需求更加精細(xì)化的輸電走廊山火預(yù)測。文獻(xiàn)[11]在森林火險氣象指數(shù)的基礎(chǔ)上,引入了地表燃燒因子和歷史火情因子,構(gòu)建圖模型評估輸電線路山火風(fēng)險等級。文獻(xiàn)[12]綜合考慮氣象、衛(wèi)星監(jiān)測熱點、工農(nóng)業(yè)用火和隱患點要素,通過賦予不同的權(quán)重計算山火預(yù)警值實現(xiàn)輸電走廊山火風(fēng)險評估和預(yù)警。但是上述方法中的各要素權(quán)重由專家主觀確定,受人為影響較大。為降低專家主觀經(jīng)驗不足造成的山火風(fēng)險誤判,文獻(xiàn)[13]結(jié)合電網(wǎng)歷史監(jiān)測數(shù)據(jù),利用BP 神經(jīng)網(wǎng)絡(luò)評估輸電線路山火風(fēng)險。文獻(xiàn)[14-15]選取人為、氣象、地形和植被因子,構(gòu)建Logistic 回歸模型實現(xiàn)了輸電走廊山火風(fēng)險評估。文獻(xiàn)[16-17]采用樸素貝葉斯網(wǎng)絡(luò)進(jìn)行山火風(fēng)險評估,繪制了山火風(fēng)險分布圖。但是這些模型通常要求因子和要素之間相互獨立,且所選變量為年平均值,未考慮氣象等因子隨時間和季節(jié)的動態(tài)變化對山火發(fā)生的影響。綜上,目前輸電線路山火風(fēng)險評估和預(yù)測存在兩方面問題,一是構(gòu)建模型過程中變量對山火發(fā)生事件的影響差異主要以主觀或客觀權(quán)重來體現(xiàn),沒有考慮山火影響因子之間的相互耦合關(guān)系;二是模型變量通常選擇的是當(dāng)下時刻的值或者年平均分布情況,然而山火發(fā)生的概率除了和當(dāng)下的氣象條件有關(guān)以外,還和過去幾天的氣象和近期的人類活動變化有關(guān),現(xiàn)有的因子變量無法體現(xiàn)山火發(fā)生的時空聚集性。
為此,本文提出了一種基于動態(tài)貝葉斯網(wǎng)絡(luò)(dynamic Bayesian network,DBN)的山火風(fēng)險時空分布評估方法。首先,綜合選取和收集了人為、氣象、植被和地理四大類共計17 個山火因子,利用隨機(jī)森林算法篩選最優(yōu)因子集。然后利用靜態(tài)貝葉斯網(wǎng)絡(luò)消除因子之間耦合關(guān)系的基礎(chǔ)上,建立了動態(tài)貝葉斯網(wǎng)絡(luò)模型,對比月時間尺度下靜態(tài)貝葉斯網(wǎng)絡(luò)和動態(tài)貝葉斯網(wǎng)絡(luò)模型對山火風(fēng)險評估的影響,探索引入過去的因素對于山火風(fēng)險評估的影響,并研究不同時間尺度對的動態(tài)貝葉斯網(wǎng)絡(luò)性能的影響。最后,利用最優(yōu)山火評估模型繪制輸電走廊山火風(fēng)險分布圖驗證了模型的工程適用性。
為了更好地應(yīng)對突發(fā)性的山火災(zāi)害,本文提出了一種輸電走廊山火風(fēng)險時空評估方法,主要分為數(shù)據(jù)收集與預(yù)處理、因子優(yōu)選和山火風(fēng)險分布評估3個部分,總體框架如圖1所示。

圖1 輸電走廊山火風(fēng)險時空評估框架Fig.1 Framework for assessing the spatial-temporal distribution of wildfire risk in transmission line corridors
1)數(shù)據(jù)收集與預(yù)處理。首先,從氣象部門和電力部門收集得到氣象、人為、植被和地理數(shù)據(jù),采用箱線圖檢測數(shù)據(jù)集中的異常值并對空缺值進(jìn)行填充,得到山火因子數(shù)據(jù)集。然后,為進(jìn)行不同時間的山火風(fēng)險評估,將歷史火點按照一定的時間間隔進(jìn)行劃分,得到不同時間的火點分布。最后,將研究區(qū)域按照經(jīng)緯度進(jìn)行網(wǎng)格劃分,其中火點所在網(wǎng)格作為火點樣本點,其他網(wǎng)格則作為非火點樣本點,獲得不同空間上的火點分布。利用地理信息軟件將山火特征數(shù)據(jù)提取至火點和非火點樣本點,構(gòu)成原始的山火樣本數(shù)據(jù)集。
2)因子優(yōu)選。原始的山火樣本數(shù)據(jù)集因子眾多,過多的冗余因子可能會帶來不必要的噪聲影響模型性能。因此采用隨機(jī)森林算法進(jìn)行因子優(yōu)選,通過Bootstrap重抽樣技術(shù)將數(shù)據(jù)集劃分為訓(xùn)練數(shù)據(jù)集和袋外數(shù)據(jù)集,在訓(xùn)練集上同步訓(xùn)練決策樹。然后逐一對因子施加擾動并計算袋外誤差,得到各因子的重要度排序,得到最優(yōu)因子集。
3)山火風(fēng)險分布評估。將篩選得到的山火因子數(shù)據(jù)集離散化,作為動態(tài)貝葉斯網(wǎng)絡(luò)模型的輸入,采用極大似然估計法學(xué)習(xí)初始網(wǎng)絡(luò)和轉(zhuǎn)移網(wǎng)絡(luò)的條件概率。然后以受試者工作特性曲線(receiver operating characteristic,ROC)和曲線下方面積(area under curve,AUC)作為評價指標(biāo),評估模型在測試集上的預(yù)測效果。
可燃物、助燃物和著火源是火災(zāi)發(fā)生必備的三要素[18],其中可燃物和助燃物為自然因子,著火源包括人為火源和自然火源。早期的森林火災(zāi)預(yù)測預(yù)報研究[19]主要從自然因子出發(fā),考慮氣象和植被等因子,建立綜合評價指標(biāo)對大范圍的森林區(qū)域進(jìn)行籠統(tǒng)的火險等級預(yù)測,該方法準(zhǔn)確性主要依賴于氣象數(shù)據(jù)的精確度。而輸電線路大多穿梭于人類活動較為頻繁的山區(qū)和田地,線路周邊居民生產(chǎn)生活以及祭祖用火頻繁、且地形和植被等因子相互關(guān)聯(lián),山火爆發(fā)隨機(jī)性強(qiáng),僅考慮自然因子的林火預(yù)報難以實現(xiàn)對小范圍輸電線路山火的準(zhǔn)確預(yù)測。2017年國家電網(wǎng)公司頒布《架空輸電線路山火分布圖繪制導(dǎo)則》[20],采用了歷史火點密度表征人為火源分布情況,同時考慮植被燃燒危害等級評估輸電線路山火風(fēng)險。但該方法未考慮氣象和地形等助燃物要素,難以保證評估時效性。因此在評估輸電走廊山火時,應(yīng)該從火災(zāi)三要素出發(fā),綜合考慮影響山火發(fā)生的氣象、人為、植被和地形等因子。
由于山火災(zāi)害還具有一定的時間變化特性,上一時刻的氣象信息和發(fā)生火災(zāi)情況會對當(dāng)前時刻山火發(fā)生造成一定影響。因此,本文綜合考慮氣象、人為、植被和地形4 類因子,通過靜態(tài)因子和動態(tài)因子相結(jié)合來刻畫山火時間相關(guān)性。其中選取了歷史火點密度、人口密度、GDP、線路到公路距離、線路到居民點距離、植被類型、NDVI、可燃物載量、土地利用類型、海拔、坡度和坡向12 個基本短時間內(nèi)不隨著時間變化的因子作為靜態(tài)因子;并選擇目標(biāo)時段內(nèi)的連續(xù)無雨日、平均溫度、平均降水量、平均濕度和平均風(fēng)速5 個隨時間變化的動態(tài)因子來反映時間變化對山火發(fā)生風(fēng)險影響。構(gòu)建DBN 模型,通過證據(jù)推理計算山火發(fā)生的概率,評估山火風(fēng)險。
通常為全面挖掘山火發(fā)生規(guī)律,在構(gòu)建模型時傾向于采用較多的因子。而引入過多的因子會帶來“維數(shù)災(zāi)”問題,導(dǎo)致模型復(fù)雜度增大,訓(xùn)練時間成本增加,甚至引入噪聲降低模型精度;與此同時,隨著變量的增加,貝葉斯網(wǎng)絡(luò)的參數(shù)學(xué)習(xí)所需樣本量也會急劇增加,給模型參數(shù)評估帶來困難。為此,本文采用隨機(jī)森林特征選擇算法[21-22]從原始的高維山火數(shù)據(jù)集中篩選出最優(yōu)因子集,提高模型的計算效率和擬合精度。
隨機(jī)森林是一種以決策樹為基學(xué)習(xí)器的集成監(jiān)督學(xué)習(xí)模型。隨機(jī)森林通過Bootstrap自助采樣法和節(jié)點隨機(jī)分裂技術(shù)建立決策樹,以少數(shù)服從多數(shù)的投票方式集成決策樹輸出結(jié)果。通過計算每個因子在每棵樹上的貢獻(xiàn)程度,可以評估因子對山火發(fā)生事件的重要程度,對應(yīng)的算法步驟如下。
步驟1:從原始樣本集中隨機(jī)有放回地抽取K個訓(xùn)練數(shù)據(jù)集{D1,D2,…,DK}和K個對應(yīng)的袋外數(shù)據(jù)集{B1,B2,…,BK};
步驟2:設(shè)置k=1,在訓(xùn)練集Dk上建立決策樹,使用決策樹對Bk進(jìn)行預(yù)測,統(tǒng)計袋外數(shù)據(jù)預(yù)測誤差,記為;
步驟3:對Bk中的因子Xi,i=1,2,…,n施加擾動,統(tǒng)計袋外數(shù)據(jù)預(yù)測誤差;
步驟4:對于k=2,3,…,K,重復(fù)步驟2、3;
步驟5:利用式(1)度量因子Xi的重要度;
貝葉斯網(wǎng)絡(luò)(Bayesian network,BN)是一種用于概率推理的圖形化數(shù)學(xué)模型,它利用有向無環(huán)圖描述變量間的依賴關(guān)系,在給定觀測樣本數(shù)據(jù)或?qū)<蚁闰炛R下,BN 能夠利用貝葉斯概率理論對目標(biāo)變量進(jìn)行概率推理,在含有多變量的不確定性問題中得到廣泛應(yīng)用。DBN 在BN 的基礎(chǔ)上引入了時序概念,通過刻畫隨機(jī)變量的時序轉(zhuǎn)移和因果關(guān)系,對動態(tài)時變隨機(jī)過程進(jìn)行推理,在負(fù)荷預(yù)測、數(shù)據(jù)鏈路預(yù)測、海底管道失效預(yù)測[23-25]等動態(tài)推理預(yù)測領(lǐng)域具有成熟應(yīng)用。
DBN 可被定義為(B1,B→),B1為初始時刻的BN,定義了變量之間的因果關(guān)系和概率分布,B→為轉(zhuǎn)移網(wǎng)絡(luò),它將前后相鄰的時間片的BN 聯(lián)結(jié)起來,描述了2 個相鄰時刻變量間的轉(zhuǎn)移概率P(Xt|Xt-1),即:

圖2 DBN網(wǎng)絡(luò)拓?fù)銯ig.2 Topology of DBN network
通常為簡化動態(tài)模型推理的復(fù)雜度,假設(shè)DBN 滿足一階馬爾科夫和轉(zhuǎn)移概率不變兩個前提假設(shè)[26]。其中一階馬爾科夫假設(shè)要求節(jié)點之間的有向邊必須位于同一時間片或相鄰時間片之間,不能跨越時間片,即因子變化只與上一個時間片的狀態(tài)有關(guān),與更早之前的時間片的狀態(tài)無關(guān);轉(zhuǎn)移概率不變假設(shè)是指B→的轉(zhuǎn)移概率P(Xt|Xt-1)不隨時間變化。基于上述假設(shè),可將DBN 拓展至第T個時間片,得到DBN 任一節(jié)點的聯(lián)合概率,如式(3)所示。
構(gòu)建DBN 山火風(fēng)險評估模型時,包含網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)和參數(shù)學(xué)習(xí)兩個步驟。網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)指根據(jù)專家經(jīng)驗或者樣本數(shù)據(jù)搜索初始網(wǎng)絡(luò)結(jié)構(gòu)B1,并對B1進(jìn)行時間延拓得到DBN 結(jié)構(gòu),本文采用專家經(jīng)驗法,通過分析山火影響因子之間的因果關(guān)系獲得合適的山火風(fēng)險評估DBN 結(jié)構(gòu);然后基于時間序列樣本訓(xùn)練得到DBN 各節(jié)點條件概率;最后通過DBN推理算法計算樣本點的山火發(fā)生概率。
3.2.1 模型節(jié)點參數(shù)的計算
DBN 節(jié)點參數(shù)即為各節(jié)點的條件概率表(conditional probability table,CPT),反映了各影響因子之間的概率依賴關(guān)系。CPT 通常可由專家經(jīng)驗直接給出或者基于樣本數(shù)據(jù)訓(xùn)練得到。由于山火災(zāi)害爆發(fā)隨機(jī)性強(qiáng),專家經(jīng)驗給定的參數(shù)難以適用于各因素相互耦合的山火預(yù)測。因此本文基于歷史時間序列樣本學(xué)習(xí)節(jié)點的CPT,充分挖掘節(jié)點之間的依賴關(guān)系。
在山火歷史數(shù)據(jù)集觀測完全的條件下,采用統(tǒng)計學(xué)中的極大似然法[27]估計網(wǎng)絡(luò)節(jié)點的CPT。設(shè)樣本集合為D={d1,d2,…,dm}建立對數(shù)似然函數(shù)為:
式中:m為樣本數(shù);n為時間片內(nèi)節(jié)點數(shù);T為時間片數(shù)。定義θi,j,k,t=,則式(4)可化為:
式中j、k為節(jié)點取值,本文中取離散值1、2、3、4。Ii,j,k,l,t為:
利用拉格朗日乘數(shù)法求取L的極大值,得到參數(shù)θi,j,k,t的估計值為:
3.2.2 山火發(fā)生概率推理
確定模型網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)后,通過DBN 推理對山火發(fā)生概率進(jìn)行預(yù)測。DBN 推理方法可分為精確推理和近似推理2 種方法,本文采用精確推理中的直接計算推理算法[28],該方法無需進(jìn)行復(fù)雜的圖形變換,根據(jù)貝葉斯公式和條件獨立性假設(shè)即可實現(xiàn)后驗概率推理,推理計算效率較高。
對于T個時間片的網(wǎng)絡(luò),假定影響山火發(fā)生的人為、氣象、植被和地理因子分別為變量R、Q、Z和D,山火為變量F,則在觀測值{R1:T,Q1:T,Z1:T,D1:T,F(xiàn)1:T-1}下F在時間片T上的后驗概率為:
由條件獨立性假設(shè),聯(lián)合分布概率為:
結(jié)合式(8)—(9)可以實現(xiàn)第T個時間片山火發(fā)生概率預(yù)測。
山火預(yù)測是一種二分類問題,因此采用混淆矩陣[29]來度量模型泛化性能,如表1 所示。真正類數(shù)(true positive,TP)記作NTP,表示實際有火網(wǎng)格樣本中被正確預(yù)測為有火的數(shù)量;假負(fù)類數(shù)(false negative,F(xiàn)N)記作NFN,表示實際有火網(wǎng)格樣本中被錯誤預(yù)測為無火的數(shù)量;假正類數(shù)(false positive,F(xiàn)P)記作NFP,表示實際無火網(wǎng)格樣本中被錯誤預(yù)測為有火的數(shù)量;真負(fù)類數(shù)(true negative,TN)記作NTN,表示實際無火網(wǎng)格樣本中被正確預(yù)測為無火的個數(shù)。

表1 混淆矩陣Tab.1 Definition of confusion matrix
NTP和NTN為模型預(yù)測正確的樣本數(shù),其占比越高,預(yù)測效果越好。為綜合評估預(yù)測性能,引入準(zhǔn)確率(accuracy)和召回率(recall),如式(10)-(11)所示:
式中:A為全體樣本中被正確預(yù)測的比例;R為實際有火樣本中被正確預(yù)測的比例,R越高意味著有火預(yù)測越準(zhǔn)確。
采用ROC 曲線和AUC 值來衡量模型的分類性能[30]。ROC 曲線繪制方法為:將樣本預(yù)測值降序排列,分別以每個樣本的預(yù)測值作為分類閾值,將預(yù)測值大于或等于分類閾值的樣本判斷為正類,反之為負(fù)類;然后根據(jù)式(12)和式(13)計算真正類率(true positive rate,TPR)記作RTP和假正類率(false positive rate,F(xiàn)PR)記作RFP并分別以其為橫坐標(biāo)和縱坐標(biāo)繪制曲線。ROC曲線越靠近圖形左上方,表明模型分類效果越好。
AUC 值為ROC 曲線在區(qū)間[0,1]的面積,表示模型根據(jù)預(yù)測值將正樣本排在負(fù)樣本前面的概率,反映了模型對樣本的排序分類能力。當(dāng)AUC大于0.5 時,表示模型具備分類能力,AUC 大于0.8時,模型具有優(yōu)良的分類性能。
本文選擇華南地區(qū)廣東省作為研究區(qū)域。2015—2020 年間廣東省發(fā)生森林火災(zāi)3 584 起,空間分布如圖3 所示。全省總面積17.97 萬平方千米,地形以山地、丘陵為主。廣東省大部分地區(qū)屬亞熱帶季風(fēng)氣候,全年雨熱同期,適宜植被生長。近年來森林覆蓋不斷擴(kuò)張,已達(dá)58.7%。2021 年,廣東常住人口總量達(dá)12 684 萬人。密集的人口分布,適宜的氣候條件和豐富的植被使其易受山火災(zāi)害侵襲。

圖3 2015—2020年廣東省森林火災(zāi)空間分布Fig.3 Spatial distribution of wildfires in Guangdong Province,2015—2020
為建立研究區(qū)域山火預(yù)測模型,收集了廣東省2010—2020年的歷史火點數(shù)據(jù),包括火災(zāi)發(fā)生時間和經(jīng)緯度信息。由于超過90%的山火災(zāi)害由人為野外用火造成[31],因此將2010—2014 年的歷史火點用于計算歷史火點密度,綜合反映研究區(qū)域人為用火分布狀況。為全面考慮山火影響因素,從氣象、人為、植被和地理4個方面收集了17個山火因子數(shù)據(jù),如表2 所示。其中氣象因子以及可燃物載量數(shù)據(jù)由國家衛(wèi)星氣象中心提供,人為、植被和地理因子數(shù)據(jù)從中國科學(xué)院資源環(huán)境科學(xué)與數(shù)據(jù)中心(https://www.resdc.cn/)下載得到,分辨率均為1 km×1 km。

表2 輸電走廊山火因子Tab.2 Wildfire factors of transmission line corridors
根據(jù)山火災(zāi)害在時間上呈現(xiàn)月度分布不均衡這一特性,以月為時間單位構(gòu)建山火樣本集。首先將2015—2020年的火點以月為單位進(jìn)行時間劃分,生成逐月火點時間序列數(shù)據(jù)集。然后為實現(xiàn)網(wǎng)格化收集數(shù)據(jù),利用地理信息軟件將研究區(qū)域按照經(jīng)緯度劃分成0.05 °×0.05 °的網(wǎng)格,并按照目標(biāo)時間間隔計算落在網(wǎng)格內(nèi)的火點數(shù),將火點數(shù)大于等于1 的網(wǎng)格作為有火網(wǎng)格,否則為無火網(wǎng)格。由于氣象數(shù)據(jù)為廣東省氣象站點數(shù)據(jù),本文采用克里金插值法成1 km×1 km 分辨率柵格數(shù)據(jù)。最后,逐一提取網(wǎng)格山火因子數(shù)據(jù),生成時間序列的有火和無火網(wǎng)格樣本集。
按照2.2 節(jié)所述方法對17 個山火因子進(jìn)行篩選,得到各因子貢獻(xiàn)度排序以及累計貢獻(xiàn)度如圖4所示。前9 個山火因子累計貢獻(xiàn)度高達(dá)95.07%[32],后8 個因子貢獻(xiàn)度小,可視為冗余因子,因此選取前9個因子作為模型輸入數(shù)據(jù)。

圖4 各因子貢獻(xiàn)度及累計貢獻(xiàn)度Fig.4 Various factors VIM and cumulative VIM
4.3.1 網(wǎng)絡(luò)構(gòu)建
在短期內(nèi),氣象因子時序關(guān)聯(lián)性強(qiáng),隨時間變化范圍大,其在上一時刻和當(dāng)前時刻的狀態(tài)會持續(xù)對植被可燃性產(chǎn)生影響,具有時間累計效應(yīng)。因此在模型中引入時間因素,將氣象、植被等動態(tài)因子上下兩個時刻的狀態(tài)結(jié)合起來。DBN 模型一方面基于概率理論和圖論耦合氣象、人為、植被和地理等多種因子,另一方面利用有向邊將動態(tài)變量在時間軸上進(jìn)行連接,通過轉(zhuǎn)移概率挖掘時序關(guān)聯(lián)性,從而融入時間因素對山火發(fā)生概率進(jìn)行推理。本文構(gòu)建2時間片的DBN模型,基于各因子在上一時刻和當(dāng)前時刻的狀態(tài)對山火發(fā)生概率進(jìn)行推理,以反映當(dāng)前時刻山火發(fā)生的難易程度。
為探索引入時間因素對山火發(fā)生風(fēng)險評估準(zhǔn)確性的影響,構(gòu)建靜態(tài)BN 模型,與2 個相鄰時間片的DBN 模型形成對比。首先以月為時間尺度,構(gòu)建靜態(tài)BN 網(wǎng)絡(luò)結(jié)構(gòu),然后將BN 拓展至2時間片的DBN模型。
基于篩選得到的9 個山火因子構(gòu)建靜態(tài)BN。首先,對各因子進(jìn)行皮爾遜相關(guān)性分析,繪制相關(guān)性熱力圖,如圖5所示。

圖5 山火影響因子的相關(guān)性熱力圖Fig.5 Wildfire factors correlation heat map
相關(guān)系數(shù)絕對值大于0.1 的兩個因子之間存在一定的相關(guān)關(guān)系[33]。例如海拔與人口密度、溫度和火點密度的相關(guān)系數(shù)分別為-0.24、-0.18 和0.33,這是因為海拔越高,相應(yīng)的溫度越低,因此人類通常生活在海拔較低的地區(qū),人口密度越大,則由人類活動產(chǎn)生的歷史火點密度越大,該地區(qū)越容易發(fā)生山火。利用有向箭頭將這些因果關(guān)系進(jìn)行連接,得到靜態(tài)BN結(jié)構(gòu)如圖6所示。

圖6 輸電走廊山火風(fēng)險靜態(tài)貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)Fig.6 Static Bayesian network structure of transmission line corridor wildfire risk
對靜態(tài)BN 在時間軸上進(jìn)行延拓,生成含有2個時間片的DBN,如圖7 所示。DBN 網(wǎng)絡(luò)中溫度、降水量、風(fēng)速、濕度和連續(xù)無雨日為動態(tài)變量,因此利用有向邊將其相鄰時間片節(jié)點連接,以反映變量的時間變化,其余靜態(tài)變量則無需在時間片間進(jìn)行連接。

圖7 輸電走廊山火風(fēng)險動態(tài)貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)Fig.7 The dynamic Bayesian network structure of transmission line corridor wildfire risk
4.3.2 建模結(jié)果分析
由于DBN 處理離散化的數(shù)據(jù)效率更高,且模型結(jié)果更加穩(wěn)定[34],因此對連續(xù)型數(shù)據(jù)離散化處理。為體現(xiàn)有火與無火網(wǎng)格樣本分級離散化后的差異,逐一統(tǒng)計各因子的頻數(shù)分布,根據(jù)數(shù)據(jù)分布差異性進(jìn)行離散化處理,如表3所示。
為保障模型結(jié)果的穩(wěn)定性和真實性,采用5 折交叉驗證法分別對BN 和DBN 進(jìn)行訓(xùn)練和測試,即通過分層采樣的方式將數(shù)據(jù)集劃分為5 個同等大小的互斥子集,每次以其中4 個子集作為訓(xùn)練集,余下的1 個子集作為測試集。利用極大似然估計法學(xué)習(xí)BN 和DBN 的節(jié)點參數(shù),然后對測試集樣本進(jìn)行山火概率評估計算,將預(yù)測概率大于等于0.5 的樣本判識為有火,而小于0.5 的樣本判識為無火。將5 次測試集預(yù)測結(jié)果取平均值,使用ROC 曲線、AUC 值、預(yù)測準(zhǔn)確率和召回率對兩個模型進(jìn)行評價對比,結(jié)果如表4和圖8所示。

表4 模型評價指標(biāo)對比Tab.4 Comparison of Model Evaluation Indexes

圖8 DBN和BN模型的ROC曲線Fig.8 ROC curves of DBN and BN model
從表中可看出,DBN模型的準(zhǔn)確率為78.47%,高于BN 的70.99%,說明DBN 對于樣本集的擬合度更高。DBN 召回率為65.89%,優(yōu)于BN 的49.18%,表明DBN 對于有火網(wǎng)格樣本的預(yù)測更準(zhǔn)確,能有效降低有火的誤判或漏判。從圖8 可見,DBN 的ROC 曲線處于BN 的左上方,其AUC 值更高,說明DBN具有更好的分類效果。
綜上所述,在月時間尺度下,基于相鄰2 月的樣本構(gòu)建的DBN 山火風(fēng)險評估模型明顯優(yōu)于靜態(tài)BN 模型,這意味著引入上一個階段的因素后有助于貝葉斯網(wǎng)絡(luò)進(jìn)行山火風(fēng)險評估,并降低對有火的誤判或漏判率。
由4.3 節(jié)可知,動態(tài)貝葉斯模型山火風(fēng)險評估效果優(yōu)于靜態(tài)模型。但是在月時間尺度下,DBN的準(zhǔn)確率和召回率僅達(dá)78.47%和65.89%,并非足夠理想。為此,本文進(jìn)一步細(xì)化時間尺度,通過重新處理動態(tài)特征數(shù)據(jù),研究DBN 在15 d、10 d、7 d、3 d 等不同時間尺度下的山火風(fēng)險評估效果。
采用與月時間尺度相同的方法,建立不同時間尺度下的動態(tài)數(shù)據(jù)集,分別構(gòu)建DBN,利用5 折交叉驗證法進(jìn)行訓(xùn)練和測試,結(jié)果如表5 和圖9 所示。隨著時間尺度的減小,模型準(zhǔn)確率和召回率不斷上升。其中3 d 模型結(jié)果最優(yōu),準(zhǔn)確率達(dá)86.39%,召回率達(dá)80.33%。ROC 曲線隨著時間減小逐漸靠近左上方,對應(yīng)的AUC 值也逐漸增大,表明模型分類能力不斷提升。

表5 不同時間尺度下DBN模型評價指標(biāo)對比Tab.5 Comparison of evaluation indexes of DBN model under different time scales

圖9 不同時間尺度下DBN模型ROC曲線Fig.9 ROC curves of DBN model under different time scales

圖10 2022年清明節(jié)期間廣東省山火風(fēng)險分布Fig.10 Distribution of wildire risk in Guangdong Province during Qingming Festival in 2022
上述結(jié)果表明,山火預(yù)測準(zhǔn)確率隨著時間尺度減小而提高,其原因主要為:根據(jù)山火因子重要度排序,氣象因子為重要因子,一方面,隨著時間尺度變小,溫度、降水量等氣象因子數(shù)據(jù)越來越精確,更加能夠反映當(dāng)時山火的發(fā)生容易程度;另一方面,DBN 將上下2 個時間片的動態(tài)因子聯(lián)系起來,融入了時間信息,使得模型的擬合度不斷提升,進(jìn)而提高模型預(yù)測準(zhǔn)確度。
為實現(xiàn)山火風(fēng)險空間分布評估的工程化應(yīng)用,收集了2022年廣東省清明節(jié)期間(4月1日—4月6日)山火因子數(shù)據(jù),采用訓(xùn)練好的3天DBN模型計算4月4日至4 月6 日山火發(fā)生概率。并分別以25%、50%、75%為間斷點,將山火發(fā)生概率劃分為低風(fēng)險,中等風(fēng)險,較高風(fēng)險和高風(fēng)險四級風(fēng)險等級,利用地理信息軟件將山火風(fēng)險可視化,繪制成1 km×1 km分辨率的廣東省山火風(fēng)險分布圖,如圖11所示。
從分布圖可以發(fā)現(xiàn),廣東省高風(fēng)險區(qū)域主要集中在北部和東部地區(qū),應(yīng)當(dāng)重點關(guān)注。根據(jù)當(dāng)?shù)仉娏咎峁┑膹V東省2022 年4 月4 日至4 月6 日期間共計84 起輸電走廊山火經(jīng)緯度信息,提取火點位置對應(yīng)的風(fēng)險等級。經(jīng)驗證,其中68 個火點落在較高風(fēng)險和高風(fēng)險區(qū)域,預(yù)測準(zhǔn)確率達(dá)80.95%,驗證了分布圖的合理性和適用性。
本文考慮時間因素對山火發(fā)生的影響,提出了一種基于動態(tài)貝葉斯網(wǎng)絡(luò)的輸電走廊山火風(fēng)險時空評估方法。
1)根據(jù)輸電走廊山火月度分布不均衡特性,分別建立基于靜態(tài)貝葉斯網(wǎng)絡(luò)和動態(tài)貝葉斯網(wǎng)絡(luò)的山火風(fēng)險評估模型,發(fā)現(xiàn)引入上一個時間的因子的動態(tài)模型提高了評估準(zhǔn)確性。
2)在月時間尺度基礎(chǔ)上,研究了時間尺度對DBN 模型效果的影響,分別建立了15 d、10 d、7 d、3 d 動態(tài)貝葉斯網(wǎng)絡(luò)山火風(fēng)險評估模型。隨著時間尺度變小,模型評估效果逐步提升,其中以3 d為時間尺度的DBN 模型測試集準(zhǔn)確率達(dá)86.39%,召回率達(dá)80.33%,這是因為隨時間細(xì)化,氣象因子數(shù)據(jù)越來越精確,提高了模型預(yù)測準(zhǔn)確性。
3)利用3 d 為時間尺度的DBN 模型評估了2022年清明節(jié)期間廣東省山火風(fēng)險分布,繪制了1 km×1 km 分辨率山火風(fēng)險分布圖,80.95%真實火點被預(yù)測成功,驗證了本文所提方法的有效性。