李 莉,杜麗霞,張子柯
(1. 山西大學計算機與信息技術學院 太原 030006;2. 杭州師范大學阿里巴巴商學院 杭州 311121)
叢林大火是澳大利亞炎熱干燥季節頻繁發生的野外火災,由于火災時常交替發生,自然生態系統隨之演變,叢林大火成為了澳大利亞生態的重要組成部分[1]。隨著全球氣溫升高,澳大利亞大火愈發猛烈且不可控制。2019 年7 月以來,澳大利亞全境發生持續性的叢林大火[2],造成了巨大的損失。據澳大利亞聯邦統計,大火總燃燒面積約1.7×107hm2,全國超過10 億只動物因大火而喪生。澳大利亞大火造成的影響不止當地的損失,大火的連鎖反應導致它成為一個全球性的問題,對人類生存有極大的消極影響,如引起CO2排放量上升、污染水源、破壞生態系統等[3]。
本文首先對森林火災發生的必要因素[4]進行了分析,影響森林火災發生的主要因素包括燃料、氧氣和火源。山火蔓延的烈度和速度取決于環境溫度、燃料濕度、風速和坡度。桉樹、刺槐等易燃植物的分布是火災發生的根本依據,干燥的燃料會燃燒得很快,而潮濕或濕的燃料不易發生火災,所以降雨量是評估山火的重要考慮因素;環境溫度越高,越有可能發生火災,因此環境溫度也是預測森林火災重要指標。
針對澳大利亞大火的預測,已有一些學者進行了研究,如文獻[5]利用前饋反饋、多層感知等神經網絡的方法預測澳大利亞最有可能發生火災的地點。但是這種神經網絡模型容易出現梯度消失或者梯度爆炸問題;文獻[6]通過元胞自動機來模擬森林的生長-火災-恢復過程,構建自然因素與火災蔓延關系的模型。可是預測該模型沒有考慮澳大利亞真實歷史數據,預測結果與實際情況存在偏差。
綜合分析以上原因,本文以氣候分布、植被分布、降水量和溫度作為依據建立了LSTM(long short-term memory)多變量數據驅動預測模型,通過添加門控制來解決神經網絡出現的梯度消失或者梯度爆炸問題,利用有時間依賴的數據進行預測,同時與BP(back-propagation)和ARIMA(autoregressive integrated moving average model)進行對比,多變量LSTM 預測效果良好,有較高的可信度。
BP 神經網絡是應用最廣泛的神經網絡。它的基本思想是梯度下降法,利用梯度搜索技術,使網絡的實際輸出值和期望輸出值的誤差均方差最小[7-8]。
BP 神經網絡是線性權重的激活函數模型,輸入一個向量,對向量進行加權處理輸入到隱含層神經元的激活函數中,再將函數的輸出值進行加權處理最后得到輸出層的值,典型的BP 神經網絡模型圖如圖1 所示。

圖1 BP 神經網絡模型[9]
輸入層的輸入為i=(i1,i2,···,in),輸入單元經過加權處理后成為隱含層的輸入 lik;隱含層神經單元個數為 p ,經過處理后,隱含層的輸出為 lop;隱含層的輸出結果經過 whj加權處理后成為輸出層的輸入 oom;輸出層神經元個數為q,輸出層的輸出為oo。當實際輸出與期望輸出之間的誤差超出規定的精度時,進入誤差的反向傳播階段。誤差通過輸出層按誤差梯度下降的方式修正各層權值,向隱含層、輸入層逐層反傳。
ARIMA 模型的全稱叫做差分自相關移動平均模型,是統計模型中最常見的一種用來進行時間序列預測的模型[10-11]。ARIMA 模型實質上是自回歸模型(autoregressive model, AR)、移動平均模型(moving average model, MA)和差分法3 種方法的整合。
長短周期記憶神經網絡通常被稱為LSTM 網絡,是一種時間遞歸的神經網絡,適合預測和處理有時間依賴的問題[12]。它有能力捕獲過去階段的數據,并使用過去一段時間某一事件時間特征來預測未來一段時間內的活動特點,在許多實際應用中展現了優異的性能[13]。
LSTM 的網絡架構是由一個個重復的神經元模塊組成的鏈式結構[14]。每一個重復的神經元模塊有4 個神經網絡層,且通過一種特殊的方式交互。LSTM 的神經元模塊結構如圖2 所示。

圖2 LSTM 神經元模塊

本文所采用的數據為浮點型數據,利用LSTM進行預測時,首先將數據進行歸一化處理。考慮到上一個時間段降水量和溫度,構造時間序列數據集,并將時間序列問題轉化為監督學習問題,以監督學習輸出值作為預測結果進行多變量時間序列預測,最終預測當前時刻的著火情況(1 表示著火,0 表示未著火)。預測輸出結果為一系列0~1 之間的無量綱值,越接近0,說明著火的可能性越小,反之,越接近1 說明著火可能性越大。

圖3 多變量LSTM 預測模型框架[14]
澳大利亞位于南太平洋,南回歸線橫貫澳大利亞大陸中部,大部分地區在副熱帶高氣壓帶和東南信風的控制下,炎熱干燥。
澳大利亞的北部夏天,來自赤道的西北風帶來豐沛的降水,較為濕潤,冬季受東南信風控制,為干季;中部受副高控制,形成干燥少雨的熱帶沙漠氣候;南部、西南部位受到副高和西風帶的交替控制,為地中海氣候;最南端常年受西風控制,形成溫帶海洋性氣候;西部沿海受東南信風和副高控制,加上沿岸的寒流影響,形成熱帶草原氣候;東南沿海受暖流影響,比較濕潤,形成亞熱帶濕潤氣候;東北部常年吹東南信風,降水豐沛,形成熱帶雨林氣候[15]。
澳大利亞的植被分布呈明顯半環狀,即北、東、南三面以森林為主,向內逐步以草原植被為主,核心為荒漠植被。
本文基于澳大利亞地圖,根據氣候和植被的分布特點劃分59 個節點。選取每個節點2018 年1 月1 日-2020 年4 月1 日的日最低降水量、最高溫度和是否著火3 項數據作為研究數據。本文以節點36 為研究對象,對預測模型進行詳細說明,節點36 的日最高溫度、最低降水量數據如圖4 所示。

圖4 節點36 的日最高溫度、最低降水量數據
為了構建基于多變量LSTM 神經網絡的澳大利亞大火預測模型,選取2018 年1 月1 日-2020年1 月10 日的數據作為訓練集,2020 年1 月11 日-2020 年3 月31 日的數據作為測試集。以日最高溫度、最低降水量、是否著火作為模型變量輸入,以測試集的均方根誤差(RMSE)作為模型訓練預測精度評價指標。
為了提高模型預測精度,加快模型訓練收斂速度,本文采用以下方法對原始變量時序集進行標準化處理[16],表示為:

式中,MIN=0;MAX=1; IS表示標準化后的值;I表示標準化前的值; Imin表示原始數據集中的最小值;Imax表示原始數據集中的最大值。
根據LSTM 模型結構[16],多變量LSTM 神經網絡預測模型訓練步驟如下:
1) 在輸入層中,定義2018 年1 月1 日-2020 年3 月31 日的數據集為:

式中,it={at,bt,ct}, at、 bt、 ct分別表示t 時刻對應的最高溫度、最低降水量和是否著火。
2) 對標準化處理和格式轉換后的數據進行訓練集和測試集劃分,可表示為:

《南村輟耕錄》上說,中書丞相史天澤本來須髯已白,然而,一朝忽盡黑。元世祖忽必烈見之,驚問曰:“史拔都,汝之髯何乃更黑耶?”史天澤說,我用藥染了。問:染了干什么呢?答:“臣攬鏡見髭髯白,竊傷年且暮,盡忠于陛下之日短矣,因染之使玄,而報效之心不異疇昔耳。”丞相巧舌如簧,忽必烈聽了非常高興。

式中,I 為輸入到隱含層L 個細胞單元的數據集。
4) 隱含層理論輸出為:


圖5 BP 與多變量LSTM 對日最高溫度的預測
實際輸出為:

式中,LSTM 為圖2 所示計算過程。
5) 訓練過程中均方誤差(RMSE)作為損失計算公式:


6) 以RMSE 最小為優化目標,應用Adam 優化算法更新權重,直到RMSE 最小。
為了驗證多變量LSTM 神經網絡預測澳大利亞大火的優點,使用多變量LSTM 神經網絡與ARIMA神經網絡和BP 神經網絡預測結果互相對比的方法進行分析。
BP 神經網絡預測通常以相互影響的因素作為輸入來預測剩余的單個因素,以日最高溫度、最低降水量和是否著火作為互相影響的元素,利用BP神經網絡分別對節點36 從2020 年1 月11 日-2020年3 月14 日的日最高溫度進行預測;ARIMA 預測對數據的平穩性有一定要求,通過對訓練集數據進行平穩性檢驗和白噪聲檢驗后,發現數據的平穩性較好,不需要進行差分處理,隨即利用ARIMA 對日最高溫度進行了預測;多變量LSTM 神經網絡以日最高溫度、最低降水量和是否著火三維數據作為輸入,通過綜合分析3 種元素之間的相互影響,對日最高溫度進行了預測。圖5 為利用BP 與多變量LSTM 對日最高溫度的預測,圖6 為ARIMA 與多變量LSTM 對日最高溫度的預測。

圖6 ARIMA 與多變量LSTM 對日最高溫度的預測
為了更直觀地看出3 種方法的優劣,本文利用評價指標均方根誤差(RMSE)來刻畫。BP 神經網絡的RMSE 最大,為4.150;ARIMA 的RMSE 比BP神經網絡略小,為4.012。多變量LSTM 神經網絡的RMSE 最小,為3.862。這是因為BP 神經網絡在訓練過程中未考慮時序變化規律,只考慮了因素之間的相互影響,總體預測效果明顯比其他兩種方法差;ARIMA 模型沒有考慮多個因素之間的相互影響,只是以日最高溫度單個因素作為變量進行訓練,然后根據日最高溫度的時序性做出相應預測,因此預測效果一般,介于兩者之間;多變量LSTM在預測過程中綜合考慮了日最高溫度、最低降水量和是否著火3 個因素的相互影響,同時結合了時間序列依賴關系[17],因此預測效果最好。
綜上所述,BP、ARIMA 和多變量LSTM3 種預測模型中,基于多變量的LSTM 預測模型預測效果最佳,有較高的可信度。基于以上結論,利用多變量LSTM、BP 和ARIMA 對節點36 從2020 年1 月11 日-2020 年3 月14 日的著火可能性進行了預測,結果如圖7 所示。

圖7 著火可能性預測
利用RMSE 對3 種預測方法進行評價。其中,多變量LSTM 的RMSE 為0.238;ARIMA 的RMSE為0.297;BP 的RMSE 最大,為0.359。由此可見多變量LSTM 對澳大利亞大火的預測效果最好。
由于BP 神經網絡方法存在梯度消失問題,不能很好地利用時間序列信息,所以預測結果與實際情況偏差較大;ARIMA 是時間序列預測常用的方法,可以很好地處理有時間依賴的數據。不足的是ARIMA 不能考慮其他因素對本變量的影響,所以ARIMA 的預測結果不佳。LSTM 多變量數據驅動的預測模型,通過添加門控制來解決神經網絡出現的梯度消失或者梯度爆炸問題,并且可以結合考慮多個因素,預測結果與真實情況對比有較高的可靠性。
本文采用BP、ARIMA、多變量LSTM 神經網絡模型對澳大利亞大火進行預測。經對比發現多變量LSTM 預測效果最好,用多變量LSTM 的方法將預測結果與實際值進行比較,預測結果有很高的可信度。LSTM 是長短周期記憶神經網絡,由于其模型中3 種“門”的存在,使得其對于有時序性的數據有長時記憶的能力,對有周期性的數據預測精度較高。用來預測澳大利亞大火的數據是日最高溫度、最低降水量以及著火點,這3 類數據均具有周期性,這也是多變量LSTM 預測效果比BP、ARIMA好的原因。實驗表明該算法對大火預測的精度較高,可以用于對我國境內發生的大火進行預測,減少大火帶來的危害。