梁慧玲,王文輝,郭福濤,林芳芳,林玉蕊,*
1 福建農林大學計算機與信息學院,福州 350002 2 福建農林大學林學院,福州 350002 3 漳州理工職業(yè)學院,漳州 363000
?
比較邏輯斯蒂與地理加權邏輯斯蒂回歸模型在福建林火發(fā)生的適用性
梁慧玲1,2,3,王文輝2,郭福濤2,林芳芳1,林玉蕊1,*
1 福建農林大學計算機與信息學院,福州 350002 2 福建農林大學林學院,福州 350002 3 漳州理工職業(yè)學院,漳州 363000
林火預測預報是科學有效進行林火管理的前提,是林業(yè)管理部門和科研工作者的廣泛關注的領域。邏輯斯蒂回歸(Logistic Regression, LR)是目前國內外廣泛應用于森林火災預測的模型方法,然而近年來有學者發(fā)現(xiàn)該方法沒有充分考慮林火影響因子的空間相關性和異質性,從而導致模型擬合結果偏差。地理加權邏輯斯蒂回歸(Geographically weighted logistic regression, GWR)模型考慮到了模型變量之間的空間相關性,有效提高的模型的擬合能力。為探討GWLR模型在福建林火預測上的適用性,本研究應用LR和GWLR兩種方法分別建立福建省森林火災與氣象因子的預測模型,通過模型擬合能力對比,判斷在GWLR的適用性。研究以2000—2005年福建地區(qū)森林火災衛(wèi)星火點數據和每日氣象因子為基礎,將全樣本分為60%的建模數據和40%的校驗數據,并重復5次,建立5個樣本組。選擇在5個樣本組中3個及以上表現(xiàn)顯著的變量進入最終模型。研究結果表明GWLR在模型擬合度、模型殘差、空間自相關性以及預測準確率等方面均優(yōu)于LR模型,說明充分考慮模型變量的空間異質性有助于提高模型的預測精度,同時也驗證了GWLR在福建地區(qū)林火預測上的適應性。此外,模型參數結果顯示,“日最高地表氣溫”、“日最低地表氣溫”、“日平均風速”、“24小時降水量”、“日最高本站氣壓”、“日照時數”、“日最高氣溫”和“日最小相對濕度”8個因子對福建省林火發(fā)生有顯著影響,研究結論為福建地區(qū)林火預測預報提供了新的方法。
林火預測;空間異質性;邏輯斯蒂回歸;地理加權邏輯斯蒂回歸
林火是是森林生態(tài)系統(tǒng)的重要影響因子,對森林資源與環(huán)境造成破壞也會威脅人類生命財產安全[1- 3]。判定林火發(fā)生的影響因子,建立準確的林火預測預報模型對林火管理工作至關重要。目前,國內外有關林火發(fā)生的預測模型和影響因子分析已大量開展,主要模型方法為人工神經網絡[4]、最大熵算法[5,6]、分類樹[7]、泊松回歸、負二項回歸、零膨脹泊松、零膨脹負二項以及邏輯斯蒂回歸模型[8- 11]等,其中邏輯斯蒂模型應用最為廣泛。然而以上所有模型均假設因變量與自變量之間的關系是空間平穩(wěn)的,即模型參數在整個研究區(qū)域上是一個不變的常數,通常建模的結果是一套模型參數應用于整個研究區(qū)域,也稱之為全局模型。然而,隨著研究的深入,很多學者發(fā)現(xiàn)區(qū)域的空間異質性是不容忽略的。林火與影響因子之間的關系在空間上是非平穩(wěn)的,具有很強的異質性[12- 14],因此,以往的全局模型在林火預測預報上可能會產生較大誤差。
地理加權回歸模型(GWR)考慮了地理空間因素的影響,該模型將一個大的數據集分成了若干小區(qū)域,減少了各個模型間的差異性,有助于提高模型精度,可以用來解決空間的平穩(wěn)性問題。目前,地理加權回歸模型主要應用在生態(tài)學、經濟學和社會科學等領域[15- 19]。近年來,國外已有少數學者將該模型的拓展模型即地理加權邏輯斯蒂模型(GWLR)應用于森林火災的預測預報及林火影響因子的空間分析上,并且表現(xiàn)出較好的擬合效果[12- 14]。由于該模型強調自變量與因變量關系的空間異質性,因此模型在不同區(qū)域的適用性可能有較大差異。為了探討GWLR模型對我國亞熱帶地區(qū)林火預測預報的適用性,且由于2000—2005年福建省的林火發(fā)生既不是太多,也不是很少,比較有代表性,因此本文以福建省2000—2005年衛(wèi)星火點數據為基礎,選取每日氣象數據為自變量因子,對模型的擬合能力進行分析,并與傳統(tǒng)全局邏輯斯蒂回歸模型進行對比,探討地理加權回歸模型在林火預測預報上的適用性。
1.1 研究區(qū)域概況

圖1 研究區(qū)域示意圖Fig.1 The study area
福建省位于我國東南沿海地區(qū),介于北緯23°33′—28°20′、東經115°50′—120°40′之間(圖1)。根據第八次全國森林資源清查結果顯示,福建省林業(yè)用地面積926.82萬hm2,森林面積801.27萬hm2,人工林面積377.69萬hm2,森林覆蓋率65.95%,森林蓄積量60796.15萬m3[20],是我國南方重點林區(qū)的省份之一。但是,也是我國森林火災的高發(fā)區(qū)。1951—1987年,全省共發(fā)生6.2萬次的森林火災,受害山林面積有150萬hm2,平均每年森林火災0.1萬次,受害山林面積4萬hm2,占全省年平均造林面積的25%—33.3%[21];1998—2007年間,福建省共發(fā)生森林火災4504起,火場面積累計達79,572hm2,受害森林面積累計達55485.6 hm2,共損失了97萬m3的林木蓄積量,其中2004年發(fā)生了1164次火災,1998年林火發(fā)生次數最少,為156次;僅10年就發(fā)生了40次重大火災[22]。福建省森林火災問題尤為嚴峻。
1.2 數據來源與處理
1.2.1 數據來源
福建省2000—2005年的林火發(fā)生數據(包括起火時間、起火原因、起火地理坐標等)來源于林業(yè)科學數據中心(http://www.cfsdc.org/indexAction.action?classId=1)提供的衛(wèi)星火點解譯數據;歷史氣象數據來源于中國氣象數據共享網絡(http://cdc.cma.gov.cn/),為2000—2005年福建省內22個國家級氣象站的每日氣象數據,一共包22個氣象因子。由于儀器設備和氣象站點變化等原因,造成部分數據缺失,且無法修補。因此,本研究對氣象數據進行預處理,剔除部分缺失數據,剩下的氣象因子包括日平均地表氣溫(℃),日最高地表氣溫(℃),日最低地表氣溫(℃),日平均風速(m/s),日最大風速(m/s),24小時降水量(mm),日平均本站氣壓(hPa),日最高本站氣壓(hPa),日最低本站氣壓(hPa),日照時數(hour),日平均氣溫(℃),日最高氣溫(℃),日最低氣溫(℃),日平均相對濕度(%),日最小相對濕度(%)共15個氣象因子。
1.2.2 數據處理
本文以2000—2005年的衛(wèi)星火點數據為基礎,從中隨機選取60%的訓練樣本(5210個林火數據)來構建模型,剩下40%的測試樣本(3473個林火數據)用來檢驗模型。同時,為了避免樣本分布對試驗結果的影響,本文重復5次試驗,即重復5次訓練樣本和測試樣本的隨機劃分,選擇5次試驗中出現(xiàn)3次或以上的顯著變量進入全樣本數據擬合。
本文分別應用SPSS 19.0和GWR4軟件對邏輯斯蒂回歸模型和地理加權邏輯斯蒂回歸模型進行擬合,并應用Rookcase軟件對模型殘差進行空間自相關分析。
1.3 研究方法
1.3.1 二項邏輯斯蒂回歸模型
(1)多重共線性(Multicollinearity)是指在線性回歸模型中,自變量之間存在精確的相關關系或者高度相關關系的現(xiàn)象。
本文運用方差膨脹因子(the variance inflation factor,VIF)診斷法對林火發(fā)生的驅動因子進行共線性檢驗。方差膨脹因子最早是由Marquardt于1960年引入的,第i個變量的方差膨脹系數的表達式為

(3)

(2)邏輯斯蒂回歸模型屬于廣義線性回歸模型,對于只有兩種分類結果的分類因變量,可以應用二元邏輯斯蒂回歸模型進行建模分析,其預測值為在[0,1]之間的預測概率。邏輯斯蒂模型是目前國內外應用最廣的用于預測林火發(fā)生概率的模型。設有林火發(fā)生(Y=1)的概率為P,則無林火發(fā)生(Y=0)的概率為(1-P),則有林火發(fā)生的概率

(1)
式中,z為解釋變量x1,x2,...,xn的線性函數,
z=α0+α1x1+α2x2+...+αnxn
(2)
式中,α0,α1,α2,...,αn為各個解釋變量的回歸系數。
對P進行Logit變換,即將P變換為ln[P/(1-P)],則有

(3)
最后,運用極大似然估計法可求得模型的參數估計系數α0,α1,α2,...,αn[23- 25]。
1.3.2 地理加權邏輯斯蒂回歸模型
由于地理位置的不同而引起變量之間的關系或者結構發(fā)生變化的現(xiàn)象稱為空間非平穩(wěn)性(spatialnonstationarity)。地理加權邏輯斯蒂回歸模型是傳統(tǒng)邏輯斯蒂回歸模型的擴展,考慮了空間位置因素,利用加權最小二乘法對每一個坐標點進行參數估計,對參數的估計是局部而非全局的,每一個位置均有相應的參數估計系數[26-27]。地理加權邏輯斯蒂回歸模型(GWLR)的表達式為:與邏輯斯蒂模型相同,位置i有林火發(fā)生(Y=1)的概率為P,則無林火發(fā)生(Y=0)的概率為(1-P),則位置i有林火發(fā)生概率

式中,z=α0(ui,vi)+α1(ui,vi)xi1+α2(ui,vi)xi2+...+αn(ui,vi)xin。
經Logit變換,有

最后,運用加權最小二乘法可求得位置i的局部回歸模型的參數估計系數,即


1.3.3 模型預測準確率計算
本文根據ROC曲線分析法所計算出來的敏感性值和特異性值,可求得約登指數,即約登指數=敏感性值+特異性值-1,進而計算出福建省林火發(fā)生的最佳臨界值(cut-off值),如果林火發(fā)生的預測概率大于該臨界值則認為有林火發(fā)生,小于該臨界值則認為無林火發(fā)生,從而根據模型所計算出來的林火發(fā)生次數與實際值進行比較,進而計算出LR模型和GWLR模型模型對林火發(fā)生與否的正確判別率。
1.3.4 模型空間自相關檢驗Moran′sI
本文應用全局Moran′sI指數計算殘差(殘差=觀測值-預測值)的空間自相關來對模型進行評價,全局Moran′sI指數的值越小,說明殘差的空間依賴程度越低,模型考慮了更多的空間結構問題,模型的效果越好。
全局Moran′sI指數的計算公式為:

2.1 模型擬合結果與分析
2.1.1 多重共線性診斷結果
多重共線性診斷結果顯示,變量“日平均地表氣溫”、“日平均本站氣壓”、“日最低本站氣壓”、“日平均氣溫”、“日最低氣溫”等5個變量均存在共線性關系,將這5個變量剔除之后,用剩下的10個自變量構建LR模型和GWLR模型。
2.1.2 LR模型擬合結果
本文應用LR模型和“wald向前”原則對5個訓練樣本進行擬合計算,得到5個不同的特征變量子集,然后在5個特征變量子集中選擇出現(xiàn)3次或3次以上的特征變量進入全樣本數據的擬合計算(表1)。

表1 LR模型特征變量選擇結果
+表示變量在模型里面;-表示變量不在模型里面
由表1可知,“日最高地表氣溫”、“日最低地表氣溫”、“日平均風速”、“日降水量”、“日最高本站氣壓”、“日照時數”、“日最高氣溫”和“日最小相對濕度”等8個變量進入了全樣本數據的擬合階段,且除了“日最高本站氣壓”和“日最小相對濕度”在5個中間模型特征變量選擇結果中出現(xiàn)4次以外,其他6個變量均出現(xiàn)了5次。表2為8個顯著變量的全樣本數據擬合結果,結果顯示各變量與林火發(fā)生具有顯著相關性。其中“日最高地表氣溫”、“日平均風速”、“日最高本站氣壓”、“日照時數”和“日最高氣溫”等5個氣象因子與森林火災呈正相關關系,“日最低地表氣溫”、“日降水量”和“日最小相對濕度”3個氣象因子與森林火災呈負相關關系,且這8個氣象因子對林火發(fā)生均有顯著的影響。

表2 全樣本數據的LR模型參數擬合結果
2.1.3 GWLR模型擬合結果
首先假設模型的數據結構是空間非平穩(wěn)的,對5個訓練樣本進行模型擬合,然后對因變量與解釋變量之間的關系的空間非平穩(wěn)性進行檢驗。如果“某解釋變量的估計系數的四分位數范圍大于LR模型中該解釋變量的估計系數的±1標準差范圍”[13,29],則認為該解釋變量是顯著空間非平穩(wěn)變量(以樣本1為例,LR模型和GWLR模型系數估計結果見附表1)。最后在5個訓練樣本中選擇出現(xiàn)3次或3次以上的非平穩(wěn)變量進入全樣本數據的擬合階段,并作為全樣本數據模型的非平穩(wěn)項,而其他平穩(wěn)變量則作為全樣本數據模型的平穩(wěn)項。檢驗結果顯示除了“日最低相對濕度”在5個中間模型中有1次被檢驗為空間平穩(wěn)變量之外,其他9個氣象因子在5個中間模型中均被檢驗為空間非平穩(wěn)變量(附表2)。全樣本數據的GWLR模型參數擬合結果如表3所示。

表3 全樣本數據的GWLR模型參數估計
注:系數的最大和最小值若符號相同表示該變量在整個研究區(qū)域上與林火的相關性一致,反之表示變量在整個區(qū)域上與林火的相關性具有正負差異
表3顯示,除“日最低地表氣溫”在整個研究區(qū)域上均與林火發(fā)生呈負相關關系之外,其他9個氣象因子在整個研究區(qū)域上均在正相關和負相關之間變化。為更好體現(xiàn)GWLR模型各變量系數的局部變化,本文運用ArcGIS 10.2對各變量模型估計系數進行空間插值(圖2)。圖2表明GWLR模型的估計系數隨空間位置變化而變化,具有明顯的空間異質性。


圖2 變量系數分布圖Fig.2 Variable coefficient distribution
此外,對各變量估計系數的t檢驗值進行空間插值,若估計系數t檢驗值的絕對值小于1.96,則表示估計系數在研究區(qū)域上不顯示,若t檢驗值小于-1.96或大于1.96,說明估計系數顯著。圖3表明模型變量的估計系數的顯著性也具有很強的空間異質性。
圖2,圖3綜合顯示“日最低地表氣溫”在整個研究區(qū)域上均與林火發(fā)生呈負相關關系,且該因子的估計系數在整個研究區(qū)域上均顯著;“24小時降水量”與林火發(fā)生呈顯著負相關系數;“日照時數”和“日最高氣溫”與林火發(fā)生呈顯著正相關關系;“日最高本站氣壓”與林火發(fā)生存在正負兩種相關性,但以正相關為主,主要分布在福建北部和南部地區(qū);“日平均相對濕度”在南平市北部地區(qū)和龍巖市大部分地區(qū)與林火呈顯著的負相關關系,僅在三明與南平市交界處存在小塊正相關區(qū)域;“日最小相對濕度”在龍巖市西南地區(qū)存在顯著正相關系數,在三明市和永安市交界處及廈門市和漳州市的小部分沿海地區(qū)存在顯著的負相關系數;“日平均風速”在福建省西部和中部地區(qū)與林火發(fā)生呈顯著正相關,而“日最大風速”在西部和中部地區(qū)與林火發(fā)生則呈顯著負相關。
2.2 模型評價
本文將全樣本分成60%的訓練樣本(用于建模)和40%的測試樣本(模型檢驗)。應用最小信息準則(AIC)、殘差平方和(SSE)和ROC曲線(ROC)下的面積AUC值(AUC)等統(tǒng)計量和模型的預測準確率對LR和GWLR模型進行對比評價。
模型擬合統(tǒng)計結果表明,對比傳統(tǒng)邏輯斯蒂回歸模型,地理加權邏輯斯蒂回歸模型具有更小的AIC和SSE值,和更大的AUC值以及更高的模型預測準確率(表4)。表4顯示,LR模型的預測準確率為74.2%—76.2%小于GWLR模型(77.1%—78.6%)。


圖3 變量系數顯著性分布圖Fig.3 Significant distribution of variable coefficient正顯著相關性用暖色調表示,負顯著相關性用冷色調表示

樣本Sample模型Model赤池信息準則Akaikeinformationcriterion(AIC)殘差平方和SumofSquaresforError(SSE)ROC曲線下的面積AreaunderCurve(AUC)臨界值Cut-off預測正確率Predictionaccuracy/%訓練樣本(60%)Trainingdata(60%)測試樣本(40%)Validation(40%)樣本1LR5256.368872.6790.8220.50103075.574.7Sample1GWLR4999.887785.6560.8570.52458778.676.8樣本2LR5307.347883.8820.8220.50108075.275.2Sample2GWLR5054.525795.8510.8550.46660878.576.9樣本3LR5304.786883.6940.8190.47923075.175.9Sample3GWLR5116.377822.7630.8430.51395377.677.3樣本4LR5342.380891.8130.8150.50312574.975.5Sample4GWLR5072.533800.3210.8530.54029177.877.1樣本5LR5401.440905.1020.8100.50197574.276.2Sample5GWLR5172.060820.5540.8450.52282777.679.0全樣本LR8792.5251464.8120.8210.50231075.1CompletesampleGWLR8323.4961328.2740.8530.50520578.4
2.3 殘差分析
根據兩個模型對5樣本和全樣本數據的擬合結果,分別繪制模型的殘差圖(圖4)。圖4表明GWLR模型具有更小的殘差。

圖4 模型殘差箱形圖Fig.4 Box figure the model residuals
全樣本模型的殘差空間自相關(圖5)結果顯示GWLR模型的Moran′s I值比LR模型小,說明與LR模型相比,GWLR模型在福建省林火發(fā)生與否的判別問題中考慮了更多的空間自相關問題,GWLR模型對福建省林火發(fā)生的擬合效果較好。

圖5 全樣本模型的殘差空間自相關Fig.5 Final sample of residual spatial autocorrelation
氣候條件的變化對森林火災的發(fā)生具有重要的影響,因此,本文基于氣象因子應用傳統(tǒng)的邏輯斯蒂回歸模型和地理加權邏輯斯蒂回歸模型對福建省2000—2005年的林火數據進行分析,對兩種模型的預測能力以及對模型在森林火災應用方面的適用性進行分析。模型變量選擇結果顯示,“日最高地表氣溫”、“日最低地表氣溫”、“日平均風速”、“24小時降水量”、“日最高本站氣壓”、“日照時數”、“日最高氣溫”和“日最低相對濕度”等8個變量均是LR模型和GWLR模型的全樣本特征變量,說明這8個氣象因子是福建省森林火災的主要影響因子。氣溫的變化會使可燃物的濕度發(fā)生變化,改變火災的氣候條件,從而對森林火災產生影響。我們的研究結果顯示,“氣溫”對森林火災的發(fā)生具有重要的影響,這與Liu[32]和Hu和Zhou[33]的研究結果一致;相對濕度是反應林內可燃物含水量的一個重要指標,對林火發(fā)生有重要影響。我們的研究結果表明“相對濕度”對林火發(fā)生有重要的影響,與Zhang[24]的研究結果一致。通常一個地區(qū)重特大火災的發(fā)生,與最大風速是相關,但是,本文在對氣象因子進行分析時,邏輯斯蒂回歸模型卻將“日最大風速”剔除,而地理加權邏輯斯蒂回歸模型回歸模型則顯示“日最大風速”是一個空間非平穩(wěn)變量,因此,模型變量的選擇是否理想與模型的選擇相關。此外,本研究并沒有考慮地形、植被類型、人為活動等條件對森林火災的影響,因此可能會對研究結果產生偏差。
傳統(tǒng)的邏輯斯蒂回歸模型假設空間變量都是平穩(wěn)變量,忽略了模型變量的空間異質性,模型的擬合結果無法全面反映變量的空間關系,而本文的研究結果顯示,影響福建省林火發(fā)生的氣象因子具有明顯的空間異質性,且模型評價結果顯示與傳統(tǒng)的邏輯斯蒂回歸模型相比,地理加權邏輯斯蒂回歸模型的擬合效果較好,這與Saefuddin[31]、Koutsias[12]、Wu和Zhang[28]等前人的研究結果一致,表明在對具有空間結構的數據進行擬合分析時,應考慮空間地理位置變化對因變量結果的影響。
本文應用邏輯斯蒂回歸模型和地理加權邏輯斯蒂回歸模型對福建省森林火災空間格局和氣象影響因子進行分析,并對兩種模型的擬合效果進行研究,結果表明:(1)“日最高地表氣溫”、“日最低地表氣溫”、“日平均風速”、“24小時降水量”、“日最高本站氣壓”、“日照時數”、“日最高氣溫”和“日最低相對濕度”等8個變量是3個模型的共同變量,是影響福建省林火發(fā)生的主要氣象因子;(2)在福建省林火發(fā)生的分類判別中,與傳統(tǒng)的邏輯斯蒂回歸模型相比,地理加權邏輯斯蒂回歸模型的擬合效果更好,更適合福建省森林火災的數據結構。
[1] Grogan P, Burns T D, Chapin F S. Fire effects on ecosystem nitrogen cycling in a Californian bishop pine forest. Oecologia, 2000, 122(4): 537- 544.
[2] Liu H P, Rerson J T, Lindfors J, Chapin F S. Changes in the surface energy budget after fire in boreal ecosystems of interior Alaska: An annual perspective. Journal of Geophysical Research Atmospheres, 2005, 110(D13): D13101.
[3] Chas-Amil M L, Touza J, Prestemon P. Spatial distribution of human-caused forest fires in Galicia (NW Spain). Ecology and the Environment, 2010, 137: 247- 258.
[4] Bisquert M, Caselles E, Sánchez J M, Caselles. Application of artificial neural networks and logistic regression to the prediction of forest fire danger in Galicia using MODIS data. International Journal of Wildland Fire, 2012, 21(8): 1025- 1029.
[5] Parisien M A, Snetsinger S, Greenberg J A, Nelson C R, Schoennagel T, Dobrowski S Z, Moritz M A. Spatial variability in wildfire probability across the western United States. International Journal of Wildland Fire, 2012, 21(4): 313- 327.
[6] Renard Q, Pélissier R, Ramesh B R, Kodandapani N. Environmental susceptibility model for predicting forest fire occurrence in the Western Ghats of India. International Journal of Wildland Fire, 2012, 21(4): 368- 379.
[7] Lozano F J, Suárez-Seoane S, Kelly M, Luis E. A multi-scale approach for modeling fire occurrence probability using satellite data and classification trees: A case study in a mountainous Mediterranean region. Remote Sensing of Environment, 2008, 112(3): 708- 719.
[8] 郭福濤, 蘇漳文, 馬祥慶, 宋禹輝, 孫龍, 胡海清, 楊婷婷. 大興安嶺塔河地區(qū)雷擊火發(fā)生驅動因子綜合分析. 生態(tài)學報, 2015, 35(19): 6439- 6448.
[9] 郭福濤, 胡海清, 金森, 馬志海, 張揚. 基于負二項和零膨脹負二項回歸模型的大興安嶺地區(qū)雷擊火與氣象因素的關系. 植物生態(tài)學報, 2010, 34(5): 571- 577.
[10] 秦凱倫, 郭福濤, 邸雪穎, 孫龍, 宋禹輝, 吳瑤, 潘建峰. 大興安嶺塔河地區(qū)林火發(fā)生的優(yōu)勢預測模型選擇. 應用生態(tài)學報, 2014, 25(3): 731- 737.
[11] 郭福濤, 胡海清, 馬志海, 張揚. 不同模型對擬合大興安嶺林火發(fā)生與氣象因素關系的適用性. 應用生態(tài)學報, 2010, 21(1): 159- 164.
[12] Koutsias N, Martínez J, Chuvieco E, Allig?wer B. Modeling wildland fire occurrence in southern europe by a geographically weighted regression approach // Proceedings of the 5th International Workshop on Remote Sensing and GIS Applications to Forest Fire Management: Fire Effects Assessment. Spain: Universidad de Zaragoza, 2005: 57- 60.
[13] Martínez-Fernández J, Chuvieco E, Koutsias N. Modelling long-term fire occurrence factors in Spain by accounting for local variations with geographically weighted regression. Natural Hazards and Earth System Sciences, 2013, 13(2): 311- 327.
[14] Rodrigues M, De La Riva J, Fotheringham S. Modeling the spatial variation of the explanatory factors of human-caused wildfires in Spain using geographically weighted logistic regression. Applied Geography, 2014, 48: 52- 63.
[15] Wang Q, Ni J, Tenhunen J. Application of a geographically-weighted regression analysis to estimate net primary production of Chinese forest ecosystems. Global Ecology and Biogeography, 2005, 14(4): 379- 393.
[16] Tu J. Spatially varying relationships between land use and water quality across an urbanization gradient explored by geographically weighted regression. Applied Geography, 2011, 31(1): 376- 392.
[17] Propastin P. Modifying geographically weighted regression for estimating aboveground biomass in tropical rainforests by multispectral remote sensing data. International Journal of Applied Earth Observation and Geoinformation, 2012, 18: 82- 90.
[18] Freedman R, Roy S S. Spatial patterning ofMantabirostrisin United States east coast offshore habitat. Applied Geography, 2012, 32(2): 652- 659.
[19] Aguilar G D, Farnworth M J. Stray cats in Auckland, New Zealand: discovering geographic information for exploratory spatial analysis. Applied Geography, 2012, 34: 230- 238.
[20] 國家林業(yè)局. 第八次全國森林資源清查結果. 林業(yè)資源管理, 2014, (1): 1- 2.
[21] 李兆明, 高兆蔚. 福建森林火險天氣等級預測預報方法. 福建林學院學報, 1989, 9(2): 172- 176.
[22] 朱學平, 何東進, 丁福立, 洪偉, 游巍斌, 紀志榮. 基于突變級數法的福建省森林火災評價分析. 福建林學院學報, 2011, 31(4): 295- 299.
[23] Garcia C V, Woodard P M, Titus S J, Adamowicz W L, Lee B S. A logit model for predicting the daily occurrence of human caused forest-fires. International Journal of Wildland Fire, 1995, 5(2): 101- 111.
[24] Zhang Z X, Zhang H Y, Zhou D W. Using GIS spatial analysis and logistic regression to predict the probabilities of human-caused grassland fires. Journal of Arid Environments, 2010, 74(3): 386- 393.
[25] del Hoyo L V, Isabel M P M, Vega F J M. Logistic regression models for human-caused wildfire risk estimation: analysing the effect of the spatial accuracy in fire occurrence data. European Journal of Forest Research, 2011, 130(6): 983- 996.
[26] 郭含茹, 張茂震, 徐麗華, 袁振花, 陳田閣. 基于地理加權回歸的區(qū)域森林碳儲量估計. 浙江農林大學學報, 2015, 32(4): 497- 508.
[27] 肖燕婷, 田錚, 魏岳嵩. 時空地理加權回歸模型的時空非平穩(wěn)性檢驗. 系統(tǒng)工程理論與實踐, 2013, 33(6): 1537- 1542.
[28] Wu W, Zhang L J. Comparison of spatial and non-spatial logistic regression models for modeling the occurrence of cloud cover in northeastern Puerto Rico. Applied Geography, 2013, 37: 52- 62.
[29] Zhang H J, Qi P C, Guo G M. Improvement of fire danger modelling with geographically weighted logistic model. International Journal of Wildland Fire, 2014, 23(8): 1130- 1146.
[30] Rodrigues M, De La Riva J. An insight into machine-learning algorithms to model human-caused wildfire occurrence. Environmental Modelling & Software, 2014, 57: 192- 201.
[31] Saefuddin A, Setiabudi N A, Fitrianto A. On comparison between logistic regression and geographically weighted logistic regression: with application to Indonesian poverty data. World Applied Sciences Journal, 2012, 19(2): 205- 210.
[32] Liu Z H, Yang J, Chang Y, Weisberg P J, He H S. Spatial patterns and drivers of fire occurrence and its future trend under climate change in a boreal forest of Northeast China. Global Change Biology, 2012, 18(6): 2041- 2056.
[33] Hu T Y, Zhou G S. Drivers of lightning-and human-caused fire regimes in the Great Xing′an Mountains. Forest Ecology and Management, 2014, 329: 49- 58.
附表:
Comparing the application of logistic and geographically weighted logistic regression models for Fujian forest fire forecasting
LIANG Huiling1,2,3, WANG Wenhui2, GUO Futao2, LIN Fangfang1, LIN Yurui1,*
1CollegeofComputerandInformationScience,FujianAgricultureandForestryUniversity,Fuzhou350002,China2CollegeofForestry,FujianAgricultureandForestryUniversity,Fuzhou350002,China3ZhangzhouInstituteOfScience&Engineering,Zhangzhou363000,China
Forest fire forecasting is a key component of effective and science-based forest management and has been comprehensively addressed in the scientific literature. The logistic regression (LR) technique has been used in forest fire prediction models. However, some scholars have recently reported that the technique does not adequately consider the spatial correlation and heterogeneity of fire impact factors, which results in poorly fitting models. In contrast, geographically weighted logistic regression (GWR) models consider the spatial correlation of model variables, which improves the model′s goodness of fit. In order to explore the applicability of the GWLR model in Fujian forest fire forecasting, the present study used both the LR and GWLR methods to establish forecast model for forest fires and meteorological factors in Fujian Province, and the model fitting ability of two models were compared. Based on the forest fire and meteorological data for Fujian from 2000 to 2005, the original dataset was randomly divided into training (60%) and validation (40%) samples, with five replications and five sample groups, and predictors that were significant (ɑ=0.05) for at least three of the five sample groups were included in the final models. The goodness of fit, residual error, spatial autocorrelation, and prediction accuracy of the GWLR model were all better than those of the LR model, and the GWLR comprehensively explained the spatial heterogeneity of model variables and helped to improve the prediction accuracy of the model. The study also verified the suitability of the GWLR model on the forest fire forecasting in Fujian area. In addition, the results also indicated that the occurrence of Fujian forest fires is significantly affected by eight parameters, including minimum and maximum surface temperature, daily average wind speed, daily precipitation, highest station pressure, hours of sunshine, daily maximum temperature, and daily minimum relative humidity. Therefore, the GWLR model may provide a new technique for the prediction of forest fires in Fujian Province.
forest fire forecast; spatial heterogeneity; logistic regression; geographically weighted logistic regression(GWLR)

附表1 LR模型和GWLR模型的系數估計(樣本1)

附表2 GWLR模型空間(非)平穩(wěn)變量檢驗結果
+表示該變量是空間非平穩(wěn)變量;-表示該變量是空間平穩(wěn)變量
國家自然科學基金(31400552);福建省自然科學基金(2015J05049);福建省教育廳資助省屬高校專項(JK2014012)
2016- 05- 01;
2017- 01- 16
10.5846/stxb201605010828
*通訊作者Corresponding author.E-mail: yrlin@fafu.edu.cn
梁慧玲,王文輝,郭福濤,林芳芳,林玉蕊.比較邏輯斯蒂與地理加權邏輯斯蒂回歸模型在福建林火發(fā)生的適用性.生態(tài)學報,2017,37(12):4128- 4141.
Liang H L, Wang W H,Guo F T, Lin F F, Lin Y R.Comparing the application of logistic and geographically weighted logistic regression models for Fujian forest fire forecasting.Acta Ecologica Sinica,2017,37(12):4128- 4141.