●劉 寧,祝國苓
(天津市消防總隊,天津 300090)
火災預測是火災系統領域中一個不可缺少的課題,對一個具體火災而言是隨機和偶然的,但對于一個城市或地區的火災總體,其火災發生具有一定的規律性。探索整個火災系統隨時間的演變規律,將揭示城市火災的宏觀規律,促進城市火災的“可持續防治”。
前人通過從已有的研究對城市火災系統進行了初步的分析,發現城市火災分布具有明顯的冪律分布,而且城市火災的“頻率 -損失”冪律分布具有尺度不變性(即體系經過尺度變換后,其某一特性不變)和時間不變性(即時間靠后的數據不對時間靠前的結果產生影響)。城市火災的冪律分布表明不同規模,不同時期的火災具有相互關聯,可以由火災的歷史數據預測未來的火災發生情況,火災規律的隨機性可以用統計的方法進行研究,通過總結、整理和分析大量的火災原始資料,歸納出火災發生的隨機性規律[1]。
影響城市火災發生的外界因素很多,除社會經濟因素[2]、技術因素、政治因素等,還有自然氣象方面的因素。目前對氣象因素與火災之間的關系相對研究較少,但火災作為一個開放系統,必然在很大程度上受到自然現象的影響,其中氣象因素對火災的發生、防治和損失控制方面有著重要的影響[3-4]。本文以天津市的火災數據與氣象因素進行相關性分析和研究,借助回歸理論建立火災起數與關鍵氣象因素之間的關聯模型,并采用已有數據對模型進行了驗證,用來說明火災發生與氣象因素的關系。
許多經濟等現象往往受多個因素的影響,研究被解釋變量受多個解釋變量的影響,可利用多元回歸模型。多元線性回歸模型假定被解釋變量 Y與多個解釋變量 X1,X2,…,Xk之間具有線性關系,是解釋變量的多元線性函數,稱為多元線性回歸模型。即

其中,Y為被解釋變量,Xj(j=1,2,…,k)為 k個解釋變量,βj(j=0,1,2,…,k)為 k+1個未知參數,μ為隨機誤差項。
被解釋變量 Y的期望值與解釋變量 X1,X2,…,Xk的線性方程為:

該方程稱為多元總體線性回歸方程,簡稱總體回歸方程。
與一元線性回歸分析一樣,多元線性回歸分析仍是根據觀測樣本估計模型中的各個參數,對估計參數及回歸方程進行統計檢驗,從而利用回歸模型進行預測和分析。多元線性回歸模型包含多個解釋變量,多個解釋變量同時對被解釋變量發生作用,若要考察其中一個解釋變量對 Y的影響就必須假設其它解釋變量保持不變來進行分析。因此多元線性回歸模型中的回歸系數為偏回歸系數,即反映了當模型中的其它變量不變時,其中一個解釋變量對因變量 Y均值的影響。
多元線性回歸模型利用普通最小二乘法(OLS)對參數進行估計時,有如下假定:(1)零均值假定:E(μi)=0,i=1,2,…,n;(2)同方差假定(μ的方差為同一常數),;(3)無自相關性:;(4)隨機誤差項 μ與解釋變量 X不相關(這個假定自動成立)隨機誤差項 μ服從均值為零,方差為σ2的正態分布;(6)解釋變量之間不存在多重共線性:rank(X)=k+1≤n,即各解釋變量的樣本觀測值之間線性無關,解釋變量的樣本觀測值矩陣 X的秩為參數個數 k+1,從而保證參數β0,β1,β2,…,βk的估計值惟一。
對于含有 k個解釋變量的多元線性回歸模型 Y=Xβ+μ,參數 β的最小二乘估計為:

建立的回歸方程需進行實際意義檢驗和統計檢驗。實際意義檢驗主要檢驗模型參數估計量在實際意義上的合理性。其表現為檢驗求得的參數估計值的符號與大小是否合理,是否與根據人們的經驗和實際理論所擬定的期望值相符合。所有參數估計值通過實際意義檢驗后,再進行統計檢驗,統計檢驗主要包括擬合優度檢驗(R2檢驗)、方程顯著性檢驗(F檢驗)、變量顯著性檢驗(t檢驗)等。
要進行預測,可將樣本值代入回歸方程:

對于給定置信水平 1-α,預測值 Y0置信區間為:

天津市地處華北平原東北部,環渤海灣的中心,東臨渤海,北依燕山,處于國際時區的東八區,位于中緯度歐亞大陸東岸,主要受季風環流的支配,是東亞季風盛行的地區,屬大陸性氣候。主要氣候特征為:四季分明,春季多風,干旱少雨;夏季炎熱,雨水集中;秋季氣爽,冷暖適中;冬季寒冷,干燥少雪。天津年平均氣溫在 11.4~12.9℃,市區年平均氣溫最高為 12.9℃。1月最冷,平均氣溫在 -3~-5℃;7月最熱,平均氣溫在 26~27℃。在四季中,冬季最長,有 156~167天;夏季次之,有 87~103天;春季56~61天;秋季最短,僅為 50~56天。天津年平均降水量為 520~660mm,降水日數為 63~70天。在地區分布上,山地多于平原,沿海多于內地。在季節分布上,6、7、8三個月降水量占全年的 75%左右。
本文選取天津市 1997年 ~2007年 11年間的月度火災發生次數與月平均溫度、月平均相對濕度、月平均風速、月平均降雨量等氣象因素進行相關性分析。選取月平均溫度、月平均相對濕度、月平均風速、月平均降雨量作為影響火災發生次數的四個氣象因素,建立月火災次數的線性回歸模型。本文采用 SPSS軟件,通過逐步回歸法進行變量篩選并建立線性回歸方程。
2.1.1 數據說明
由于 1997年實施了新的火災統計方法,將以往難以統計的小火災計入火災發生數中,影響了火災數據的連續性,火災發生數在 1997年前后不具有可比性。由于找不出合適的數學手段來調整這種數據的躍變,筆者僅對 1997年及其以后的數據進行處理。其中,1997~2003年天津市火災起數來自《中國火災統計年鑒》(1997-2003),數據如圖 1所示,2004~2006年天津市火災起數來自《中國消防年鑒》(2004-2006),按照當時的統計標準,火災起數即消防隊出火警次數,到了 2007年,統計標準改變,僅將造成損失的火警數統計為火災數據,為保持數據統計標準的連貫性,筆者選擇由天津市消防局記錄的月出火警次數作為 2007年的火災起數。[5-6]

圖1 天津市 1997~2007年間月火災發生起數
2.1.2 異常值處理
從圖 1可以看出,天津市 1997~2007年間的月火災發生起數以年為單位呈現大致的周期性變化。本文將該參數作為被解釋變量 Y,出于統計意義的考慮,在建立多元線形回歸模型之前,先要對數據進行異常值剔除。筆者刪除了火災發生次數大于1 000的 6個數據,即圖 1中虛線以上的點,剩余 126個數據作為后面建立回歸模型的依據。
2.1.3 線性相關分析
利用進行異常值處理之后的樣本數據計算火災發生次數 Y與月平均溫度 X1、月平均相對濕度 X2、月平均風速 X3、月平均降雨量 X4之間的相關系數,見表 1所示。

表1 線性相關系數表(1997-2007)
從表 1中,可以看出氣象因子對月火災發生起數的影響從大到小依次為:X1、X4、X2、X3,月平均溫度 X1是最主要的影響因素,相對濕度和降雨量是次于溫度影響的氣象因子,月平均風速對火災發生的影響相對較小。火災發生起數與月平均溫度的相關系數為負,說明二者是負相關的,即平均溫度越低越容易發生火災,平均溫度越高越不容易發生火災,這是因為環境氣溫直接影響引燃物品的含水量;而降雨量直接影響空氣濕度的變化,從而影響引燃物的含水量。風速對城市火災發生的直接影響不大,但必須注意,風速對火災的蔓延影響較大,當風速達到一定值時,容易產生飛火,導致第二火場。
2.1.4 根據逐步回歸方法,得到進入回歸方程的自變量為月平均溫度和月平均降水量,并得到回歸方程中的系數如表 2。
根據表 2,采用非標準化系數,可以建立如下回歸方程:

表2 回歸方程系數表

判定系數 R2=0.543,在顯著性水平 α=0.05下,檢驗統計量F=30.108>F0.95(2,127)=2.35,(p-值 0.000<0.05)即線性回歸方程是顯著的。
在 0.05置信水平下,變量 X1,X4均能通過 t檢驗,因為常數項、變量 X1、X2的檢驗 p-值分別為0.000、0.000、0.002,都小于 0.05,所以我們建立多元線形回歸模型式(6)是合適的。
為進一步考察回歸方程的合理性,采用 2008年1~7月份的氣象數據對方程進行驗證,原始氣象數據如表 3。將原始氣象數據代入式(6),可得到月火災起數的預測值與實際值的對比如圖 2所示。

表3 2008年 1~7月份氣象數據

圖2 2008年 1~7月份月火災發生起數對比
從圖 2中可以看出,回歸模型較好地預測了 2~7月份的火災發生趨勢,這 6個月火災發生起數總體呈下降趨勢,這與統計數據是一致的。但其中 1、3和 5月份的預測值比實際值高,以 1月份差別最大,首先是因為火災的發生受多重因素影響,氣象并非影響火災發生的惟一原因,故僅采用氣象因素預測火災發生起數本身有一定的局限性;其次是 1月份我國許多地區發生雪災,天津也未能幸免,大量降雪導致室外空間在很長一段時期內被雪覆蓋,室外的可燃物很難起火,所以實際值和預測值的差別較大。
多元回歸模型對預測城市火災的發生趨勢具有較好的參考意義,要預測未來年份的月火災發生起數,必須先獲得未來年份的氣象數據。圖 3是天津市 1997~2007年的月平均氣溫,數據以年為單位呈現極為規則的周期性,氣溫最低的月份一般為 1月,最高的月份為 7月。圖4是天津市 1997~2007年的月平均降雨量,也呈現較為明顯的規律性,每年冬季降雨量較低,夏季降雨量較高。我們在對未來年份的火災發生趨勢進行預測分析時,可以對之前若干年份的月平均氣溫和月平均降雨量取平均值,作為解釋變量代入式(6)中,得到預測結果。

圖3 天津市 1997~2007年的月平均氣溫

圖4 天津市 1997-2007年的月平均降雨量(mm)
氣象因素在許多火災過程中并不一定是引起火災發生的直接原因,但與火災發生和發展有著密不可分的相互關系。基于對城市火災和氣象因素的相關性分析,建立必要的監測理論模型及實施系統,對城市火災進行早期預防,以減少城市火災的危害,具有相當程度的實際價值。本文針對天津市的火災數據與氣象因素進行相關性分析和研究,借助回歸理論建立火災起數與關鍵氣象因素之間的關聯模型。結果表明,天津市全年火災發生的高發期出現在 1、2、3、12月冬春之際,氣溫低、用火用電明顯增多,相對濕度小,可燃物含水量低,極易引發火災。且逢元旦、春節,人們節前生活繁忙、節中精神松懈,往往忽略火源管理,加上節日期間普遍燃放煙花爆竹,造成火災高發,因此在這幾個月中,政府消防工作的重點應當在節假日前后的消防安全宣傳、對重點防火的部位如公眾聚集場所的預防火災治理和滅火救援工作上。
[1]宋衛國,王健.火災系統的復雜性與可持續防治[J].科技導報,2004,25(8):17-20.
[2]楊立中,江大白.中國火災與社會經濟因素的關系[J].中國工程科學,2003,5(2):62-67.
[3]康嫦娥.城市火災的氣象條件分析及火險預報[J].氣象,1993,19(7):47-51.
[4]馀耀標,許平.城市火災淺析[M].北京:氣象出版社,1992:14-85.
[5]公安部消防局.中國火災統計年鑒(1997-2003)[M].北京:中國人民公安大學出版社.
[6]公安部消防局.中國消防年鑒(2004-2006)[M].北京:中國人事出版社.