馮麗琦 趙亞琴 孫一超 龔云荷
(南京林業大學機械電子工程學院 江蘇 南京 210037)
野外雜草樹木叢生,發生火災時蔓延速度很快,而且交通不便,火災撲救難度很大,一旦發生火災,會導致嚴重后果。因此,早期火災識別和及時撲救就顯得尤為關鍵。視頻監控系統能夠實現24小時監控,能夠及時發現早期火災,很大程度上減少了早期火災的誤報和漏報的情況。
許多研究者們致力于野外火災識別研究,取得了一定的進展,主要分為基于火焰圖像和基于火焰視頻兩大類。由于火焰區域的紋理特征與顏色相似的干擾對象有較大區別,因此,基于火焰圖像的識別方法主要研究火焰的紋理特征提取,如徐小軍等[1]采用灰度共生矩陣分析法分析火焰以及干擾物在能量、熵、慣性矩和局部平穩性四個主要方面的紋理特征。盧英等[2]利用局部二值模式(LBP)和全局二值模式(GBP)提取火焰局部紋理特征和全局紋理特征。張霞[3]基于雙樹復小波變換特征和DRLBP模式分析火焰的紋理特征。嚴云洋等[4]提出用三正交平面局部混合模式(LMP-TOP)描述火焰的靜動態紋理。白曉靜等[5]提出一種基于多尺度顏色特征和小波紋理特征(MCWT)的火焰圖像特征提取方法。宋昱等[6]提出了一種基于Log-Gabor小波和分數階多項式核主成分分析(KPCA)的火焰圖像狀態識別方法。基于火焰視頻的火災識別方法通過提取火焰的動態特征來達到高的識別準確率,如張興坤[7]綜合火焰顏色及運動的幀間相關性,融合多維度特征,用于火焰的識別。朱正超[8]利用Freeman鏈碼獲得火焰輪廓的外接矩形,利用KNN算法進行火焰特征選擇。徐銘銘[9]基于滑動時間窗將林火監控視頻劃分成時空視頻塊,在視頻片段大粒度下分析火焰的時空特征。楊娟利[10]依據火焰運動累積和顏色特性,并結合視頻背景建模方法構建火焰的時間顯著圖。
但是以上基于圖像的火災識別算法對于復雜野外環境如枯草、可樹枝樹葉等情況下的野外火災識別準確率還有待提高。基于視頻的火災識別方法需要提取相鄰幀的動態特征,使得火災圖像識別的實時性不高。本文從提高野外復雜環境下的火災識別準確率和火災識別速度兩方面考慮,首先提出一種多尺度局部紋理提取算法,對Gabor濾波的不同尺度圖像提取LBP局部紋理特征。考慮到一個幀率內火焰圖像區域的變化很小,選擇每一幀圖像進行特征提取顯然是沒有必要的,為了提高識別效率,在保證識別準確率的前提下,每3個幀率作為時間窗口,隨機選擇其中的5幅圖像的識別結果代替3個幀率的所有圖像。然后,對于LBP局部紋理特征運用CART決策樹進行降維處理,篩選特征以提高分類器的分類精度和速度。火焰識別算法框架如圖1所示。

圖1 本文的火焰識別算法框架
本文基于RGB和HSV顏色模型計算不同像素對應的不同的通道值,通過對不同場景拍攝的火災火焰圖像像素的RGB值和HSV值分析,最終選定如下公式去除絕大多數的非火焰像素:

(1)
式中:R、G、B、V分別代表著圖像的紅色分量、綠色分量、藍色分量和亮度。如果圖像中的像素滿足式(1),則被判斷為疑似火焰像素。但是,枯草和光照等干擾物的顏色與火焰的顏色相近,就很容易被誤判為火焰像素,因而需要結合其他特征來進一步排除。圖2所示為3個包含干擾對象的實驗視頻圖像的火焰像素檢測結果,從圖2中可以看出,由于枯草、光照等干擾對象的影響,所以一些非火焰像素被錯誤地識別為火焰像素。

(a) 原始火焰圖像

(b) 疑似火焰像素提取結果圖圖2 像素提取效果圖
(2)
實數和虛數部分分別如式(3)和式(4):
(3)
(4)
式中:λ為波長,θ為方向角,其指定了Gabor函數并行條紋的方向,φ為相位偏移,γ為長寬比,b為帶寬,x′和y′的計算公式如下:
x′=xcosθ+ysinθ
y′=-xsinθ+ycosθ
(5)
本文的實驗中選擇5個尺度8個方向的Gabor特征,分別取φ=0,γ=0.5,b=360°。將疑似火焰區域進行Gabor濾波處理后,通過觀察各個方向、各個尺度的Gabor特征圖如圖3所示。可以發現其反映了火焰的不同特征,并且在不同的光照處理下其依舊可以保持穩定的狀態,但有一部分特征圖并不是很清晰,例如λ=2.828 4,θ=157.5°和λ=5.656 9,θ=0°等的特征圖,火焰的本真信息難以完整地表達出來。

(a) 原圖

(b) Gabor特征圖圖3 Gabor濾波特征圖
本文運用均勻模式LBP(Uniform LBP)提取局部紋理特征,LBP模式將中心位置像素的灰度值與8鄰域像素的灰度值進行比較,如果某個鄰域像素的灰度值大于中心位置像素灰度值,則該鄰域像素點的位置被標記為1,否則為0,從而得到中心像素的LBP值。其數學表達式如下[3]:
(6)
式中:(xc,yc)為中心像素的坐標,p為鄰域的第p個像素,ip為鄰域像素的灰度值,ic為中心像素的灰度值,s(x)為符號函數,計算公式如下:

(7)
一個LBP算子可以得到不同的二進制模式,得到256個LBP特征,而二進制模式的種類還會隨著鄰域內采樣點數的增加而急劇增加,這大大降低了紋理表達的效果。Uniform LBP對原始LBP進行降維,將256個LBP特征值分為59個,這59個模式占據了圖像中所有模式的絕大部分,能夠較好地描述了圖像的局部紋理,圖4所示為某個火焰區域的原始LBP直方圖和Uniform LBP直方圖。同時,為了避免因為“位置沒有對準”而產生的誤差,本文將Gabor濾波特征圖以16×16的像素鄰域網格作為采樣窗口,以沒有重疊的方式遍布整張圖,從而對每個子區域內的每個像素點都提取LBP特征。
可以組建營銷團隊,講好朱家尖故事,圍繞故事展開AR內容設計,讓游客的行程更加有趣,在應用中充分考慮社交化,讓口碑傳播通過生動有趣的AR應用迅速且廣泛傳播。

(a) 原始LBP直方圖

(b) Uniform LBP直方圖圖4 某個火焰區域的原始LBP直方圖和Uniform LBP直方圖
由于對火焰圖像Gabor濾波后進行LBP特征提取得到了40×59即2 360維特征向量,向量維數太高,而且包含大量的冗余特征,不利于后期的分類識別。因此,本文引入CART決策樹來挑選出最具代表性的特征,降低特征向量的維度。CART決策樹運用AdaBoost算法的思想,即針對同一個訓練集訓練不同的弱學習算法,然后將這些弱學習算法集合起來,構造一個更強的最終學習算法。
本文以CART決策樹作為弱分類器,將200棵決策樹通過Adaboost思想進行集成,形成更加穩定的強分類器。根據強分類器訓練好的模型,可以得到2 360維特征對應的重要性因子。再將2 360維特征的重要性因子進行降序排列,最終選取特征重要性大于90%的前477維作為最終的特征向量。在合理的容錯率范圍內,將有效數據的維度降低。
本文采用SVM對火焰特征向量進行分類,核函數選用高斯徑向基函數[12]:
(8)
式中:xi是輸入特征向量,δ是核函數的參數。
實驗基于MATLAB R2017b編程環境,實驗火焰視頻素材包含室內、室外,火焰的背景靜止或運動等復雜場景。干擾視頻包含枯草、燃燒后的枯枝、濃煙、光照等。從每個不同場景的視頻中分別截取100幀圖片,隨機選取80幀圖片作為樣本集,剩余20幀圖片作為測試集。
為了驗證本文的有效性,通過三種算法的實驗來進行對比分析。在同一個實驗平臺下,相同的實驗數據,使用不同的特征提取和選擇方法,記錄下支持向量機的平均準確率作為本次實驗的準確率。
算法1采用本文方法,先基于顏色特征確定疑似火焰區域,再基于其Gabor濾波特征圖得到LBP特征向量,最后將2 360維特征向量經CART決策樹降維處理后傳入SVM進行訓練得出實驗結果。
算法2對2 360維特征向量經PCA降維處理,其余操作步驟同實驗1,記錄其實驗結果。
算法3對輸入圖像經過顏色特征確定疑似火焰區域,小區域分割后直接將其LBP特征向量傳入SVM進行訓練,記錄實驗結果。
兩個復雜場景的火焰視頻(一個視頻包含濃煙和大量燃燒的枯枝,另一個視頻包含枯草和光照)的實驗結果如圖5所示(第一行是原始火焰圖像,第二行是實驗1結果圖,第三行是實驗2結果圖,第四行是實驗3結果圖)。

圖5 兩個復雜場景的火焰視頻實驗結果圖
國內文獻常用來驗證的火焰視頻識別的算法的評價準則是檢測一個視頻中有多少火焰圖片被檢測出來,從而用準確率來進行評價,這種評價方式很粗略,無法說明一個火焰圖片中有多少前景像素沒有檢測出來,也無法說明有多少背景像素被錯誤地識別為前景。為了避免上述缺陷,本文用TPR和TNR從像素級來評價算法的性能[13]。
(9)
(10)
式中:TP是指正確識別出來的火焰像素數目,FN是指背景像素被錯誤地識別為火焰的像素數目,TN是指正確識別出來的背景像素數目,FP是把火焰像素錯誤地識別為背景的像素數目。三種算法的TPR和TNR實驗結果如圖6所示。

圖6 三種算法的TPR和TNR實驗結果對比
從圖6可以看出,本文提出的算法的TPR平均值為87%,由于本文研究的是包含大量干擾對象的復雜野外環境(如圖5),所以TPR值還是比較滿意的,TNR的值達到了98%,取得了很好的結果。與本文采用的CART決策樹相比,PCA的降維效果并不理想,這是因為PCA尋求的是能夠有效表達同一類樣本共同特點的主軸方向,當火災視頻中包含多種干擾對象時,PCA選擇的主元特征難以很好地區分多個樣本類。
本文提出了一種基于Gabor濾波和LBP的CART決策樹降維處理的火焰識別算法。為了更好地區分火焰圖像和的枯草、枯枝、光照等復雜場景的干擾對象圖像,采用了Gabor濾波和Uniform LBP提取疑似火焰的局部紋理特征向量;為了有效提取特征向量的關鍵信息的同時減少特征向量的維度、提高運算速度,采用了CART決策樹對紋理特征進行選擇。實驗結果表明,在復雜的環境中,本算法的檢測率高、適應性好,是一種高效的視頻火焰檢測算法。