(北京萬象國紀投資有限公司,北京 100029)
隨著城市汽車保有量的快速增長,有限的停車位已經不能滿足泊車的需求,二者之間的矛盾日益突出[1]。立體車庫將二維停車拓展為三維停車,使單位面積上的停車位成數倍增加,很好地提高了土地的利用率,有效緩解了城市停車難問題。而立體車庫使用中如何快速且準確地檢測出非法侵入的人員是值得關注和重點研究的問題。現有人體檢測算法主要可分為基于模板匹配的方法和基于機器學習的方法[2]。
對于檢測非剛性的人體,基于模板匹配的方法主要利用邊緣、紋理和灰度等信息構建可變形的模板進行匹配。根據匹配形式的不同又可分為整體匹配和局部匹配。文獻[3]提出了基于輪廓的整體匹配方法,需要構建不同人體姿勢的大量輪廓模板進行匹配。模板構建過程繁瑣,魯棒性不高,而且不容易包含所有的姿勢。文獻[4-5]提出了一種局部匹配方法,僅建立人體頭肩部位模型,通過匹配頭肩模板來檢測人體位置,很大程度上避免了人體非剛性的影響,也減少了模板個數,取得了較好的檢測效果。
基于機器學習方法提取能夠充分表征人體的特征,并研究有辨別力的分類器,通過學習的分類模型分類候選區域,以檢測是否為人體。其中,特征的選擇與分類器構造形式對最終檢測效果起著關鍵性作用[2]。相對于模板匹配方法,此類方法在復雜場景下對變姿態人體檢測有一定的魯捧性。最為常用特征是Dalai等[6]提出的梯度方向直方圖(Histograms of Oriented Gradient, HOG)特征,該特征在行人檢測中得到了較好的結果。Q. Zhu等[7]提出了變尺度的HOG持征,并構造級聯分類器進行人體檢測。文獻[8]串聯使用了HOG特征和局部二值模式(Local Binary Patterns, LBP)特征,有效地解決了人體部分遮擋問題。
目前,針對立體車庫的人體檢測研究相對較少。為滿足立體車庫安全監控的需求,本文提出了一種基于機器視覺的人體檢測方法。首先,采用自適應雙線性濾波方法以消除視頻幀中的噪聲。接著,差分視頻幀與背景圖像,并采用多尺度小波分析法將差分圖像進行二值化。然后,通過形態學濾波從二值圖像中檢測出非法侵入停車場的人體。最后,采用混合高斯模型算法更新背景模型。實驗證明提出方法得到了較高的人體檢測準確率,且實時性較好,能夠很好地滿足立體車庫安全監控的要求。
作為非線性濾波,雙邊濾波器可以理想地濾除視頻幀中的隨機噪聲。而且雙邊濾波既能降噪,同時又不會引起較強的模糊效應,可以較好地保留視頻幀的邊緣細節[9]。雙邊濾波器由兩個高斯函數構成,即空間和值域高斯函數。濾波時,視頻幀中與邊緣較遠的像素不會較大地影響邊緣像素,因此可以較好地保持邊緣特性[10]。雙邊濾波定義如式(1)所示:
(1)
式中,
(2)
其中:It(x,y)為時刻t采集的視頻幀It中的像素點;(x,y)為像素點坐標;Ft為濾波后得到的視頻幀;Gs是以距離作為自變量的高斯濾波函數,表示空間相似度,方差為σs;Gr是以像素灰度差值作為自變量的高斯濾波函數,表示像素相似度,方差為σr。圖1為不同σr取值情況下的濾波結果,其中濾波窗口半徑ω=3,σs=3。圖1(a)為立體車庫中攝像機拍攝的It,其余3圖分別為σr=5、σr=10和σr=15時的Ft。圖1(b)的濾波效果不明顯,圖1(d)圖像細節模糊。σr=10時的信噪比最大,濾波效果最好,如圖1(c)所示。
雙邊濾波器雖能較好地保證視頻幀邊緣細節不被模糊化,但依舊會在一定程度上改變邊緣像素點的灰度值。噪聲點處會存在灰度跳躍,從而使其局部區域灰度跨度較大,而邊緣像素點則不是,可以利用這個特性進行自適應的雙邊濾波。逐行掃描It,當處理像素點It(x,y)時,判斷It(x,y)濾波窗口內的像素點灰度方差是否大于經驗閾值T1。如果是,則進行濾波;如果不是,則跳過該像素。圖2為采用改進方法得到的濾波結果,圖2(a)、圖2(b)和圖(c)分別為σr=5、σr=10和σr=15時的Ft。通過對比發現,自適應方法能有效地濾除噪聲點,而幾乎不模糊邊緣細節。

圖1 雙邊濾波結果

圖2 改進的雙邊濾波結果
為了檢測出人體,首先要差分Ft與背景圖像Bt-1,如式(3)所示,得到差分灰度圖像Dt。然后對Dt進行二值化處理,如式(4)所示。
Dt=|Ft(x,y)-Bt-1(x,y)|
(3)
(4)
式中,At(x,y)為二值圖像,T2為二值化閾值。
閾值的自動和最佳選取是進行二值化處理中的關鍵。二值化閾值存在于灰度圖像直方圖的波谷處,但在波谷較多時難以確定,而且大小不一毛刺也會影響波谷的準確定位。本文采用多尺度小波分析方法在最佳級數上對灰度直方圖進行分解,選出幾個波谷點作為候選T2,然后利用最大類間方差法確定唯一的閾值點[11]。
信號f∈L2的小波變換[12]定義為式(5):

(5)
式中,a為尺度變量;τ為平移變量。式(5)所示的小波變換具有自動變焦的特點,可以通過變換尺度a來分析信號的特性:大的變化在大尺度a上觀察,小的變化在小尺度a上觀察[11]。
為了確定最佳尺度a,只需對Dt的直方圖做有限級分解的小波變換。分解級數不能太多,否則計算量會過大;分解級數也不能太低,否則受毛刺的影響,會含有“虛假波谷點”,影響候選T2的確定。根據實驗經驗,在256級灰度圖像中,分解級數選3-4級為宜[11]。
Dt直方圖中波谷的位置,即候選T2的位置,為小波變換的負極值點。根據文獻[13],在波谷自適應選取算法中選擇了奇對稱或偶對稱小波,以保證小波變換的負極值點與波谷點的對應。接著采用最大類間方差法來確定精確的T2。最大類間方差法[14]是基于最小二乘原理的全局搜索方法。本文只在候選T2處進行局部搜索,計算量可以大大降低。
根據式(4)使用閾值T2進行二值化,對二值圖像At進行開運算[15]和連通分量提取[16],并統計各連通分量的像素點數目。選擇像素點數目最多且大于經驗閾值T3的連通分量,可認為該連通分量在It中對應的區域包含人體目標。二值化圖像At如圖3所示。

圖3 二值化圖像Dt
常用的背景更新算法有多幀平均法[17]、混合高斯模型[18]法和Surendra法[19]等等。混合高斯模型法更新背景的精確度高于多幀平均法和Surendra法。因此,本文采用混合高斯模型法。混合高斯模型法可平滑地近似任意形狀的密度分布,即能克服背景模型復雜的場景[20]。
將背景圖像Bt-1中的每個像素點Bt-1(x,y)都建立起數量為N的高斯模型函數,N值越大能模擬的場景就越復雜,但計算量也隨之增大。N取值一般在3~5的范圍呢。Bt-1(x,y)灰度值的混合高斯概率和高斯分布函數如式(6)所示:
(6)


初始化得到I1的混合高斯模型后,當前幀It-1的各像素點It-1(x,y)分別與I1(x,y)的N個高斯分布依次進行匹配,匹配條件為:
(7)
其中:D為系數,2.5≤D≤3.5。若滿足式(7),則It-1(x,y)與第n個高斯分布相匹配,此時It-1(x,y)為背景點,需根據式(8)對高斯分布函數的參數進行更新:
(8)
(9)
(10)
式中,T4為背景所占比例。
根據經驗,實驗中參數設置為:濾波窗口半徑ω=3;方差σs=3和σr=10;背景更新尺度α=0.02,閾值T1=1.5,T3=20,T4=0.8;D=3。
為了驗證提出方法的準確性,對從立體車庫監控系統采集的5段監控視頻進行檢測,每段視頻60 s,幀率為24 f/s,分辨率384×640。這5段監控視頻都包含1 440幀圖像,共計7 200幀圖像,其中6 693幀包含人體目標。提出算法和文獻[21]方法在上述5段視頻上的檢測準確度進行了對比,結果如表1所示。通過對比可以發現,提出方法在所有視頻幀中的平均準確率為98.6%,高于文獻[21]的平均準確率97.9%。提出方法的準確率滿足立體車庫安全監控的需要。

表1 立體車庫內人體檢測的準確率對比
為了進一步驗證提出算法的實時性,本實驗在上述5段視頻上,將提出算法與文獻[21]方法進行了對比。實驗所用的計算機配置為:Windows10、CPU Intel?CoreTMi7-4700MQ、 2.4 GHz、RAM 8 GB。采用的開發軟件為Matlab R2012b。實驗結果如表2所示,提出方法可以較好地縮短檢測時間,每幀的平均檢測時間為55.5 ms,比文獻[21]方法的每幀平均檢測時間縮短了26.2 ms。提出方法的檢測效率能夠滿足立體車庫實時安全監控的要求。

表2 算法實時性對比
本文提出了一種可用于準確與實時檢測非法入侵人體的圖像識別方法。采用自適應雙線性濾波方法降低視頻幀中噪聲的影響。采用多尺度小波分析法二值化視頻幀與背景圖像的差分圖像。人體從二值圖像中通過形態學濾波檢測出來。背景圖像在每一幀檢測完人體后都利用GMM方法進行更新。通過實驗可知, 提出算法可以實時和準確地從立體車庫中檢測人體,滿足立體車庫安全監控的需求。