謝 敏
(南京郵電大學 通達學院,江蘇 揚州225000)
行人檢測是計算機視覺領域的重要研究課題[1-2],應用于人工智能系統、智能車輛駕駛系統等領域。存在視頻環境復雜,天氣、光照強度和角度都有變化;人體紋理信息和形態的多樣化等干擾因素,使得圖像特征信息檢測的速度慢、識別率低。行人的特征提取大多采用滑動窗口全局搜索的方法,因此滑動窗口的數量和圖像大小成正比。檢測過程中大部分窗口不含有檢測目標,所以減少窗口數量可以減少無效的檢測,進而提高檢測效率[3-7]。本文提出利用混合高斯模型對視頻中運動目標進行檢測,對運動區域進行梯度直方圖的特征提取,大大減少了特征提取的區域范圍,從而提高了檢測效率。
行人檢測易受特征描述子的維度和待檢測圖片大小等因素的影響,維度越高、視頻圖片越大都會造成檢測時間變長。行人的狀態是移動的,因此利用運動目標進行檢測,檢測出視頻中的運動區域[8-10]。對運動區域提取特征,大幅減小了特征檢測區域,從而減少檢測時間,提高檢測效率。
混合高斯模型常應用于復雜場景下的背景建模,因其能適應背景的變化,所以優于其他傳統模型。本文使用自適應混合高斯建模(GMM),對于隨機變量X的觀測數據集(x1,x2,…,xN),xt=(rt,gt,bt)為t時刻像素的樣本,則單個采樣點xt的高斯分布概率密度函數:

在高斯混合模型中,視頻中光強度隨時間的改變發生動態改變,因此背景圖像需要不斷地更新。
在視頻中,行人運動速度緩慢,在路口需要等待較長時間,所以傳統的高斯模型很難檢測出運動速度緩慢或者靜止的前景。根據行人運動的特點對高斯模型進行了改進,通過系數控制前景融入背景的時間,減少前景成為背景的可能性。
如果行人p在場景中的停留時間tp足夠長,滿足tp>ts,其中,wp,ts=1-T,則:
wp,tp>1-T,p≤k,
即:
此時,靜止的行人p進入背景模型,所有把權值的均值也作為前景分割的條件,
wk,t=(1-λ)wk,t-1+λ(wk,t),
式中,wk,t為權值的均值,表示每個高斯模型的權值在時間上的均值;λ為學習率。
更新檢測區域范圍,調整區域范圍為方向梯度直方圖(Histogram of Oriented Gradient,HOG)檢測窗口大小,尤其是前景的邊緣,容易出現漏檢的情況,對候選區進行提取HOG。
HOG的思想是:圖像中梯度和邊緣的方向密度分布可以較好地描述局部目標的表像和形狀[11-15]。因而可以對候選區進行提取HOG,再結合SVM分類器,對行人做檢測。HOG特征提取流程如圖1所示。

圖1 HOG特征提取流程
顏色空間標準化:顏色空間標準化是為了能夠減小光照的影響;調節圖像的對比度,來減小局部的陰影和光照變化的影響;由于顏色信息對特征提取的貢獻很小[16-19],通常轉換成灰度圖,即:
Gray=0.3×R+0.59×G+0.11×B,Gamma壓縮公式:
Y(x,y)=I(x,y)γ,通常γ=0.5。
計算目標區域中每個像素的梯度(包括梯度大小和方向),獲得輪廓信息,減小光照的干擾。
圖像中像素點(x,y)的梯度為:
Gx(x,y)=H(x+1,y)-H(x-1,y),
Gy(x,y)=H(x,y+1)-H(x,y-1),
式中,Gx(x,y),Gy(x,y),H(x,y)分別是像素點(x,y)處的水平方向梯度、垂直方向梯度和像素值。
像素點(x,y)處的梯度幅值和方向分別為:
將目標區域劃分成小單元,并計算出每個單元的梯度直方圖。為局部圖像區域提供一個編碼,并減弱行人的姿勢和外觀的敏感性。
把每個單元組合成較大的塊(Block)。串聯塊內所有單元的特征,得到這個塊的HOG特征。歸一化梯度強度,進一步地減少光照、陰影和邊緣的影響。
將所有Block的HOG特征依次串聯,得到該目標的HOG特征。
本算法采用VS2019和OpenCV實現。算法流程如圖2所示。

圖2 算法流程
本算法檢測到的行人用綠色框標記如圖3所示。

圖3 行人檢測結果
本文算法基本能檢測出視頻中的行人,邊緣剛進入的行人有漏檢的情況,但當行人完全進入畫面時依然可以檢測到。檢測結果對比如表1所示。

表1 檢測結果對比
通過實驗表明:本文算法提高了檢測效率,對于錯檢率也有所降低,HOG+SVM檢測速度約10幀每秒,本文算法檢測速度約25~30幀每秒,檢測效率增加,基本能夠滿足實時性的要求。
針對智能監控中行人檢測實時性問題,提出了一種利用高斯混合模型進行前景檢測來減少HOG特征提取的計算量。該方法先對視頻圖像進行高斯背景建模,提取運動區域后,由于行人運動速度緩慢或保持靜止,所以改進高斯混合模型背景更新的時間,以保證可以檢測到運動緩慢或靜止的行人。通過混合高斯模型檢測出候選區域,調整候選區域的尺寸為HOG檢測窗口大小,提取HOG特征,從而減少了HOG特征提取的計算量,檢測速度和效率有所提高。實驗結果顯示,采用混合高斯模型來減少特征提取窗口的方法有較好的行人檢測效果,實時性好,基本可應用于實時檢測的場合。