周佳敏
(武漢理工大學,湖北 武漢 430070)
行人檢測在視頻監控、虛擬現實技術等領域有廣泛的應用,也是計算機視覺和模式識別領域的重要研究方向。由于行人姿態、服飾的差異性增加了行人檢測的難度。而人體的輪廓受這種因素的干擾較少,可以提供描述行人較為魯棒的特征。Dalal[1]等提出的梯度方向直方圖特征,利用局部邊緣梯度分布特征來表征行人,具有優良的檢測性能。
盡管HOG特征表現出優異的檢測性能,其特征向量的維數過高使得特征計算和在線檢測時間過長。本文提出結合行人頭部與腿部圖像區域作為感興趣區域進行檢測,精確識別出行人目標。
將一副待檢圖像分成N個單元,稱為”Cell”,由若干個單元可組合成一個塊,稱為”Block”,整幅圖像由一定數目的塊組成,塊與塊之間允許重疊。通過統計各個塊內各單元在各個方向上的梯度分布,即構成了該圖像的HOG特征,其計算過程如下。
采用梯度算子計算圖像的水平方向梯度和垂直方向梯度。
將梯度方向分為若干個子區間,對單元內每個像素點,以各像素點的梯度值為權重,對其梯度方向所屬子區間進行投票加權。
對梯度強度在塊內做歸一化[4]處理,可以減少局部光照以及前景、背景對比度的變化對直方圖特征的影響。HOG特征就是塊中所有單元的直方圖所組成的一個向量。
通過樣本圖像分析發現,行人腿部所在的圖像區域,背景通常是平坦的路面,并且腿部的輪廓邊緣具有明顯的垂直對稱性,其在某些梯度方向上會出現一定的峰值,其HOG特征與背景差別較大。因此,本文首先針對行人腿部采用HOG特征進行檢測。
由于行人腳與地面接觸,行人的腿部區域一般會出現在圖像的下半部分區域,因此本文主要對待檢圖像的下半部分進行掃描,具體檢測步驟如下:
1)獲取待檢圖像,并取圖像的下半部分區域作為行人腿部掃描區域;
2)按照大小為16*16個像素窗口遍歷待檢圖像,計算得到掃描區域內所有塊的HOG特征向量并存入一個14*39的二維數組中,數組中每個元素指向一個塊的36維HOG特征向量。
3)以大小為64*64,步長為8個像素的檢測窗口遍歷待檢圖像,此時不需獨立計算每個檢測窗口的HOG特征,只要對二維數組進行正確的索引找到該區域所對應塊的HOG特征向量。
4)加載訓練得到的腿部識別分類器,對檢測窗口進行判別。
經過分析可知,無論行人呈現出何種不同的姿態,行人頭部輪廓變動性很小,且呈現出一定的形狀,而且行人的頭部不易被遮擋,在檢測過程中很容易被檢測出來。因此本文采用模板匹配對頭部進行檢測。其檢測過程如下:
1)針對頭部輪廓構建一個“Ω”形位圖模板,將頭部輪廓模板與Sobel邊緣圖像做乘積,將分數計算的最大值視為符合頭部區域。
2)由于現實場景有復雜的背景[5]存在,對圖像進行邊緣檢測時可能會干擾模板匹配過程,采用Canny算子和形態學邊緣檢測算子融合的方法實現頭部邊緣檢測。
3)通過計算模板與待檢測窗口的距離變換圖像的Chamfer[3]距離來衡量兩者之間的相似程度,如果待匹配的圖像中沒有頭部,則求得的Chamfer距離通常會遠大于在圖像中有頭部的Chamfer距離。
在本文的行人檢測過程中,首先對腿部進行檢測并實現對腿部的初步定為,然后進一步使用模板匹配對候選行人頭部檢測,只有當頭部和腿部同時存在該區域中,才能認為所識別的目標為行人。
為了驗證部位組合檢測方法的有效性,本文對樣本集中的圖像進行了處理分析,主要比較了本文的部位組合算法與HOG算法在樣本集的檢測性能,其中HOG算法的檢測率為76.1%,本文部位組合算法檢測率達到了96.7%。
本文提出了一種基于部位組合特征的行人檢測方法,首先對腿部進行檢測,定位出候選行人區域,再根據頭部輪廓不易變動的特點,利用模板匹配的方法對行人頭部進一步檢測。實驗表明,本文的方法能夠有效地檢測出現實場景中的行人。
[1]蘇松志.行人檢測若干關鍵技術研究[D].廈門:廈門大學,2011.
[2]郭烈.利用腿部區域HOG特征的行人檢測方法[J].計算機工程與應用,2013,49(1):217-221.
[3]杜友田.基于視覺的人的運動識別綜述[J].電子學報,2007,35(1):84-90.
[4]黃茜.基于梯度向量直方圖的行人檢測[J].科學技術與工程,2009,9(13):3646-3651.
[5]潘鋒.基于支持向量機的復雜背景下的人體檢測[J].中國圖像圖像學報,2005,10(2):183-186.