紀(jì)冕 張欣 徐海



摘 ?要: 本文首先研究了行人檢測(cè)的方法和面臨的難點(diǎn),然后根據(jù)高斯平滑濾波器和雙線性插值法對(duì)傳統(tǒng)方向梯度直方圖做了改進(jìn),并搭建了支持向量機(jī)模型,從而構(gòu)建了基于改進(jìn)HOG特征和SVM分類器的行人檢測(cè)系統(tǒng)。實(shí)驗(yàn)結(jié)果顯示,在明亮且無遮擋的場(chǎng)景下,矩形框精確地定位行人,在光照不足或存在輕微遮擋時(shí)可以大體定位到行人,表明該系統(tǒng)在明亮無遮擋的情況下有準(zhǔn)確的結(jié)果,并且在昏暗和輕度遮擋下檢測(cè)效果良好,最后通過對(duì)比可以得出,本文提出的方法總體效果優(yōu)于傳統(tǒng)HOG特征和SVM分類器的方法。
關(guān)鍵詞:?行人檢測(cè);HOG特征;SVM分類器;跟蹤算法;梯度;最佳分類表面
中圖分類號(hào): TP391.41????文獻(xiàn)標(biāo)識(shí)碼:?A????DOI:10.3969/j.issn.1003-6970.2020.02.015
【Abstract】: This paper first studies the pedestrian detection method and the difficulties it faces, then improves the traditional direction gradient histogram according to Gaussian smoothing filter and bilinear interpolation method, and builds the support vector machine model to construct the improved HOG feature. And the pedestrian detection system of the SVM classifier. The experimental results show that in a bright and unobstructed scene, the rectangular frame accurately locates the pedestrian, and when the brightness is not bright enough or there is slight occlusion, the pedestrian can be generally positioned, indicating that the system has accurate results in the case of bright unobstructed, and The detection effect is good under dim and light occlusion. It can be concluded that the overall effect of the proposed method is better than the traditional HOG feature and SVM classifier.
【Key words】: Pedestrian detection;?HOG features;?SVM classifier;?Tracking algorithm;?Gradient;?Optimum classification surface
0??引言
行人檢測(cè)是一項(xiàng)具有挑戰(zhàn)性的任務(wù),近年來的應(yīng)用引起了很多關(guān)注,它的研究成果可應(yīng)用于視頻分析[1],智能視頻監(jiān)控[2],人機(jī)交互[3],作為道路交通檢測(cè)的一部分[4],行人檢測(cè)面臨的主要問題有復(fù)雜多樣的背景環(huán)境、行人與攝像機(jī)之間動(dòng)態(tài)變化的場(chǎng)景、系統(tǒng)實(shí)時(shí)性與穩(wěn)定性的嚴(yán)格要求等[5]。?????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????? 作為一種非網(wǎng)格體,行人有許多姿勢(shì),可能出現(xiàn)在不同的道路場(chǎng)景中,穿有各種顏色和圖案的衣服,行人通常走在復(fù)雜的背景中,從圖像到圖像有不同的顏色和光照,只有部分行人可見是處理的另一個(gè)難題。這些條件使我們的工作非常復(fù)雜,也非常具有挑戰(zhàn)性。
在對(duì)目標(biāo)進(jìn)行跟蹤時(shí),很多因素會(huì)對(duì)跟蹤算法的效果造成影響,如光照強(qiáng)弱、目標(biāo)有無遮擋、目標(biāo)運(yùn)動(dòng)速度較快、復(fù)雜或者模糊的背景的干擾等。尤其是在實(shí)際的應(yīng)用環(huán)境中,采用視覺對(duì)目標(biāo)進(jìn)行跟蹤依然面臨著很多復(fù)雜的因素的干擾,這些因素疊加在一起對(duì)目標(biāo)識(shí)別的穩(wěn)定性產(chǎn)生了極大的影響[6],目前已有的跟蹤算法尚不能適應(yīng)各種各樣復(fù)雜的環(huán)境[7]。
文獻(xiàn)[8]是基于傳統(tǒng)HOG和SVM展開的研究,當(dāng)樣本中行人數(shù)量很少時(shí),檢測(cè)結(jié)果較為準(zhǔn)確,但行人數(shù)量增多后實(shí)驗(yàn)效果不佳,另外,光線明暗與遮擋部分的多少對(duì)結(jié)果的影響很大。文獻(xiàn)[9]將傳統(tǒng)HOG特征改進(jìn)為MultiHOG,提取了行人的輪廓特征, 從而有效地減小了冗余特征的影響,但對(duì)遠(yuǎn)處的行人漏檢率偏高,而且容易將其它物體錯(cuò)誤地識(shí)別成行人。本文同樣對(duì)HOG特征進(jìn)行改進(jìn),采用的是高斯平滑濾波器和雙線性插值法,這樣可以更好地提取行人的HOG特征,得到更準(zhǔn)確的實(shí)驗(yàn)結(jié)果。
1??傳統(tǒng)HOG特征提取
方向梯度直方圖(Histogram Oriented Gradient)的基本特征是梯度直方圖的統(tǒng)計(jì)[10]。HOG描述符先將圖像劃分為小區(qū)域單元,然后捕獲每個(gè)像素點(diǎn)的梯度直方圖單元,最后把該直方圖組合起來構(gòu)成HOG特征描述符。HOG描述符具有獨(dú)特的優(yōu)點(diǎn):它不僅可以捕獲邊緣或梯度結(jié)構(gòu),還可以捕獲對(duì)局部幾何和光學(xué)變換不敏感的特征。它與行人檢測(cè)的聯(lián)系十分緊密[11],傳統(tǒng)的HOG特征提取過程如下所述:
1.2??塊和單元格
局部歸一化需要將單元組合在一起形成更大的空間連接塊。然后,HOG描述符是來自所有塊區(qū)域的歸一化小區(qū)直方圖分量的矢量。這些塊通常重疊,這意味著每個(gè)單元對(duì)最終描述符貢獻(xiàn)不止一次。塊幾何形狀是矩形RHOG塊。每塊的單元數(shù)是2×2,每單元的通道數(shù)是9,每單元的像素?cái)?shù)是:![]()
。
1.3??梯度方向直方圖特征
每個(gè)單元格中的每個(gè)像素統(tǒng)計(jì)梯度方向從而得到直方圖,直方圖x軸是方向直方圖通道,y軸是梯度值的總和對(duì)應(yīng)的方向。最后我們可以得到一個(gè)特征向量。HOG特征提取算法步驟如下圖所示。
SVM的主要思想可歸納為兩點(diǎn):
(1)旨在分析線性可分的情況。在線性不可分的情況下,利用非線性映射算法將低維輸入空間不可分線性樣本轉(zhuǎn)化為高維特征空間可分線性樣本。
(2)基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化理論。構(gòu)造特征空間中的最優(yōu)超平面分割,使學(xué)習(xí)編輯得到全局最優(yōu)解,并使樣本空間的期望風(fēng)險(xiǎn)滿足在一定概率上界的要求。

圖3 ?支持向量與間隔
Fig.3 ?Support vector and interval
選擇不同的核函數(shù),可以生成不同的SVM[13],以下是四個(gè)基本內(nèi)核:
(1)線性:![]()
(2)多項(xiàng)式:![]()
(3)徑向基函數(shù)(RBF):![]()
![]()
(4)二層神經(jīng)網(wǎng)絡(luò):![]()
4??實(shí)驗(yàn)步驟和流程
本文的實(shí)驗(yàn)步驟為:先將從數(shù)據(jù)庫收集的合適樣本用本文提出的改進(jìn)HOG算法提取對(duì)象特征,然后將提取的特征放入SVM進(jìn)行分類訓(xùn)練,最后輸入待檢測(cè)圖像,查看實(shí)驗(yàn)結(jié)果。
本文的SVM訓(xùn)練模型如下。
本文系統(tǒng)的實(shí)驗(yàn)環(huán)境為MATLAB R2016a,實(shí)驗(yàn)結(jié)果如圖6所示。本文訓(xùn)練樣本圖像和測(cè)試樣本圖像中的行人數(shù)量有一到多個(gè),所有樣本的像素都是64×128,訓(xùn)練過程耗時(shí)6 min左右,得到的行人檢測(cè)模型準(zhǔn)確率達(dá)92%以上。
從實(shí)驗(yàn)結(jié)果可以看到,在明亮且無遮擋的場(chǎng)景下,文獻(xiàn)[8]和本文都能清晰、準(zhǔn)確地鎖定行人。在光線不足的情況下,文獻(xiàn)[8]出現(xiàn)漏檢,而本文的結(jié)果不存在漏檢,只是沒有把所有行人單獨(dú)檢測(cè)出來,存在個(gè)別“一框定兩人”的現(xiàn)象,對(duì)比可以得到,昏暗場(chǎng)景下,本文方法更好。
為了對(duì)輕度遮擋場(chǎng)景下兩種方法的效果進(jìn)行更直觀的比較,對(duì)同一張彩色圖像分別進(jìn)行實(shí)驗(yàn),結(jié)果如下。
對(duì)第一幅圖像的這兩個(gè)結(jié)果比較可知,本文方法可以檢測(cè)出文獻(xiàn)[8]無法檢測(cè)到的遠(yuǎn)處的行人。在第二幅圖像中,本文提出的方法能檢測(cè)到文獻(xiàn)[8]漏檢的人,并且將文獻(xiàn)[8]用一個(gè)框定位的兩個(gè)人分別檢測(cè)出來。由此可見,本文的基于改進(jìn)HOG特征和SVM分類器的行人檢測(cè)方法比文獻(xiàn)[8]識(shí)別率更高。
5??結(jié)論
本文主要通過方向梯度直方圖和支持向量機(jī)對(duì)行人檢測(cè)進(jìn)行了研究,分析了目前面臨的問題并介紹了行人檢測(cè)的研究方法,用高斯平滑濾波器和雙線性插值法對(duì)傳統(tǒng)的HOG做了改進(jìn),而且搭建了SVM模型,根據(jù)算法訓(xùn)練了一個(gè)改進(jìn)HOG特征和SVM分類器相結(jié)合的行人檢測(cè)模型,該模型對(duì)兩種屬性(明亮和昏暗,無遮擋和輕度遮擋)變化下行人檢測(cè)的效果通過實(shí)驗(yàn)得到了驗(yàn)證,經(jīng)過對(duì)比得出,本文提出的方法比文獻(xiàn)[8]的有效性更高。在光線不足的條件下,本文方法對(duì)行人的識(shí)別率明顯低于光線良好的情況,且有極小的可能誤檢測(cè)出非行人,在今后的研究中,重點(diǎn)在于提高昏暗場(chǎng)景下行人檢測(cè)的準(zhǔn)確率。
參考文獻(xiàn)
張闖, 張海濤, 李文生. 異構(gòu)視頻監(jiān)控系統(tǒng)媒體資源共享與發(fā)現(xiàn)機(jī)制研究[J]. 軟件, 2015, 36(12): 16-21.
張明軍, 俞文靜, 袁志, 黃志金. 視頻中目標(biāo)檢測(cè)算法研究[J]. 軟件, 2016, 37(04): 40-45.
Siddharth S. Rautaray, Anupam Agrawal. Vision based hand gesture recognition for human computer interaction: a survey[J]. Artificial Intelligence Review, 2015, 43(1).
厲雙華. 道路交通檢測(cè)系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)[J]. 軟件, 2015, 36(12): 206-208.
閆江南, 楊帥, 崔育帥. 基于視頻分析的公交客流統(tǒng)計(jì)系統(tǒng)的研究[J]. 軟件, 2018, 39(06): 155-159.
鄭茂凱. 運(yùn)動(dòng)目標(biāo)識(shí)別與跟蹤方法的研究[D]. 沈陽工業(yè)大學(xué), 2019.
李盈盈, 李菲菲. 基于改進(jìn)HOG共生概率特征的行人檢測(cè)算法[J]. 電子科技, 2018, 31(09): 4-8.
岳鑫. 基于HOG特征和SVM分類器的行人檢測(cè)研究[J]. 科技創(chuàng)新與應(yīng)用, 2016(05): 62-63.
田仙仙, 鮑泓, 徐成. 一種改進(jìn)HOG特征的行人檢測(cè)算法[J]. 計(jì)算機(jī)科學(xué), 2014, 41(09): 320-324.
Dandan Wang, Tongei Lu, Yanduo Zhang. HOG pedestrian detection based on edge symmetry and trilinear interpolation[P].?International Symposium on Multispectral Image Processing and Pattern Recognition, 2018.
高琦煜. 多卷積特征融合HOG行人檢測(cè)算法[J]. 計(jì)算機(jī)科學(xué), 2017, 44(S2): 199-201+232.
王宏濤, 孫劍偉. 基于BP神經(jīng)網(wǎng)絡(luò)和SVM的分類方法研究[J]. 軟件, 2015, 36(11): 96-99.
Guangyuan Zhang, Fei Gao, Cong Liu, Wei Liu, Huai Yuan. A pedestrian detection method based on SVM classifier and optimized Histograms of Oriented Gradients feature[P]. Natural Computation (ICNC), 2010 Sixth International Conference on, 2010.
![]()