謝林江,季桂樹,彭 清,羅恩韜
中南大學(xué) 信息科學(xué)與工程學(xué)院,長(zhǎng)沙 410083
行人檢測(cè)指的是判斷待處理圖像或者視頻幀中是否含有行人,如果有行人,給出標(biāo)注。它是機(jī)動(dòng)車輔助駕駛[1-3]、智能視頻監(jiān)控[4]、智能機(jī)器人以及人體行為分析[5-6]等應(yīng)用中的關(guān)鍵技術(shù),近些年來(lái)成功地應(yīng)用于直升機(jī)等飛行器拍攝的圖片中[7]以及在地質(zhì)災(zāi)害中的受困人員搜尋與營(yíng)救[8-9]等新興領(lǐng)域。但在實(shí)際應(yīng)用中行人圖像容易受到光照、穿著、姿態(tài)、遮擋以及拍攝角度的多樣性等影響,使得行人檢測(cè)成為計(jì)算機(jī)視覺(jué)領(lǐng)域的研究難點(diǎn)與熱點(diǎn)。目前,行人檢測(cè)的方法主要有傳統(tǒng)的檢測(cè)方法和基于神經(jīng)網(wǎng)絡(luò)的檢測(cè)方法。
傳統(tǒng)的檢測(cè)方法主要是通過(guò)圖像相鄰像素之間的關(guān)系來(lái)得到其特征表達(dá)。文獻(xiàn)[10]提出的梯度方向直方圖(histogram of oriented gradient,HOG)通過(guò)計(jì)算像素梯度方向直方圖來(lái)構(gòu)成特征。但是HOG特征的維度高,計(jì)算量大,難以滿足實(shí)時(shí)性的要求。文獻(xiàn)[11]利用積分圖技術(shù)來(lái)提高HOG特征的計(jì)算速度,但還是未能解決特征維度高的缺點(diǎn)。文獻(xiàn)[12]提出了局部二值模式(local binary pattern,LBP)算子,其根據(jù)每個(gè)像素點(diǎn)與周圍像素值大小比較進(jìn)行編碼,得到LBP特征圖譜,具有旋轉(zhuǎn)不變性和灰度不變性等顯著優(yōu)點(diǎn)。文獻(xiàn)[13]將LBP特征作為行人的特征描述子,同樣取得了較好的檢測(cè)效果。文獻(xiàn)[14]提出了模板匹配的方法,該方法雖然在檢測(cè)速度和檢測(cè)率上有所提高,但其需要人工標(biāo)注模板且存在泛化能力不強(qiáng)的缺點(diǎn)。
為了克服傳統(tǒng)方法……