晏 棟,孫作雷,張 倉(cāng),黃冠明
(上海海事大學(xué) 上海201306)
基于ACF算法的行人檢測(cè)研究
晏 棟,孫作雷,張 倉(cāng),黃冠明
(上海海事大學(xué) 上海201306)
近年來(lái),關(guān)于行人檢測(cè)領(lǐng)域的研究,人們提出了各種各樣的方法。其中,多樣化的特征和高效的分類(lèi)器是這些研究的關(guān)鍵,本文就是在這兩個(gè)方面找到一種更高效的方法來(lái)提高性能。我們的行人檢測(cè)方法是將3種特征關(guān)聯(lián)在一起,包括負(fù)特征(objectness features)、突出特征(salient feature)和邊緣特征(edgebox feature)。與此同時(shí),我們改進(jìn)分類(lèi)器的架構(gòu)以提升性能。通過(guò)Caltech-USA和INRIA這兩個(gè)數(shù)據(jù)庫(kù)對(duì)模型進(jìn)行訓(xùn)練,相比于一般的檢測(cè)模型,我們的準(zhǔn)確率提高了20%。
行人檢測(cè);關(guān)聯(lián)特征;邊緣特征;突出特征;分類(lèi)器
行人檢測(cè)如今已經(jīng)應(yīng)用到生活的多個(gè)領(lǐng)域,如智能監(jiān)控、無(wú)人駕駛和智能相機(jī)等。自hog提出行人檢測(cè)這一思想,到如今已經(jīng)有約有數(shù)千種方法。現(xiàn)有的行人檢測(cè)方法大致可以分成三大類(lèi):DPM變體、深度網(wǎng)絡(luò)和決策森林。Felzenszwalb提出了dpm算法,這是一個(gè)強(qiáng)大的目標(biāo)檢測(cè)模型,并且巧妙的利用在行人檢測(cè)領(lǐng)域。以前的神經(jīng)網(wǎng)絡(luò)更加關(guān)注與對(duì)行人的檢測(cè)。基于決策森林的算法能夠快速的確定各種合理的特征,以確保探測(cè)的質(zhì)量和速度,本文提出的方法也屬于這一類(lèi)[1-4]。
在計(jì)算機(jī)識(shí)別領(lǐng)域,行人檢測(cè)一直是一個(gè)熱門(mén)研究課題,特別是2005年以后進(jìn)入了一個(gè)快速發(fā)展的時(shí)期,數(shù)據(jù)庫(kù)訓(xùn)練變得更大、更復(fù)雜,它要求探測(cè)器具有更高的精度和處理速度。Dalal和Triggs研究了目標(biāo)檢測(cè)的特征集,然后他們發(fā)現(xiàn)HOG的優(yōu)勢(shì)在于對(duì)特征邊緣和梯度的描述,以及提出了一種新的SVM算法,用麻省理工的行人數(shù)據(jù)庫(kù)檢測(cè)有很好的效果。Dollar Petal介紹了加州理工學(xué)院的行人數(shù)據(jù)庫(kù),并提出了一種基于VJ ICF方法的算法框架[5-6]。在之前的基礎(chǔ)上,他提出一種acf檢測(cè)體系,并且用Caltech-USA數(shù)據(jù)庫(kù)獲得了很好的效果[7-8]。
一般的,比較他們的性能都是在特定的數(shù)據(jù)庫(kù)上,而沒(méi)有關(guān)注探測(cè)器的泛化能力,特別是當(dāng)訓(xùn)練樣本和測(cè)試樣本有密切相關(guān)性的時(shí)候會(huì)有偏差。如果真的希望高質(zhì)量的算法能夠應(yīng)用到實(shí)際的生活中,泛化能力應(yīng)該是一個(gè)重要的評(píng)價(jià)標(biāo)準(zhǔn)[9-12]。
文中的主要結(jié)果是一個(gè)新穎的行人檢測(cè)器,這是一個(gè)ACF檢測(cè)架構(gòu)的擴(kuò)展。我們將特殊的特征和邊緣特征加進(jìn)ACF的架構(gòu),通過(guò)級(jí)聯(lián)的自適應(yīng)閾值和分類(lèi)器結(jié)構(gòu)級(jí)聯(lián)校準(zhǔn)。
通過(guò)考慮性能、速度以及可擴(kuò)展性,我們選擇ACF算法作為標(biāo)準(zhǔn)。對(duì)于一個(gè)輸入圖像,ACF架構(gòu)10頻道計(jì)算給定的圖像,包括梯度和顏色,歸一化梯度的大小,然后把在不同通道的像素整合在一起。特征在聚合的通道中是通過(guò)單個(gè)的像素查找。整個(gè)框架采用特征金字塔加快檢測(cè)過(guò)程,探測(cè)器由2018的二叉樹(shù)組成[13-14]。
良好的特征可以很好的提高對(duì)象探測(cè)器的泛化能力,特別是當(dāng)探測(cè)器更多的探測(cè)不同的目標(biāo)的時(shí)候。Dollar P利用邊界信息生成邊界框,用1000個(gè)測(cè)試樣本達(dá)到的準(zhǔn)確率有96%以上,目標(biāo)的重疊閾值為0.5[5]。考慮到這種優(yōu)秀的性能,在畫(huà)EdgeBox的時(shí)候思考自己的檢測(cè)體系結(jié)構(gòu),結(jié)合我們的優(yōu)化分類(lèi)器,組成自己的探測(cè)器。與此同時(shí),我們將edgebox特性和邊緣信息梯度大小進(jìn)行歸一化處理。實(shí)驗(yàn)表明這種新的探測(cè)器比傳統(tǒng)的ACF探測(cè)器更加準(zhǔn)確,如圖1所示。

圖1 ACF算法edgebox邊緣檢測(cè)示意圖
盡管離散演算法取得了不錯(cuò)的性能,我們?nèi)匀辉噲D用更好的方法。在這里我們選擇真正演算法[15-16]作為基礎(chǔ)結(jié)構(gòu),修改迭代規(guī)則的參數(shù),我們的新算法可以做如下描述:
輸入:N 個(gè)訓(xùn)練樣本(xi,yi),xi是輸入向量,yi決定了輸出。
輸出:A函數(shù)H(x)可以對(duì)屬性向量x進(jìn)行分類(lèi)。
迭代:分類(lèi)器的數(shù)量 T,t=1,2,…,T 計(jì)算 ht,gt以及更新的概率P1,…,PN:
1)選擇一個(gè)小的樣本St進(jìn)行訓(xùn)練,第i個(gè)樣本的概率為pi。
2)分類(lèi)器的計(jì)算公式為:

4)更新概率

在訓(xùn)練分類(lèi)器的過(guò)程中,我們使用兩個(gè)參數(shù)來(lái)調(diào)整閾值:cascThr (constant cascade threshold) and cascCal(cascade calibration),過(guò)度的閾值和校準(zhǔn)將嚴(yán)重影響精度和處理速度。通過(guò)實(shí)驗(yàn)比較,我們發(fā)現(xiàn)行人檢測(cè)時(shí)給cascThr和cascCal分配不同的權(quán)重對(duì)結(jié)果有很大的影響如圖2所示。閾值偏大時(shí),檢測(cè)過(guò)程中可能會(huì)漏檢;偏小時(shí),會(huì)產(chǎn)生錯(cuò)誤的檢測(cè)。

圖2 不同閾值下的準(zhǔn)確率
一般來(lái)說(shuō),增大cascThr的權(quán)重可以增大檢測(cè)的準(zhǔn)確率,但是速度會(huì)慢很多。因此,適當(dāng)?shù)臋?quán)重分配對(duì)性能的提高可以做出很大的貢獻(xiàn)。與此同時(shí),在我們的實(shí)際試驗(yàn)中,兩個(gè)數(shù)據(jù)庫(kù)關(guān)聯(lián)后的最優(yōu)值和數(shù)據(jù)分開(kāi)的性能有很大區(qū)別。我們進(jìn)一步分析這些差異,發(fā)現(xiàn)最根本的原因是內(nèi)部參數(shù)值和圖像之間的關(guān)系特征。基于基于這一發(fā)現(xiàn),我們使用自適應(yīng)閾值的檢測(cè)結(jié)構(gòu),根據(jù)不同的條件調(diào)整閾值。
為了能夠比較合理的與其他方法的結(jié)果進(jìn)行比較,我們用Caltech-USA數(shù)據(jù)庫(kù)中的樣本對(duì)SalientACF和EdgeBoxACF進(jìn)行測(cè)試。為了將我們的探測(cè)器和基線(xiàn)探測(cè)器作比較,我們用INRIA數(shù)據(jù)庫(kù)對(duì)SalientACF和EdgeBoxACF進(jìn)行測(cè)試。結(jié)果顯示探測(cè)器的泛化能力顯著提高,特別是Edge-BoxACF性能提高的更加明顯。為了更加直觀的反映模型的檢測(cè)性能,我們挑選了3種不同環(huán)境下的行人作為樣本來(lái)測(cè)試。圖3表示不同環(huán)境下的檢測(cè)效果。圖(a)所示,當(dāng)行人的特征比較明顯且人與人之間沒(méi)有大面積的遮擋時(shí),模型檢測(cè)的準(zhǔn)確率可以達(dá)到100%;圖(b)所示,當(dāng)行人樣本與樣本之間有大部分覆蓋時(shí),我們的模型也可以通過(guò)突出的特征來(lái)進(jìn)行精確的檢測(cè),準(zhǔn)確率可以達(dá)到90%;圖(c)所示,當(dāng)行人處于比較廣闊的環(huán)境中時(shí),由于距離相機(jī)較遠(yuǎn),難以獲得樣本的突出特征,這就使得檢測(cè)的速度和準(zhǔn)確度大打折扣,但是我們的模型可以憑借其強(qiáng)大的泛化能力和突出的檢測(cè)效率快速作出判斷,準(zhǔn)確率約為90%。

圖3 不同環(huán)境下的測(cè)試效果
實(shí)驗(yàn)表明,基于ACF行人檢測(cè)算法用大量的樣本進(jìn)行訓(xùn)練,得到的模型具有極強(qiáng)的泛化能力,不管是在較小的環(huán)境中還是在比較大的環(huán)境中都能夠精確的檢測(cè),而且經(jīng)過(guò)對(duì)分類(lèi)器架構(gòu)的優(yōu)化,使得檢測(cè)的速度大大的增加,檢測(cè)一幀圖片的時(shí)間約為0.5秒,這就為實(shí)時(shí)的行人檢測(cè)提供了可能。
為了能夠提高探測(cè)器的泛化能力,我們用兩種方式來(lái)提取特征,用兩個(gè)數(shù)據(jù)庫(kù)INRIA和Caltech-USA的樣本對(duì)探測(cè)器進(jìn)行訓(xùn)練,取得了良好的實(shí)驗(yàn)結(jié)果。特別是當(dāng)環(huán)境中人比較多、環(huán)境比較復(fù)雜時(shí),相比于基線(xiàn)探測(cè)器我們準(zhǔn)確率要更高。在未來(lái)的研究工作中,我們會(huì)將更多的精力放在提升算法的運(yùn)算速度上,在保證準(zhǔn)確率的前提下,提高檢測(cè)速度,實(shí)現(xiàn)行人的實(shí)時(shí)檢測(cè)。
[1]Benenson,Rodrigo,et al."Pedestrian detection at 100 frames per second."Computer Vision and Pattern Recognition (CVPR) [C]//2012 IEEE Conference on.IEEE,2012.
[2]Sermanet,Pierre,et al.Pedestrian detection with unsupervised multi-stage feature learning[C].Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition.2013.
[3]Ouyang,Wanli,Xiaogang Wang.Joint deep learning for pedestrian detection[C]//Proceedings of the IEEE International Conference on Computer Vision.2013.
[4] Benenson, Rodrigo.Ten years of pedestrian detection,what have we learned[C]//European Conference on Computer Vision. Springer International Publishing,2014.
[5]Dollár,Piotr,Ron Appel,and Wolf Kienzle.Crosstalk cascadesforframe-rate pedestrian detection[J].Computer Vision-ECCV 2012.Springer Berlin Heidelberg,2012:645-659.
[6]Dollar,Piotr.Pedestrian detection:An evaluation of the state of the art[J].IEEE transactions on pattern analysis and machine intelligence 34(4),2012:743-761.
[4]Benenson,Rodrigo.Ten years of pedestrian detection,what have we learned[C]//European Conference on Computer Vision.Springer International Publishing,2014.
[7]李娟,邵春福,楊勵(lì)雅.基于混合高斯模型的行人檢測(cè)方法[J].吉林大學(xué)學(xué)報(bào):工學(xué)版,2011,41(1):41-45.
[8]種衍文,匡湖林,李清泉.一種基于多特征和機(jī)器學(xué)習(xí)的分級(jí)行人檢測(cè)方法[J].自動(dòng)化學(xué)報(bào),2012,38(3):375-381.
[9]姚雪琴,李曉華,周激流.基于邊緣對(duì)稱(chēng)性和 HOG的行人檢測(cè)方法[J].計(jì)算機(jī)工程,2012,38(5):179-182.
[10]孫銳,陳軍,高雋.基于顯著性檢測(cè)與 HOG-NMF特征的快速行人檢測(cè)方法[J].電子與信息學(xué)報(bào),2013,35(8):1921-1926.
[11]付洋,宋煥生,陳艷,等.一種基于視頻的道路行人檢測(cè)方法[J].電視技術(shù),2012,36(13):140-144.
[12]YAN,Jun-jie.Robust multi-resolution pedestrian detection in traffic scenes[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition.2013.
[13]Ouyang,Wanli,Xiaogang Wang.Single-pedestrian detection aided by multi-pedestrian detection[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,2013.
[14]Luo,Ping.Switchable deep network for pedestrian detection[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,2014.
[15]Marin,Javier.Random forests of local experts for pedestrian detection[C]//Proceedings of the IEEE International Conference on Computer Vision,2013.
[16]Zhang Shan-shan,Christian Bauckhage,Armin B.Cremers.Informed haar-like features improve pedestrian detection[C]//Proceedings of the IEEE conference on computer vision and pattern recognition,2014.
Pedestrian detection based on ACF algorithm
YAN Dong,SUN Zuo-lei,ZHANG Cang,HUANG Guan-ming
(Shanghai Maritime University,Shanghai 201306,China)
In recent years,various methods in the field of pedestrian detection have been proposed.Among them,a variety of features and efficient classifier is the key to these studies,this paper is to find a more efficient way in these two areas to improve performance.Our pedestrian detection method is associated with three features,including the objectness features,salient feature and edgebox feature.At the same time,we have improved the classification architecture to improve performance.Caltech-USA and INRIA two databases train the model,compared to the general detection model,our accuracy rate increased by 20%.
pedestrian detection; correlation feature; edgebox feature;salient feature
TN99
A
1674-6236(2017)17-0172-04
2016-08-08稿件編號(hào):201608063
晏 棟(1991—),男,湖北隨州人,碩士。研究方向:行人檢測(cè)。