李瑞帥
摘 要:人體檢測(cè)是計(jì)算機(jī)視覺與模式識(shí)別中一個(gè)重要的分支,在多個(gè)領(lǐng)域有著廣闊的應(yīng)用前景。引入一種雙支持向量機(jī)TWSVMs,通過兩個(gè)形如SVM的凸規(guī)則規(guī)劃問題來構(gòu)建兩個(gè)非超平面,能將訓(xùn)練時(shí)間縮減,它具有SVM的優(yōu)點(diǎn),卻對(duì)大規(guī)模數(shù)據(jù)具有更好的處理能力。
1.研究意義
人體檢測(cè)是計(jì)算機(jī)視覺與模式識(shí)別中一個(gè)重要的分支,在智能監(jiān)控、基于內(nèi)容的圖片和視頻檢索、視頻標(biāo)識(shí)、輔助駕駛、輔助生活、數(shù)字娛樂、高級(jí)人機(jī)交互、運(yùn)動(dòng)分析等領(lǐng)域有著廣闊的應(yīng)用前景。但是,因?yàn)槿说淖藨B(tài)、衣著以及人所處的背景環(huán)境、光照強(qiáng)度等的千變?nèi)f化,再加上觀察者的視覺角度的不同,導(dǎo)致檢測(cè)的環(huán)境非常的復(fù)雜,這對(duì)人體檢測(cè)技術(shù)的研究者來說,是個(gè)不小的挑戰(zhàn)。目前,人體識(shí)別主要有基于多模板匹配、基于邊緣輪廓特征和基于運(yùn)動(dòng)特征等各種方法。然而,從實(shí)際效果來看, 目前最好的是 DALAL N 和TRIGGS B 提出的基于 HOG 特征的人體檢測(cè)方法。 DALAL N 等人通過使用 16×16 大小的塊在檢測(cè)窗口中滑動(dòng),然后按一定方式統(tǒng)計(jì)塊中的梯度向量直方圖,將各個(gè)塊的梯度向量直方圖串聯(lián),組成特征向量。滑動(dòng)窗口檢測(cè)方法是使用一個(gè)滑動(dòng)窗口,在圖像的不同尺度上,從圖像的左上角開始,逐列或者逐行地進(jìn)行掃描,直到圖像右下角的像素。通過這種掃描方式,來收集像邊緣、片段、小波系數(shù)、顏色等特征,并把收集好的特征輸入訓(xùn)練好的分類器進(jìn)行分類判斷。檢測(cè)效果雖然理想,但耗時(shí),難以達(dá)到實(shí)時(shí)性的要求。
2.國(guó)內(nèi)外研究現(xiàn)狀
人體檢測(cè)與識(shí)別技術(shù)有著廣闊的應(yīng)用前景,也面臨這一系列的挑戰(zhàn)。作為計(jì)算機(jī)視覺與模式識(shí)別領(lǐng)域的一個(gè)非常重要的課題,近年來吸引了大批研究者的目光,也取得了長(zhǎng)足的進(jìn)步。在行人檢測(cè)的領(lǐng)域內(nèi),國(guó)內(nèi)外學(xué)者經(jīng)過多年的研究,形成了幾種比較流行的框架結(jié)果。可以把這些框架簡(jiǎn)單的劃分為兩類:第一類為基于視頻中的運(yùn)動(dòng)信息的目標(biāo)檢測(cè)算法,例如背景減除,混合高斯模型(GMM),運(yùn)動(dòng)歷史圖像(MHI)等等。第二類為基于檢測(cè)目標(biāo)的特征,設(shè)計(jì)訓(xùn)練相應(yīng)的分類器進(jìn)行檢測(cè),例如利用紋理特征Haar、局部二值化模式特征進(jìn)行檢測(cè),利用邊緣特征梯度方向直方圖(Histograme of Oriented Gradient,HOG,Edgelet等特征進(jìn)行檢測(cè)等。第一類算法主要利用圖像幀差分的思想,構(gòu)建運(yùn)動(dòng)前景圖像,從而達(dá)到目標(biāo)檢測(cè)的目的。雖然該類算法比較單間,擁有很好的實(shí)時(shí)性,不過對(duì)于場(chǎng)景經(jīng)常性變化、目標(biāo)距離很近、目標(biāo)間相互遮擋或者目標(biāo)長(zhǎng)時(shí)間沒有顯著運(yùn)動(dòng)的情況下,該算法的檢測(cè)精度會(huì)下降的很大。第二類算法主要針對(duì)目標(biāo)的表象、輪廓等選擇響應(yīng)的特征以及分類器進(jìn)行訓(xùn)練,通過滑窗技術(shù),把訓(xùn)練好的分類器應(yīng)用于圖像幀中檢測(cè)用戶感興趣的目標(biāo)。該類算法既可以應(yīng)用的視頻序列中,也可以應(yīng)用于單幀圖像,可以很好的解決目標(biāo)距離很近或者目標(biāo)長(zhǎng)時(shí)間沒有顯著運(yùn)動(dòng)的情況下,目標(biāo)無法檢測(cè)的問題。但是因?yàn)樵擃愃惴ú捎玫氖欠诸惼饕约盎凹夹g(shù),檢測(cè)無法達(dá)到實(shí)時(shí)的效果。
3.理論簡(jiǎn)介
支持向量機(jī)(SVM )作為神經(jīng)網(wǎng)絡(luò)的一個(gè)重要分支,與傳統(tǒng)的機(jī)器學(xué)習(xí)方法相比,它具有全局優(yōu)化、適應(yīng)性強(qiáng)、理論完備、訓(xùn)練時(shí)間短、推廠性能好等優(yōu)點(diǎn),具有良好的潛在應(yīng)用價(jià)值和發(fā)展前景。它可以在小樣本空間中獲得很好的推廣能力,是一種優(yōu)秀的學(xué)習(xí)方法。所以從理論上說將支持向量方法運(yùn)用到圖像分割中具有一定的優(yōu)勢(shì)。但由于運(yùn)用SVM對(duì)樣本分類時(shí)要解決二次規(guī)劃的問題非常費(fèi)時(shí),為了避免訓(xùn)練時(shí)間過長(zhǎng)的問題,引入一種孿生支持向量機(jī)TWSVMs(Twin Support Vector Machines),TWSVMs在形式上類似于傳統(tǒng)的支持向量機(jī)不僅具有傳統(tǒng)支持向量機(jī)的優(yōu)點(diǎn),而且對(duì)大規(guī)模數(shù)據(jù)具有更好的處理能力。TWSVMs為兩個(gè)類各自得到一個(gè)分類平面屬于每個(gè)類的數(shù)據(jù)盡量圍繞在與之相對(duì)應(yīng)的分類平面周圍,然后TWSVMs通過優(yōu)化一對(duì)分類平面來構(gòu)建分類超平面。也就是說,TWSVMs需要解決一對(duì)QPP問題,而SVM則是解決一個(gè)QPP問題,從計(jì)算復(fù)雜度上來說其計(jì)算速度是傳統(tǒng)支持向量機(jī)的4倍。
本文在對(duì)基于HOG特征的行人識(shí)別方法進(jìn)行研究的基礎(chǔ)上,為了提高檢測(cè)的速度與性能,對(duì)分類器的選取、訓(xùn)練方法、結(jié)果融合等方面進(jìn)行了研究。
4.總結(jié)
本文將雙支持向量機(jī)法,應(yīng)用到行人檢測(cè)中,相對(duì)于傳統(tǒng)算法其具有良好的推廣能力,并速度較快。但由于雙支持向量機(jī)理論的具體應(yīng)用相對(duì)比較復(fù)雜,涉及的內(nèi)容較多,本文的研究在很多方面還不夠深入,有待于在今后的研究工作中繼續(xù)改進(jìn)和完善。