高小康
(同濟大學電子與信息工程學院計算機科學與技術系,上?!?01804)
基于Grab Cut算法和傅里葉描述子的人物背面步態識別
高小康
(同濟大學電子與信息工程學院計算機科學與技術系,上海201804)
提出基于Grab Cut圖象分割算法和傅里葉描述子的步態識別方法。通過HOG+SVM算法提取出視頻中的行人區域,對該區域使用Grab Cut算法進行分割得到行人二值化后的圖像,然后應用傅里葉描述子描述步態特征,最后在識別方面采用最近鄰分類器進行識別。此算法在中國科學院自動化所的CASIA數據庫上進行實驗,取得較好的識別效果。
Grab Cut;傅里葉描述子;步態識別;HOG;最近鄰分類器
國家自然科學基金項目(No.61173116)、國家科技支撐計劃項目(No.2015BAF10B01)
步態識別至今已經發展了20多年,但距離實際應用仍然有不少距離。因此行人身份識別在社會上有著很大的需求,在公共場合例如街道、機場、火車站等地方都會需要這種技術。1994年,Niyogi和Adelson最早利用步態特征進行生物識別,之后應用步態進行人物識別涌現了一大批步態識別算法。典型的代表就是法國研究人員Dalal等人[1]的HOG+SVM的行人檢測算法。在步態特征提取方面,特征提取直接影響了識別性能。Bobick等人在[2]運動能量圖(Motion Energy Images)來描述行人的步態動作。Han等人則利用步態能量圖識別步態[3],通過對一個步態周期的行人輪廓求平均值的方法來反映步態側影的變化周期。不同于上述方法,本文提出了基于Grab Cut圖像分割和傅里葉描述子的背面步態識別方法。首先用HOG+SVM的行人檢測算法提取出視頻中的運動人體區域,利用基于梯度方向直方圖(Histogram of Oriented Gradient,簡稱HOG)進行特征提取,然后用線性SVM作為分類器進行行人檢測。為了得到步態識別所需的行人二值圖,本文采用Grab Cut算法對檢測出來的行人圖像進行分割。隨后使用傅里葉描述子對分割出來的行人圖像進行步態特征的描述,最后采用最近鄰分類器進行分類識別。第二部分主要介紹了行人檢測和分割,第三部分介紹了行人特征提取和行人識別,最后第四部分描述了實驗結果。
1.1行人檢測
方向梯度直方圖是一種在計算機視覺中主要被用來進行物體檢測的特征。原理是通過計算和統計圖像局部區域的梯度方向直方圖來構成特征。HOG特征提取算法實現如下:首先把原始視頻中的圖像轉換成灰度的圖像;然后采用Gamma校正方法對灰度的圖像進行顏色空間的標準化,計算圖像中每個像素的梯度;之后把圖像切割成單個cell,每一個cell為6×6大小的像素,對每個cell的梯度直方圖進行統計,得到相應的描述子,將3×3個cell組合成一個大的block,每個block中對應的cell特征描述子結合在一起就形成了HOG特征描述子,把所有HOG特征描述子結合在一起就形成了目標對象的HOG特征描述子。經過這些過程得到的HOG特征向量,便可以結合SVM進行訓練和行人檢測了。
1.2行人分割
本文采用的Grab Cut是Graph Cuts的改進版,而Graph Cuts是一種能量優化算法,它與圖的最小割問題[4]相關。Graph Cuts就是求最小割的過程,也即最小化能量函數,圖像的能量可表示為:

其中B(L)是邊界項,R(L)是區域項,a為區域項的影響因子,表示區域項在圖像的能量中所占的權重。邊界項可表示為:


其中Rp(lp)是像素p對應lp的大小,Rp(lp)權值大小可以通過比較給定的前景圖像的灰度直方圖和像素p的灰度來獲取。最后,最小割通過min cut算法就可以找到,而min cut就是表示所有最小權值和的邊集合,這個邊集合可以分割開目標和背景,即最小化能量體現。
2.1傅里葉描述子
本文的步態特征可以通過傅里葉描述子來描述,可以把問題從2D轉化為1D?;舅枷刖褪羌俣ㄐ腥溯喞獮橐粭l封閉曲線,曲線上的點坐標變化可以看作是以邊界周長為周期的函數,這個函數可以用傅里葉級數形式表示,把輪廓邊界上的每一個點都看成一個矢量,用復數形式[6]表示如下:

N為輪廓的像素數,選定最左下方的前景點為起點,采用串行邊界分割技術[5]的輪廓跟蹤算法取得邊界每一個點的坐標,最后計算每個點與重心的距離di:

其中xc,yc為重心坐標所有距離構成一個特征序列D={d1,d2,…,dN},對D進行離散傅里葉變換,得到變換系數an

由于歸一化后的描述子具有平移、尺度和旋轉的不變性,所以以a1為基準對傅里葉描述子進行歸一化,可以得到后期步態分類識別的特征向量,如下所示:

行人輪廓線的傅里葉頻譜的頻率分量大部分集中低頻部分。因此本文選取傅里葉描述子的前15階頻譜分量作為步態識別的特征。
2.2步態的訓練和識別
有n個行人行走的訓練視頻,每個視頻可以表示為一個行人的類別,通過上述方法可以得到每個視頻中行人步態圖像所形成的傅里葉描述子,用Fi,j表示第i個行人視頻中第j幅圖像的傅里葉頻譜矢量,Si是第i個行人類別的頻譜矢量數,訓練的樣本頻譜矢量數總和為S=S1+S2+…+Sn,因此訓練集為:

其均值和方差矩陣為:

計算得出D的秩W,然后可得W個非零的特征值λ1,λ2,…,λW,e1,e2,…,eW為它們的特征向量,最后在特征空間進行投影,每個矢量Fi,j在特征空間投影為一點Pi,j。
通過上述處理,在每個步態周期內可截取五個關鍵幀的圖像,即一個右單撐,一個左單撐,一個左雙撐和倆個右雙撐[7],單撐和雙撐可以用D、S表示,所以五個關鍵幀圖像得到的投影點可表示成五個元素的組合Ci={Di,Si,Di+1,Si+1,Di+2}。
對于同一視頻中的單個的人,本文提取出了多個連續的關鍵幀,組成步態周期,對于得到的步態周期都求出C,最后每個人的標準的特征模板可以用C的平均值來表示。
最后,本文使用歐氏距離來評估訓練樣本和測試樣本的相似性,如下:

本文算法在CASIA的Dataset B數據庫進行了實驗,Dataset B數據庫中含有124個行人,每個行人有0、18、36、…、180度11個視角,在普通條件、穿大衣、攜帶包裹三種條件下進行行走視頻的采集。本文選取20 個180度視角的行人在三種行走條件下的行走視頻進行了實驗,得到的實驗結果如下:

表1
文獻[8]也是基于傅里葉描述子的行人識別,但識別率只有80.03%,本文算法在普通條件下比它要高,主要因為采取了Grab Cut算法獲取的行人輪廓更加準確,在穿大衣和攜帶包裹的條件下,本文算法的識別率有了不少下降,主要是衣服和包裹的晃動影響了行人的步態輪廓,總體來說,基于Grab Cut和傅里葉描述子的步態識別算法在識別的準確性上都取得了不錯的效果。
雖然本文在CASIA數據庫上取得了較好的效果,但算法還是存在一些局限性。本文方法在側面步態時效果不是很好,怎樣能做到側面和背面的步態識別都取得不錯的效果是今后研究的一個方向。
[1]Dalal N,Triggs B.Histograms of Oriented Gradients for Human Detection[C].Computer Vision and Pattern Recognition,2005.CVPR 2005.IEEE Computer Society Conference on.IEEE,2005,1:886-893.
[2]Bobick A F,Davis J W.The Recognition of Human Movement Using Temporal Templates[J].Pattern Analysis and Machine Intelligence,IEEE Transactions on,2001,23(3):257-267.
[3]Han J,Bhanu B.Individual Recognition Using Gait Energy Image[J].Pattern Analysis and Machine Intelligence,IEEE Transactions on,2006,28(2):316-322.
[4]葉波,文玉梅.基于人體輪廓寬度特征的步態識別[J].計算機應用,2005,25(08):1792-1794.
[5]李彬,劉冀偉,韓鴻哲,等.基于步態特征的快速身份識別方法[J].計算機工程與應用,2004,40(22):60-61.
[6]高海燕.人體步態識別研究[D].北京交通大學,2010.
[7]Wang A H,Liu J W.A Gait Recognition Method Based on Positioning Human Body Joints[C].Wavelet Analysis and Pattern Recognition,2007.ICWAPR'07.International Conference on.IEEE,2007:1067-1071.
[8]Lu X,Huang H,Zhang B.Recognition of Human Movement Based on Fourier Descriptors[J],2008:1943-1946
Grab Cut;Fourier Descriptors;Gait Recognition;HOG;Nearest Neighbor Classifier
Gait Recognition of Figure in the Back Based on Grab Cut and Fourier Descriptors
GAO Xiao-kang
(Department of Computer Science and Technology,School of Electronics and Information Engineering,Tongji University,Shanghai 201804)
Presents a gait recognition algorithm based on Grab Cut and Fourier descriptors.Firstly,uses HOG+SVM algorithm to extract the pedestrian area in the video,then utilizes Grab Cut to achieve pedestrian binary image and describing the gait feature by means of Fourier descriptors,finally uses the nearest neighbor classifier NN for classification.Applies the method described above to experiment on gait database of CASIA provided by institute of automation,Chinese academy of sciences and getting a good recognition performance.
1007-1423(2016)32-0049-04
10.3969/j.issn.1007-1423.2016.32.011
高小康(1992-),男,江西上饒人,碩士研究生,研究方向為計算機視覺、步態識別
2016-08-16
2016-11-20