
摘 要:公共安全已成為人們最為關注的社會問題之一,現在的公共場所都設立了很多監控攝像頭,視頻監控在公共安全中起到了重要的作用。行人再識別技術是實現智能監控的關鍵步驟。本文采用核典型相關分析(KCCA)算法,使用Visual Studio開發平臺設計并實現了基于KCCA的行人再識別系統。
關鍵詞:核典型相關分析;行人再識別;系統實現
引言
隨著人們對社會安全的日益關注以及科學技術的快速發展,在城市商城、學校、醫院、汽車站等公共場所攝像機數量不斷擴張,大量出現的監控攝像頭給人們的生活帶來了極大的便利。雖然視頻監控攝像頭的數量龐大,但是各個監控攝像頭之間缺乏互聯,而且大部分攝像頭都是設立在非重疊的區域。如果僅僅是依靠人工來完成數據分析,將耗費巨大的人力物力資源,數據分析的結果還不一定正確。因此,一個能夠從不同的,非重疊的攝像頭中捕獲到的行人圖片的大數據集中進行查找并分析的系統對于一個監控攝像頭網絡來說會是非常有用的工具。行人再識別是指借助于計算機視覺方法,通過視覺對比的方式將視場不重疊的多個攝像機所拍攝到的屬于同一個行人的圖像或者視頻片段關聯起來的技術。本文的目的就是設計一個行人再識別監控系統,來克服單調的手動篩選行人圖片的困難,實現智能監控。
1 基于KCCA的行人再識別
基于KCCA的行人再識別方法由三個步驟組成。首先提取圖像特征描述子,然后使用核函數將特征描述子映射到高維空間,最后在高維空間進行CCA運算并計算余弦距離,再把余弦距離排序實現行人再識別。
1.1 特征描述子的提取
給出一張目標的圖片,將圖片修改為標準尺寸,即64×128像素。然后將圖片在豎直方向上均分為水平條紋,每一條條紋高度為16像素,即將圖片均分成了8條水平條紋。從每條條紋中提取HS直方圖、RGB直方圖、Lab直方圖、HOG直方圖和LBP直方圖描述子[1]。每個顏色直方圖連接起來形成了描述子的第一部分。在這個描述子之后,先添加HOG描述子,將梯度方向量化為4個小區間,然后再將LBP描述子添加到后面,得到最終需要的描述子。
1.2 核表示法
使用卡方核函數將提取的描述子映射到高維特征空間,具體實現表示為公式(1-1),
其中C為所有測試實例的卡方距離的中值。
1.3 使用KCCA算法識別行人
在測試時,將probe實例映射成α向量,將gallery實例映射成β向量,可表示為等式(1-2)和等式(1-3),
然后計算gallery和probe的映射描述子之間的余弦距離,并且執行一個最簡單的最近鄰分類,如公式(1-4)所示,
其中i代表確認的第i個gallery實例。
然后將所得到的距離向量進行排序,選出距離小的前10個作為識別結果。
2 系統設計與測試
2.1 實驗數據集
VIPeR數據集[2]由632對戶外捕獲的行人圖像組成,這632對圖像是在不同的光照條件下,分別由兩個不同并且非重疊的攝像機A和攝像機B在不同的角度下拍攝的。我們將632對圖像隨機分成兩組,每組包含316對圖像,一組用來作為訓練集,而另一組用來作為測試集。從probe圖像集中選擇一張單獨的圖像,在所有的gallery圖像集中選擇并匹配probe圖像。
2.2 行人再識別測試系統
本文設計的行人再識別系統是在Visual Studio 2010 + MATLAB 2012b ( 32 bit ) + OPENCV 3.0的環境下實現的,系統是在Visual Studio 2010 中設計的,利用MFC來搭界面,將MATLAB與C++進行混合編程實現對數據運算的處理,OPENCV 3.0主要用于對圖片的處理。
該系統主要實現的功能是在VIPeR數據集中,當從攝像機A中的圖像集中選擇一張圖像作為probe圖像時,能夠從攝像機B中的圖像集中匹配出識別率前十的圖像作為gallery圖像。
運行程序時,“匹配系統”按鈕為灰色,只有當點擊了KCCA運算按鈕,并且KCCA運算完成之后才能進行后續的操作,運算的具體過程將顯示在右邊提示框中,同時會顯示運算進行的時間。
圖像匹配系統界面,首先需要通過點擊“列出Probe圖片集”和“列出Gallery圖片集”按鈕將VIPeR數據集中的Probe圖像集和Gallery圖像集,也就是攝像機A和攝像機B中的圖像,列在圖像框中,然后使用鼠標在Probe圖像集中單擊某張圖像,表示選擇這張圖像作為Probe圖像,然后點擊“圖像匹配”按鈕,系統將會匹配出識別率前十的圖像并顯示在Gallery圖像列表中。對于絕大多數的Probe圖像,都能在識別率前十的Gallery圖像中找到與之正確匹配的圖像。
3 結語
行人再識別是當前計算機視覺領域的研究熱點,本文利用KCCA算法來實現行人的再識別,使用Visual Studio開發平臺實現了基于KCCA的行人再識別系統。結果表明系統能夠實現行人再識別,并且識別率較高。
參考文獻:
[1] G. Lisanti, I. Masi, A. D. Bagdanov, and A. Del Bimbo, “Person Re-identification by Iterative Re-weighted Sparse Ranking”[J], IEEE Transactions on Pattern Analysis and Machine Intelligence 2014.
[2] VIPeR: Viewpoint Invariant Pedestrian Recognition | Computer Vision Lab. ?https://vision.soe.ucsc.edu/node/178.
作者簡介:
耿家國(1965.4—), 男,漢族,大專,工程師。