王楠

摘 要:當今大部分地區對天網工程視頻數據的追溯仍停留在人力查找階段,為應對公安部門監控數據處理效率低下的問題,文章提出一種以人臉圖像為內容的圖像識別與截取方法,使用AdaBoost方法結合Haar-like特征檢測人臉后自動地初始化Struck跟蹤器,對跟蹤器截取的圖像幀序列進行預處理,增量PCA方法提取序列的特征后以One-class SVM作為檢索分類器,實現輸入指定圖像后輸出視頻內容中與之相關的視頻片段的目標。
關鍵詞:視頻檢索;Struck算法;Haar-like;AdaBoost;One-class SVM
中圖分類號:TP391.4 文獻標志碼:A 文章編號:2095-2945(2018)34-0008-03
Abstract: Nowadays, the tracing of video data of skynet project is still at the stage of manpower search in most areas. In order to deal with the problem of low efficiency of video data processing in the public security department, this paper proposes a method of image recognition and interception, which is based on face images. The Struck tracker is initialized automatically after face detection using AdaBoost method combined with Haar-like features, and the image frame sequence intercepted by the tracker is preprocessed. The features of the sequence are extracted by incremental PCA method, and One-class SVM is used as the retrieval classifier. An object associated with a video segment in an output video content after input of a specified image is implemented.
Keywords: video retrieval; Struck algorithm; Haar-like; AdaBoost; One-class SVM
1 概述
由于天網工程的開展,公安部門已經掌握了大部分的監控攝像頭。這些攝像頭每天產生視頻數據的數量級非常大。雖然海量的視頻數據是公共安全的一個重要保障,然而想要利用人力在視頻信息中找到特定的目標,存在耗時長,主觀判斷性強,容錯率低等問題。因此,需要一種可以準確、快速地找到目標的自動化方法。本文介紹一種基于人臉圖像的視頻檢索方法,能夠在指定時間段內判斷目標是否出現,并輸出檢索的相關視頻片段。基于圖像內容的檢索相比基于文字內容的檢索,突破之處在于它可以直接作用于多媒體數據。由于視頻內容存在場景、鏡頭等隱含信息,所以在對視頻進行檢索前需要進行一些結構分析及處理,如鏡頭分割、關鍵幀提取以及視頻語義標注等等。基于人臉圖像的視頻檢索在公共安全領域具有十分重要的意義,利用人臉檢索,可以標記出某一特定目標的行動軌跡,以及預測該目標的活動范圍。
2 整體框架
框架的中心工作是為所有需要監控,即作為檢索對象的目標建立特征空間。分為檢測跟蹤、歸一化處理以及建立特征空間四步。人臉檢測使用AdaBoost基于Haar-like的方法,用Struck跟蹤器截取圖像序列,對序列中的每一幀圖像進行歸一化預處理,最后為人臉建立特征空間并用One-class SVM分類。
框架如圖1所示。
3 特征空間的建立
3.1 提取人臉序列
可以檢測出正臉的監控錄像通常具有序列特性,即在短時間的鏡頭(連續圖像序列)內,人臉圖像的空間差別很小。要盡可能得到有效的人臉序列,那么就需要使用人臉跟蹤方法。
人臉跟蹤是指在人臉目標已被自動識別獲取的情況下,在一定時間范圍內對接下來的每一幀進行目標標識。大多數情況下檢測識別算法復雜度比較高,單一圖像可以保證效率。但單圖片序列由若干相似幀組成,若每幀都進行相同的識別處理,將在一定程度上浪費系統資源。相比之下,跟蹤算法更加適合其應用場景。跟蹤算法的復雜度低,利用其本身的機制可以進行在線學習和預測,不需要每一幀都操作,在丟失跟蹤目標或一定時間間隔后再次初始化跟蹤器即可。
3.1.1 人臉檢測
人臉跟蹤的步驟包括檢測和跟蹤,本文對視頻中的圖像幀序列采用級聯AdaBoost算法檢測人臉。AdaBoost是一種迭代算法,將若干個弱分類器聚合成為一個強分類器,能夠有效提高學習方法的準確性。
Haar特征值對應的是圖像的灰度變化。臉部的某些特征基本可以被矩形特征簡單地描述,例如五官的相對明暗關系:眼睛的顏色與臉頰的顏色對比,鼻梁、嘴巴與周圍顏色的對比等等。但Haar-like存在很明顯的短處:矩形特征只對一些簡單的圖形結構,單一特征只能描述能夠由小面積矩形標示的特定走向的結構,表示邊界、線段、棱角等。
AdaBoost算法按照一定規則聚合多個以Haar-like特征為基準的分類器,這樣聚合后的分類器足以判斷某一圖像區域是否為人臉。級聯AdaBoost將判斷各種人臉特征的分類器聚合以得到效用更高的分類器,實現從眼睛、鼻子到整張人臉的識別。使用AdaBoost方法對每個序列的第一幀進行處理后,將該幀中檢測到的人臉數據用于初始化跟蹤器。
3.1.2 Struck方法跟蹤
跟蹤算法應用較多的有光流法、粒子濾波算法和均值漂移算法。這些算法只是單純的跟蹤,并不能實時學習。即跟蹤目標如果因光線、角度等外界因素產生變化,傳統的跟蹤算法是不能適應的,因此也難以在復雜場景中應用。
Struck全稱結構性訓練跟蹤算法,是由Sam Hare等首先提出的一種全新的跟蹤框架,它是一種基于結構輸出預測的自適應目標跟蹤框架。Struck算法的運作基礎是特征和變換,有別于傳統的跟蹤方法的特征與標簽。它用維護支持向量集的方式尋找置信函數的極值點,以推測跟蹤目標的可能出現位置的概率。引入輸出空間滿足跟蹤功能,直接輸出跟蹤結果,而不是對中間的內容重復進行同等工作。為了避免過程中的支持向量過增長,保證實時性,Struck還引入了閾值機制。雖然在遮擋和姿態變化情況下,Struck較為穩定,但尺度變化的情況下即跟蹤目標的尺寸大小產生大波動時,Struck仍有不足。
Struck的算法的三個主要步驟:第一給定的目標圖片序列中,在第一幀獲取到跟蹤目標,用這個目標初始化跟蹤器的參數;第二利用它自身的預測機制估計出接下來物體可能出現的位置;第三對新出現的跟蹤目標樣本進行處理,求解最優的分割平面,加入閾值判斷防止支持向量過增長,跟蹤到目標對象并更新支持向量集。
3.2 序列幀歸一化處理
使用直方圖均衡化對圖像序列中的每一幀作預處理以減少光線對圖像特征的影響,再進行歸一化。
歸一化是將姿態、大小不一的樣本圖像通過仿射映射,得到一組特征點對齊、大小一致的圖像,再使用重心模板找到臉部的中心位置。改善圖像質量,統一圖像灰度值及尺寸,消除對特征提取無用的噪聲。
3.3 增量PCA(Principal Component Analysis)
人臉識別的過程包括提取面部特征及對提取的特征進行分類以找到高維空間中人臉分布的規律。PCA的主要思想是盡可能在最小均方意義下尋找能最大程度表示樣本分布的投影方向,即單位向量,它是一種常用的特征提取方法。PCA將原始數據的高維特征線性變換為各維度線性無關的一組向量表示,在數據主要特征分量的提取中應用廣泛,是高維數據降維的常用方法。PCA算法的核心思想是將高維特征映射到小于原數據維度的空間維上,這一新構造出來的較低維是全新的正交特征,被稱為主成分。
一幅圖像X在低維空間中的特征向量Y,由式(1)投影方式得到。
在上式中, 可以盡量選取接近1的α,這說明樣本在前m個軸上的能量基本可以代表整個能量。
這種算法雖然常用但容錯率較小,因為它對訓練樣本集的要求很高,通常訓練人臉和目標人臉的光照、背景等條件盡量一致才能達到最好的匹配效果;而通常視頻中的人臉圖像變化波動很大,并不受上述外界因素的拘束。那么本文將使用增量PCA學習算法,增量PCA在PCA的基礎上可以在增量的過程中逐步減小因背景、光線、角度等外界因素對圖像序列不同幀造成的差別,有效降低提取特征的散度。一個訓練序列為一個固定人物,識別過程中將結果反饋到子空間和單類支持向量機One-class SVM上進行分類,動態調整子空間的單位向量方向和One-class SVM的分類面,以這種方式減少光照、背景等因素的影響。
One-Class SVM分類器適用于二分類問題,即是或者不是。因為輸出結果只有兩個,所以訓練數據只需要足量的正樣本,確保分類器能準確判斷其中一種結果即可,符合應用場景。
SVM不同的內積核函數將得到不同的高維空間的映射, 本文采用的核函數為徑向基函數與多項式內核函數。
多項式內核和RBF核是SVM常用的兩種核函數。RBF核函數應用最廣,它可以將一個樣本映射到一個更高維的空間,RBF網絡能夠逼近任意的非線性函數,可以處理系統內難以解析的規律,泛化能力良好,收斂速度快。
4 結束語
本文提出了一種基于人臉圖像的視頻檢索方式,采用Struck跟蹤算法。Struck算法是一種可在線學習的計算機視覺跟蹤算法。結合AdaBoost算法可以自動初始化跟蹤器,此外AdaBoost與跟蹤器同時運行,可以提高跟蹤準確性。若跟蹤器丟失當前目標,也能及時檢測下一個目標,提高了片段截取的效率。然而公安視頻監控系統中每天將產生大量的視頻數據,也需要更高性能的檢索算法,未來這一問題仍可以進一步進行研究。
參考文獻:
[1]Wong C F, Zhu J, Vai M I, et al. Face image retrieval in video sequences using lifting wavelets transform feature extraction[C]// International Symposium on Consumer Electronics. IEEE, 2005:167-171.
[2]肖兒良,韓超.應用于人臉自動實時跟蹤的改進Struck算法[J].電子科技,2016,29(3):42-47.
[3]陳立珍,崔國勤,李卓.電影視頻人像檢索系統[J].計算機仿真,2008,25(6):187-190.
[4]陳立珍,崔國勤,李卓.基于子空間增量學習的視頻中人臉圖像檢索[J].計算機輔助設計與圖形學學報,2007,19(9):1119-1125.
[5]魏小莉,楊黎東,種衍文,等.基于視頻元數據信息的快速圖像檢索[J].計算機工程,2010,36(12):7-9.
[6]汪亞明,黃文清,周海英.動態圖像序列中的運動目標檢測[J].計算機測量與控制,2003,11(8):564-565.