賈澎濤,雷文華,張 婧
(西安科技大學 計算機科學與技術學院,陜西 西安 710054)
信息安全的重要性隨著數字化時代的到來日益凸顯。在信息安全領域,如何快速準確獲取個人身份信息成為眾多學者的研究重點。人臉識別作為生物特征識別技術的一種,因其生物自然性、非接觸性等優勢而被廣泛應用。人臉識別的關鍵技術是人臉檢測,人臉檢測技術中使用的人臉圖像是一種高維含噪數據,不利于提高人臉檢測的速率和準確率。因此,如何有效去噪且保留有效信息的前提下實現圖像降維壓縮,從而快速準確的定位到人臉區域,是人臉檢測研究領域急需攻克的關鍵技術難題[1-2]。
目前人臉圖像降維方法主要有線性降維方法和非線性降維方法,線性降維方法相比非線性降維方法思路比較簡單,時間復雜度較低,但是針對非線性關系的遠距離點存在降維后失真問題。線性降維方法中的線性判別法(LDA)存在過度擬合數據的現象,主成分分析法(PCA)的特征維度含義不夠清晰,忽略較小方差所包含的重要信息[3-4]。非線性降維方法中基于核函數的方法主要包含有核獨立成分分析(KICA)從樣本信號中提取同維數源信號,無法對含噪信息的樣本信號進行去噪降維,基于核主成分分析方法(KPCA)采用非線性映射函數將數據從低維映射到高維空間,獲取主元個數并計算非線性主成分[5-7]。非線性降維方法中基于特征值的方法有等距映射(ISOMAP)、局部線性嵌入(LLE)等,主要針對局部結構進行降維,通過局部估算全局,如果數據之間存在較小差異性,會導致特征結果不具備代表性[8-9]。綜合來看,線性和非線性降維方法各有優缺點,適用于不同的場景需求。線性降維方法更適用于對人臉檢測耗時有較高要求的應用場景。
奇異值分解(SVD)作為線性降維方法的一種,可降低圖像數據維度并有效提取圖像特征。早在1992年洪子泉、楊靜宇采用SVD方法抽取圖像特征,并提出圖像奇異值可以作為圖像的能量信息,其特征具有旋轉不變性、比例不變性、穩定性等[10-12]。目前采用SVD對圖像進行降維,首先擬定奇異值個數,根據奇異值個數對圖像實現降維,奇異值個數k的選取存在很大的隨機性,不能保證在保留有效特征的前提下,對人臉圖像實現降維重構。因此,如何量化k值,針對不同的人臉圖像自適應確定較優值,在較優壓縮率和圖像識別的準確率之間找準均衡點顯得尤為重要。
基于降維預處理的圖像,進行人臉圖像檢測。近年來主要用于人臉檢測的方法有基于隱馬爾可夫的檢測方法、基于神經網絡的檢測方法[13-15]、基于小波變換的檢測方法等[16],這些方法所耗費的時間較長,空間復雜度較高。相比較而言,基于哈爾(Haar)和梯度方向直方圖(HOG)特征的人臉檢測方法較優。Haar特征最早是由VIOLA和JONE提出的,其檢查速率較快[17]。HOG特征算法是由DALAL教授提出的,該方法的運行速率相比Haar較低,但檢測率較高[18]。
為了有效提高人臉檢測速率和準確率,筆者提出基于最優奇異值占比的融合特征人臉檢測模型ProSVD-HH(Proportion Singular Values Decomposition-Haar HOG)。對人臉圖像實現降維的基礎上,根據人臉檢測效果擇優選取最優奇異值占比值,根據集成分類思想融合Haar和HOG特征人臉檢測方法建立更高效人臉檢測模型。
SVD是線性代數中的一種高效的矩陣分解變換方法,可將任意類型的矩陣分解為左、右奇異矩陣和奇異值矩陣。奇異值分解描述如下[19-20]。
定義1:假設有一個m×n階(m (1) 式中U和V是一個正交實矩陣,奇異值矩陣∑m×n是一個對角陣,可表示為 ∑m×n=diag[σ1,σ2,…,σm] 奇異值矩陣中,對角線上的元素σ稱為矩陣A的奇異值[21-22]。 定義2:奇異值分解方法對圖像進行特征提取,奇異值占比θ定義為k個奇異值之和與全部奇異值之和的比值。奇異值占比θ作為奇異值σ的函數,可表示如下。 (2) 例如:用于人臉檢測的人臉圖像如圖1所示。 圖1 人臉圖像示例Fig.1 Face image samples 對圖1(a)、圖1(b)進行SVD圖像分解處理后獲取92個奇異值,圖1(c)、圖1(d)有250個奇異值。針對圖1(a)展開深入分析,從92個奇異值中選取前27個奇異值對人臉圖像實現降維重構,重構結果如圖2所示,可以看出奇異值個數越多,重構人臉圖像越高清。 圖2 選取不同奇異值重構后的人臉圖像Fig.2 Reconstructed face images with different singular values 在圖1(a)中92個奇異值中前27個奇異值之和占總量的90%,可表示為 同理,在圖1(b)中需32個奇異值,在圖1(c)中需27個奇異值,在圖1(d)中需30個奇異值。因此,選取相同的奇異值個數不能確保每幅圖像表達足夠的信息量,采用最優奇異值占比的概念進一步量化分解圖像,實現更高效的降維重構。 定義3:設f(θ)為人臉檢測率,檢測率差ω定義為前i個與前i+1個奇異值占比下人臉檢測結果的差值,檢測率f(θ)和檢測率差值ω的函數關系見式(3)。 ω=f(θi+1)-f(θi)=f(p(σi+1)-f(p(σi)), (i=1,2,…,m),ω≤ε (3) 當檢測率差值ε大于等于檢測率差ω時,當前的奇異值占比θ值確定為最優奇異值占比值。 1.2.1 Haar方法 Haar特征檢測方法主要反映出圖像局部梯度變化的趨勢,采用矩形特征對目標進行檢測[23]。通過LIENHART等不斷研究,矩形特征種類增加為16種,分為邊緣特征、線性特征、中心特征3類[24],如圖3所示。 圖3 Haar矩形特征集Fig.3 Haar rectangular feature set 基于Haar特征的人臉檢測方法的主要任務是收集正負樣本并訓練分類器,分類器的分類效果取決于樣本質量。可將包含有人臉的清晰圖像作為正樣本,無人臉的圖像作為負樣本。基于Haar特征檢測方法檢測速率較高,但檢測準確率較低。 1.2.2 HOG方法 HOG特征檢測方法主要獲取圖像局部的梯度方向和幅值,通過局部圖像的梯度方向直方圖特征對目標進行檢測[25]。基于HOG特征的人臉檢測方法主要思想是:將圖像局部單元得到的梯度方向直方圖數據串接起來組成一個Block的特征,再將全部Block串聯起來組合為該圖像的特征圖,根據HOG特征圖進行人臉檢測。基于HOG檢測方法的檢測準確率較高,但檢測速率較低。 為改進Haar和HOG特征人臉檢測方法的性能,筆者提出ProSVD-HH人臉檢測模型,模型結構如圖4所示。該模型分為2部分:第1部分對人臉圖像實現重構,采用最優奇異值占比方法對人臉圖像進行降維、重構;第2部分實現更加高效的人臉檢測,采用基于Haar和HOG特征的人臉檢測方法的構建串行集成分類器,首先利用檢測速率較快的Haar檢測器進行人臉檢測,若未檢測成功,將調用檢測準確率較高的基于HOG檢測器實現加強型人臉檢測,以此提高人臉檢測的準確率。 圖4 ProSVD-HH人臉檢測模型Fig.4 Model of ProSVD-HH face detection ProSVD-HH方法的人臉檢測流程如圖5所示。 圖5 ProSVD-HH人臉檢測流程Fig.5 Process of ProSVD-HH face detection 為驗證ProSVD-HH方法的有效性,采用人臉庫ORL(Olivetti Research Laboratory)作為實驗數據集。該數據庫是由英國劍橋大學提供,包含40個不同種族、性別、年齡的對象,每個人物對象包含不同角度、表情和姿態的10幅灰度圖像,ORL數據集總大小為4 024 KB,包含有400幅灰度級為256的人臉圖像,每幅圖像像素大小為112×92,數據庫部分人臉圖像如圖6所示。 圖6 數據庫的部分人臉圖像Fig.6 Partial face images of the database 應用ProSVD-HH方法進行人臉檢測的實驗步驟有 1)人臉圖像特征提取。在不同的奇異值占比下對人臉圖像進行SVD分解,實現降維重構。 2)獲取最優奇異值占比值θ。在不同的奇異值占比下,通過對比基于HOG,Haar特征人臉檢測結果與設定的閾值檢測率差ω獲取最優值。 3)構建ProSVD-HH人臉檢測模型。基于集成分類思想,融合2種人臉檢測方法實現高效人臉檢測,并驗證ProSVD-HH方法的可靠性。 在不同奇異值占比下,基于Haar,HOG特征人臉檢測方法的檢測率見表1,根據實驗結果可以得出奇異值占比越高人臉圖像的壓縮率越低,奇異值占比是影響人臉檢測率的關鍵因素。基于2種人臉檢測方法,檢測率f(θ)與奇異值占比θ的對比結果如圖7(a)所示,檢測率差ω與奇異值占比θ的對比結果如圖7(b)所示。 從圖7(a)可以得出,人臉檢測率隨著奇異值占比的增大而增高;從圖7(b)可以得出,隨著奇異值占比提高,前后檢測率差值明顯降低。為獲取最優奇異值占比,設定式(3)閾值ε為0.005,圖7的標記處滿足前后檢測率差同時不大于閾值ε,綜合考慮人臉檢測率和空間復雜度,標記處表現較優,此處為最優奇異值占比值為98%。基于最優奇異值占比,ORL數據集的大小由4 024 KB縮小為865 KB,有效降低了人臉檢測的空間復雜度。 表1 不同奇異值占比人臉檢測結果分析 圖7 人臉檢測率和檢測率差對比結果Fig.7 Comparison results of face detection rates and difference between face detection rates 采用不同的人臉檢測方法,基于最優奇異值占比的人臉檢測結果見表2,部分檢測效果如圖8所示。從表2可以看出,ProSVD-HH方法的檢測準確率較高,相比于HOG特征、LBP特征和Haar特征的人臉檢測方法提高了2%,17%和10%,相比基于CNN檢測方法檢測率降低了0.5%;根據檢測耗時情況來看,基于CNN的人臉檢測方法時間復雜度最高,ProSVD-HH方法相比HOG,CNN檢測方法其檢測速率分別提高了14.6%,99.2%。綜合來看,ProSVD-HH方法人臉檢測率較高的同時檢測速率較快,取得了較好的人臉檢測效果。 表2 人臉檢測率和耗時實驗結果 圖8 不同方法的部分檢測結果Fig.8 Partial test results of different methods 1)提出最優奇異值占比的概念,基于最優奇異值占比對人臉圖像進行重構,有效降低人臉檢測的空間復雜度。 2)基于集成分類的思想,綜合Haar和HOG算法的優勢,提出了融合Haar和HOG特征的人臉檢測模型(ProSVD-HH)。對比其他檢測方法,ProSVD-HH在檢測率較高的同時耗時較短,取得較好的人臉檢測效果。 3)ProSVD-HH人臉檢測效果較好,但檢測速率還有待進一步提升。下一步的研究重點是在此基礎上,構建高性能的人臉識別模型,有效提高算法的運行效率。

1.2 Haar和HOG方法

1.3 融合Haar特征和HOG特征的人臉檢測


2 實驗結果與分析
2.1 實驗數據集

2.2 實驗步驟
2.3 最優奇異值占比的確定


2.4 不同方法的人臉檢測結果與分析


3 結 論