李虎,張二虎,段敬紅
LI Hu , ZHANG Erhu, DUAN Jinghong
(西安理工大學信息科學系,西安 710048,中國)
(Department of Information Science, Xi'an University of Technology, Xi’an 710048, China)
現代社會的快速發展,使得大規模的人群活動日益增多,特別是在一些重大活動中,由人群擁擠而引起的災難屢見不鮮。因此,對人群人數進行統計具有重要的研究意義。另外,人群人數統計也可用于商場等人群管理領域,以協助管理層進行有效的管理;在車站等設施的出入通道進行人群人數統計,可實時得到旅客的數量及區域分布情況,為科學調度和安全管理等提供重要的依據。
人群人數統計算法可以分為兩類。一類是基于人體分割的人數統計,它通過利用視頻或圖像當中人的形狀、顏色和運動信息來實現人的分割和識別,進而達到人數統計的目的。如 Sidenbladh[1]利用人體運動的光流信息,Gonzalez[2]利用了 KLT特征,Bradsk 和 Davisal[3]利用運動梯度信息實現人體分割。總體來說,由于人體姿態、攝像機的視角、光照條件和背景條件的影響,分割問題變得非常復雜。另一類是基于統計回歸的人數統計算法。1995年英國的Davies等人[4]提出了一種基于人群人數與人群前景像素數成線性關系的方法來估計人數。該方法簡單易行,但誤差率依然會隨著人數的增多而顯著增大。近年來,部分學者開始嘗試采用統計回歸方式進行人數統計。Chan[5]將人群的流量近似為一個高斯過程,通過提取人群的分割特征信息和紋理特征信息,建立回歸模型。但在眾多的分割特征和紋理特征中,哪些特征建立的模型能更接近實際,目前的研究都是對這兩類特征分開進行的,尚沒有一個很好的理論基礎。本文通過對這一問題的分析,將分割特征信息和紋理特征信息結合在一起,通過PCA降維技術實現二者特征的有效融合。在回歸模型方面,本文首先采用多元線性回歸模型,得到特征量和人群人數之間關系的趨勢方向,然后利用在該方向上進行高斯回歸,提高了回歸的精度。
本文算法主要是通過主成分分析(PCA)和多元統計回歸模型相結合。首先,在特征提取階段,主要提取人群圖像的分割特征(包括:分割前景面積、前景周長和周長面積比率)和人群圖像的紋理特征。然后,應用主成分分析(PCA)對特征數據進行降維處理,以達到對數據進行壓縮同時又最大程度地保持原有數據信息的目的。最后,建立多元線性回歸模型,以確定特征量和人群人數之間關系的趨勢方向,通過回歸出的趨勢方向,對高斯過程回歸模型進行修正。圖1為本文算法框架圖。

圖1 本文算法流程圖Fig.1 The flow chart of the proposed algorithm
2.1.1 分割特征提取
首先采用高斯混合模型對人群視頻圖像進行背景建模,然后采用背景減除技術獲取人群前景圖像,進一步通過3C模型[6]消除檢測出的人群陰影并通過形態學運算去除一些較小的孤立噪聲點,以此獲得最終的人群前景圖像。在人群前景圖像的基礎上,通過Canny邊緣檢測獲得人群邊緣圖像。具體的處理結果如圖2所示。

圖2 人群背景建模及前景提取Fig.2 Crowd background modeling and foreground extraction
在圖2基礎上,提取的分割特征有:
1)人群前景面積:統計如圖2(c)中白色像素點的個數;
2)人群前景周長:統計如圖2(d)中白色的邊緣像素點個數;
3)周長面積比率:人群前景周長和面積的比值,此特征能夠測量人群前景的形狀復雜度,能夠很好的反映因人群遮擋而產生的人數變化。
2.1.2 紋理特征提取
Marana等人[7]的研究表明,不同密度的人群圖像對應的紋理模式不同,高密度的人群在紋理上表現為細模式,低密度的人群在紋理上表現為粗模式。因此,紋理特征是人群人數估計的重要特征之一。
本文提取紋理特征采用灰度共生矩陣GLCM(Gray Level Co-occurrence Matrix),它是計算一幅圖像在某一方向上相距某一距離的兩點具有相同強度的概率矩陣。從這個概率矩陣可以導出一些描述紋理特征的統計學參數。本文分別從0°、45°、90°、135°四個方向的灰度共生矩陣中分別提取對比度、熵、能量、同質性和灰度相關統計參數,共計 20個特征,作為紋理特征。設灰度共生矩陣為,則:

2.1.3 PCA降維
PCA可以有效的找出數據中最“主要”的元素和結構,去除噪音和冗余,將原有的復雜數據降維,揭示隱藏在復雜數據背后的簡單結構。本文將3個分割特征和20個紋理特征,共計23個特征串聯起來,然后采用PCA技術對該特征集進行降維處理,找出特征數據中最“主要”的元素和結構,去除噪音和冗余,供回歸模型使用。
統計回歸是人群人數統計的關鍵步驟,常用的統計歸回方法有基于SVM回歸、基于BP神經網絡回歸、多元線性回歸和高斯過程回歸等。本文采用高斯過程回歸,下面對其進行簡述[8]。
(1) 回歸模型
為輸出數據,人們希望能夠學習之間的響應關系,即學習一個函數:

使其滿足:

對于非線性回歸,常采用映射φ,φ:RNH ,H是一個內積空間。所以有:

如果ω假定一個先驗概率N(0,I),且假設ε是 N(0,σ2I),那么 f和y都是高斯過程。其均值和方差計算如下:

令K=φTφ,則其每個元素為即為核函數。于是高斯過程回歸模型可以表示為:

(2) 預測
預測是指給定一個輸入值x,要求相應的預測值 y*,即希望估算概率,其中,X=[x1, x2,.....,xn]為觀測到的樣本輸入向量,Y=[y1,y2,……,yn]為相應的觀測輸出值向量。由式(11)可得到:

這里k(X, x)=k(x, X)T=[k(x, x1),.....k(x, xn)]T。令K=k(X, X),根據高斯分布的性質可以得到:

y*的估算值:

(3)核函數的選取
高斯過程模型的性質完全由核函數決定。常用的核函數有線性核函數、多項式核函數、高斯核函數、基于表征周期函數的周期核函數等。由于人群人數統計模型是一個平穩過程,因此這里選取高斯核函數(高斯核函數為平穩核函數)。

則由式(11)、(15)可以看出高斯模型中有三個未知參數,對于這三個未知參數可選用極大似然估計算法來求取。
基于高斯過程回歸的人群人數統計算法認為人群人數序列是一個有無限長度的隨機過程,而其任意有限長度的子序列符合高斯分布,其均值為0。但實際中人群人數序列并不是服從均值為0的高斯過程分布,而是在一個主方向上波動。如圖3所示是多幅圖像中人群人數和人群前景周長的關系圖,從圖中可以看出人群人數和人群前景周長之間的關系是在一定方向上的高斯過程。為此,本文提出基于多元線性回歸方向的高斯過程回歸方法,即先采用多元線性回歸確定出該方向,然后在該方向上進行高斯回歸。

圖3 人群人數與邊緣像素關系圖Fig.3 The relation between crowd count and the number of edge pixel
設PCA降維后的人群前景分割特征和紋理特征向量為 Xp=[xp1,xp2,…,xpn],Yr為手工標定的實際人數,Yml為多元線性回歸結果,Yg為高斯過程回歸的結果,Yc=Yr-Yml。則本文算法為:
(1)建立多元線性回歸模型Yml=fmlr(Xp),用Yr和Xp訓練該模型,以確定特征向量和人群人數之間關系的趨勢方向;
(2)建立高斯過程回歸模型Yg=fGpr(Xp),用Yc和Xp訓練該模型;
(3)由于步驟(2)中的高斯回歸模型是用手工標定出來的實際人群人數Yr和多元線性回歸結果Yml的之差Yc來進行回歸的,因此在實際應用時,回歸出來的結果Yg表示估計出來的人群人數和多元線性回歸之差,即由此可得到估計的人群人數為:

圖4(a)是本文通過人群人數和人群前景周長建立的多元線性回歸模型,圖4(b)是應用本文算法對人群人數和人群前景周長建立的回歸模型。

圖4 本文算法的模型實驗結果Fig.4 The experimental result of the proposed model
本實驗所用的人群數據集來自文獻[5],視頻拍攝于圣地牙哥加州大學(University of California,San Diego,簡稱UCSD)一條人行道上的一個靜止的攝像頭。圖5給出了其中的兩幅人群圖像。

圖5 人群數據圖像Fig.5 The samples of the crowd image
實驗結果用兩個指標量度:平均絕對誤差(Absolute Mean Error)和均方差(Mean Squared Error)。假設人數的真實數據為p(i)i=1,2,···,n ,估計數據是 y(i)i=1,2,···,n,則平均絕對誤差ErrT和均方差MSE的計算公式為:

在UCSD視頻集上測試本文提出的方法的性能。從UCSD中隨機抽取1700幅圖像,手工標定出圖像當中的人數。首先,用前1000幅圖像來對本文算法進行模型訓練;然后,用其余700幅來對模型進行測試,并通過式(17)和式(18)來進行模型的評價。表1為本文在UCSD視頻集上實現對各種算法的實驗評價。

表1 模型評價結果Tab.1 The evaluation results of the proposed model
圖6給出了測試用的700幅圖像中手工標定出的實際人數和估計出的人數的實驗結果,其中紅點代表實際人數,綠點代表估計人數。

圖6 估計人數與標定的實際人數對比圖Fig.6 The comparison of the estimated people number and the real number
從表1可得出以下結論:(1)應用PCA降維后的特征,使得兩種統計模型的ErrT值和MSE值都有明顯的降低,可見用PCA降維后的特征量表述能力更強,區分度更高;(2)由于本文算法是多元線性和高斯回歸的結果之和,因此在本文的算法中使用PCA降維應具有更好的效果;(3)本文算法的ErrT值和MSE值最低,相比之下更能準確的統計人群人數,說明本文算法是有效的。另外從圖6也可看出,手工標定出的實際值和本文算法估計值非常接近,大部分誤差基本在1到3之間。
本文通過分析多種人群特征以及其在高斯過程回歸和多元線性回歸兩種回歸算法下的實驗數據,提出了結合分割特征和紋理特征相結合,通過PCA降維提取人群人數特征的方法,進一步通過多元線性回歸和高斯過程回歸相結合的人群人數估計方法。實驗證明,本文所提出的方法能夠更加準確地估計人群人數。
[1]Hedvig Sidenbladh Michael J.Black.Learning image statistics for Bayesian tracking [C].Proceedings of Eighth IEEE International Conference on Computer Vision, 2001, Vol.2:709-716
[2]J J Gonzalez, I S Limis, P Fua , D Thalmann.Robust tracking and segmentation of human motion in an image sequence [C].Proceedings of 2003 IEEE International Conference on Acoustics,Speech,and Signal Processing, 2003, Vol.3:29-32
[3]A F Bobick , J W Davis.The representation and recognition of action using temporal templates[C].Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, 1997
[4]Davies A C, Jia Hong Yin, Velastin S A.Crowd monitoring using image processing [J].Electronics & Communication Engineering Journal, 1995, 7(1):37-47.
[5]Antoni B.Chan, Zhang-Sheng John, Liang Nuno Vasconcelos.Privacy Preserving Crowd Monitoring:Counting People without People Models or Tracking [C].In IEEE Conference on Computer Vision and Pattern Recognition, Anchorage, 2008
[6]E Salvador, A Cavallaro, T Ebrahhimi.Shadow Identification and Classification Using Invariant Color Models [C].IEEE,2001, 3:1545-1548
[7]Marana A N, Costa L F, Lotufo R A, Velastin S A.On the efficacy of texture analysis for crowd monitoring [C].Processding s of IEEE Conference on Computer Graphics, Image Processing and Vision, 1998:354-361
[8]沈赟.基于高斯過程的時間序列分析[D].上海:上海交通大學,2009