張朋 溫宏愿
摘要: 針對密集人群環境中行人相互遮擋造成人數難以準確統計問題,提出了一種基于混合高斯模型和圖像紋理特征提取的人數密度統計方法。首先通過混合高斯建模提取前景圖像,其次通過線性內插權重來進行透視矯正,最后通過構造和提取能量、對比度、熵和相關性四個特征參數進行人數統計。結果表明在不同的測試環境下系統的準確率在90%以上,達到人群密度監控的基本要求。
Abstract: In view of the difficulty of accurately counting the number of pedestrians in dense crowd environment, this paper proposes a population density statistics method based on Gaussian mixture model and image texture feature extraction. Firstly, the foreground image is extracted by means of Gaussian mixture modeling. Secondly, the orthographic correction is performed by linear interpolation weights. Finally, the population statistics are constructed by constructing and extracting the four characteristic parameters of energy, contrast, entropy and correlation. The results show that the accuracy of the system is more than 90% in different test environment, to achieve the basic requirements of population density monitoring.
關鍵詞: 人群密度估計;特征向量;混合高斯建模;透視矯正
Key words: population density estimation;eigenvector;mixed Gaussian modeling;orthographic correction
中圖分類號:TP391.4 文獻標識碼:A 文章編號:1006-4311(2018)10-0235-02
隨著視頻監控技術的快速發展,采用視頻圖像處理技術可以為公共場所如:車站、商場、公園等大型提供人群密度估計,為安全管理及社會經濟效益提供準確的數據依據。人群密度估計系統包括視頻采集、圖像預處理、前景圖像提取、圖像透視矯正以及圖像特征參數提取,最后通過特征參數估計出人群密度及人數。
人數密度統計系統采用混合高斯模型建模的方法提前前景像素,由于圖像從三維空間轉換到二維空間后存在圖像畸變情況,需要進行透視矯正后才能對前景圖像進行紋理特征提取,最后根據特征量進行場景人數密度估計。
1.1 圖像前景提取
攝像機采集到的圖像首先需要進行圖像預處理然后才能夠進行圖像前景提取。圖像前景提取就是將視頻圖像中有效變化的像素提取出來。但是現場視頻采集過中,存在各種背景的因素的干擾,如:隨著時間的變化光照角度及強度不斷變化、隨風擺動的樹枝或波光粼粼的水面等。這些看似是靜止的背景因素在圖像前景提取過程中都會造成不同程度的影響。針對上述背景的微小變化,本文提出了采用混合高斯模型進行圖像前景的提取。
混合高斯建模是一種密度分布模型,是在圖像采集過程中對每一幀圖像中的某一個像素按時間序列進行概率統計,其分布模型由K個高斯模型組成。假設某一位置的像素在一段時間內像素值為{X1,X2,…Xt},則由式(1)可以計算出某一個時刻該像素值概率為:
式(5)中B表示背景圖像,T表示閾值,K個高斯分布中的K值大小由T來決定。在進行前景提取時,若新采集的像素值Xt不能夠與系統中的所有高斯分布匹配,則這個像素值屬于前景像素,反之則屬于背景像素。
1.2 構造特征向量
經過前景圖像的提取,并對前景圖像進行透視矯正后,就可以對前景圖像進行特征提取了。
在紋理特征提取中通常采用灰度共生矩陣的方法。灰度共生矩陣的主要優點是能夠減小人群相互遮擋對統計統計造成的影響,對高密度人群的檢測較為敏感。
在紋理特征提取過程中,一般不會直接采用灰度共生矩陣的數據,而是通過構建特征向量來處理共生矩陣產生的數據最后通過依據特征向量的數據來估計人群密度及人數。構建的特征向量主要是以下四個:
通過相關性的大小來反應前景圖像中像素的變化情況,若相鄰像素的數值變化較小,則相關性值較大。
通過選擇實際測量環境來驗證系統的實際應用情況,首先根據實際應用環境的情況將人群密度設定為三個等級,低密度人群、中密度人群和高密度人群。硬件平臺為華碩I7-6700HQ,軟件平臺為MatlabR2015a。圖像選擇的是我校教學樓一側的通道處,圖像的視頻大小格式為1280*720像素,幀率為30幀/秒。在視頻圖像預處理后,通過混合高斯模型和紋理特征對前景圖像進行特征提取。通過選擇第25幀圖像,第12198幀圖像,第55678幀圖像為例進行人數統計。

表1是基于紋理分析的人群密度估計訓練樣本估計結果,查全率均在93%以上;表2是基于紋理分析的人群密度估計測試樣本估計結果,查全率均在90%以上。由仿真結果可得,基于問題分析的人群密度估計算法的查全率在90%以上,已達到算法設計的要求。
從測試結果可以看出,基于混合高斯模型和紋理特征提取的人數統計方法,達到了人群密度監控的基本要求,系統的整體性能良好。
由于通過基于混合高斯模型和紋理特征提取的人數統計方法,在處理過程中只是對提取的像素進行處理,并通過測試訓練來估算出人數。大大減少了系統的處理資源,提高的系統的處理效率。從表2的測試結果可以看出,系統的三種不同人群密度的環境下測試結果都在90%以上,特別在中等密度人群時系統的準確率達到96.67%,系統達到了人群密度監控的基本要求。但是在低密度人群和高密度人群時系統的準確率出現下降。對于這種問題將是我們后期研究的重點。
[1]黃璐,林燕.一種基于視頻的車站人群密度估計算法[J].計算機時代,2012(7):23-25.
[2]蘇航,鄭世寶,楊華.視頻監控中人群流量和密度估計算法分析[J].電視技術,2009(11):100-103.
[3]任慶云.智能視頻監控中的人群密度估計方法[D].河北師范大學,2011.
[4]覃勛輝,王修飛,周曦,等.多種人群密度場景下的人群計數[J].中國圖象圖形學報,2013,18(4):392-398.
[5]駱云志,劉治紅.視頻監控技術發展綜述[J].兵工自動化,2009,28(1):1-3.
[6]李寅,王貴錦,林行剛.結合局部和全局特征的人群密度估計算法[J].清華大學學報(自然科學版),2013,53(4):542-545.
[7]羅維薇,王陽萍,翟鳳文.基于混合高斯背景建模的交 通視頻運動目標檢測[J].蘭州交通大學學報,2014,33(4):26-29.