王金洋
基于混合高斯模型的運動目標跟蹤算法
王金洋

王金洋 余紅英 樊永生
中北大學計算機與控制工程學院

視頻幀序列中實時運動目標分割的一般方法是背景差分或者是對于背景圖與當前幀的閾值公差。不同的方法之間的區別在于對于背景圖的建模和模型的更新策略。本文討論對每個像素進行混合高斯模型建模和使用在線近似的方法更新模型。自適應混合高斯模型的分布用來評估決定哪些像素點最有可能來自背景處理過程。每個像素點根據最有效代表它的高斯分布是否為背景模型的一部分進行分類。本文最后得到一個穩定、實時并且對于輕微變化不敏感和長時間的場景變化的跟蹤器,滿足24h×7的基本工業要求。
過去較低的計算能力限制了復雜的、實時性的視頻處理應用,導致許多機器視覺系統實時性太差難以投入實用或者對于實際的工況過多的限制條件。近年來隨著硬件計算能力的提升,研發人員越來越多的考慮采用更加復雜、健壯的數學模型完成流數據的實時分析。在安防領域,一個健壯的系統不能過度依賴攝像機安裝位置,而應該對出現在場景中的目標具有自適應性并且對于光照效果不能要求苛刻。它應該有能力處理來自于工作區域、視場目標重疊、陰影、光線變化條件下的各種目標運動信息。
一般方法中對于某個高斯分布中的像素數值全部進行建模,而本文僅對作為混合高斯模型的特定像素點進行建模?;诨旌细咚狗植贾忻總€高斯函數的持續性和變化性,我們獲取某個對于背景模型顏色反應最強的分布。不符合背景高斯模型的像素值被劃歸為前景,直至存在某個分布對于該像素點具有充分的和持續性的概率判斷才將其劃歸為背景模型點。
在線混合模型中,我們稱在一定時間段上的特定像素為一個像素過程,所以像素過程是對應于一串時間序列的像素值,例如灰度圖像的梯度和彩色圖像的向量。在任何時間點,t對應于一個特定的像素點{x0,y0},有下式,其中I代表視頻幀序列:
每個像素點的值代表它自身與其沿光流通路所接觸的第一個目標的一種度量,假如背景和光照是靜態的則其值是相對常量。而采樣過程中存在的獨立的高斯噪音,其密度函數可以由均值的高斯分布來描述。一般來說對于背景模型的支持要有大量的數據,但是不同目標的顏色值往往是不同的。針對每個像素點的前幾幀數值{X1,…Xt},我們采用K個高斯分布進行建模,可以得到當前像素點的概率值為:

其中,K為高斯分布的數量,Wi,t為第i個高斯分布在時間t的權重系數估計值,Ui,t為第i個高斯分布在時刻t的均值,sum(i,t)是第i個高斯分布在時刻t的方差,u為高斯概率密度函數:


其中K由計算機可用的內存量和計算能力決定,取值范圍3~5。另外由于計算的原因,協方差矩陣采用如下的形式:

這樣存在一個前提是RGB三色具有獨立的數值并且具有相同的方差,但是這個前提在實際中不一定總存在,這樣就使得我們做一個相當耗費CPU的矩陣求反從而喪失了精度。
當每個像素點對應的混合高斯模型參數變化時,我們想要得知哪個高斯分布最優可能是背景過程產生的,這個問題轉化為尋找一個可能性最大而且方差最小的高斯分布。當一個新的目標出現在視場中時,一般來說它與當前的分布是不匹配的,而解決辦法有兩種,其一是建立一個新的分布,其二是增大現有分布的方差值,并且運動目標的方差值要比背景模型的方差值大,直至運動目標停止。為了對此過程建模,首先對高斯分布進行編碼,在對混合高斯模型的參數進行重新近似之后,就很容易將最大可能分布從背景模型分布中分離出來,因為只有匹配到的數值發生了改變。這樣的對分布進行排序是一種有效的,端部開放的列表,其中最大可能的背景模型分布在頂部,這樣背景模型的近似就可以用下式表達:

其中,T為背景模型中符合匹配規則的像素點數目。如果T值選擇的較小,背景模型的高斯分布往往是單峰的,也即一般頂部的分布為最大近似分布;如果T的值選擇的比較大,則算法對于微小且長時間的視場變化會敏感,例如旗幟的飄動,水波等等,會形成背景混合高斯模型的多峰分布。
在一臺SGI O2配置為R10000的計算機上,算法可以處理的幀速為11-13FPS(幀尺寸為160*120),另外幀速與前景中運動目標數量也有關系。我們的跟蹤算法系統可以可靠地存儲5路視場信息,而隨著計算機性能的提升和并行性技術的研究,該系統算法可以在大尺寸圖像、采用大量高斯函數的背景模型條件下進一步提升幀速率和精確度。而對全相關矩陣的計算和每個高斯分布的近似可以提升算法的健壯性和精確度。
10.3969/j.issn.1001-8972.2015.02.031