孫瑞陽 孫玉濱 段煉 趙藍飛



【摘要】? ? 本文提出一種非監督武術競賽場地分割算法。首先通過高斯混合模型,對武術競賽場地進行建模;其次通過期望最大算法對高斯混合模型的參數進行最優估計并得到多個候選閾值;最后通過凸包算法對候選閾值進行篩選并最終確定武術競賽區域。實驗結果驗證本文算法可以較為準確的分割武術競賽場地。
【關鍵詞】? ? 武術競賽場地分割? ? 高斯混合模型? ? 期望最大? ? 凸包
Abstract:? This paper proposes an unsupervised Wushu competition field segmentation algorithm. Firstly, Gaussian mixture model is employed to modeling Wushu competition filed. Secondly, the parameters of Gaussian mixture model are optimally estimated and several candidate thresholds are obtained by expectation maximum algorithm. Finally, those candidate thresholds are filtered and the Wushu competition is segmented by convex hull algorithm. Experimental results demonstrated that the proposed algorithm has an accurate effect on Wushu competition field segmentation.
Keywords:? Wushu competition field segm
引言
近年來隨著數字圖像處理技術的不斷進步,體育競賽中融入了很多智能圖像處理技術,例如運動員姿態估計,運動員目標檢測與跟蹤,運動員姿態識別以及運動員動作自動評分[1~3]。由于競賽場地分割有助于提升運動目標檢測、姿態識別、動作評分的準確度,因此這一技術成為近年來學術界研究的熱點問題。
典型的競賽場地分割算法包括:殷偉良等[4]提出的基于Hough直線檢測和最小二乘擬合的自動場地檢測算法。張龍飛等[5]提出的基于Canny算子和數學形態學方法的競賽場地分割算法。Hung等[6]提出的基于顏色特征的廣義競賽場地分割算法。Homayounfar等[7]提出的基于深度結構模型的體育場地定位算法。
盡管這些算法能夠分割出競賽區域,但是場地分割結果存在漏分割或錯分割等現象,另外到目前為止仍然沒有一個針對武術競賽場地分割算法。為了準確對武術競賽區域進行分割,本文提出一種非監督武術競賽場地分割算法。該算法根據武術競賽場地的特點利用顏色作為數字特征,通過高斯混合模型[8](Gaussian Mixture Model, GMM)對武術競賽圖像進行建模。
通過期望最大(Expectation Maximization, EM)算法[9]對GMM模型的未知參數進行非監督式最優估計。通過基于Jarvis步進法的凸包最優算法[10]對武術競賽區域進行最優分割。實驗結果驗證本文算法可以有效地分割武術競賽區域,準確率,召回率,交并比均高于同類算法。
一、本文算法
1.1? 基于GMM模型的建模算法
假設R,G,B分別表示圖像的紅、綠、藍三通道的灰度數組,由于武術競賽場地主要由藍色色調構成,因此為了分割武術競賽場地本文采用如式(1)所示的色調特征用于區分某一像素是否屬于競賽場地區域。
其中i, j分別表示該像素的橫、縱坐標,x表示色調特征隨機變量X的一組觀測值。令隨機變量X的概率密度函數由K個含有未知參數的高斯函數進行加權,則X的概率密度函數如式(2)所示:
式中是未知高斯函數的參數集,μ、σ分別對應高斯函數的均值和標準差,隱變量表示樣本xi, j來自哪一個高斯分布,α代表高斯模型的權重。
1.2? 基于EM算法的參數估計算法
未知參數集θ的最大似然估計如式(3)所示:
1)隨機選擇迭代參數初始值θ(0);
2)令第l次迭代對應的未知參數集θ值為θ(l),計算后驗概率分布Q(l),令表示高斯分布概率密度函數,則Q(l)的計算方法如式(5)所示:
3)計算第l+1次迭代θ的初值為θ(l+1),其計算方法如式(6)所示:
4)重復步驟2)和步驟3)直到迭代收斂,此時得到對于未知參數的最優估計。
1.3? 確定候選閾值
假設通過GMM模型和EM算法將特征值概率密度擬合為K個高斯分布,由于每兩個高斯分布之間必存在一個交點,因此K個高斯分布存在個交點。令這些交點對應的特征值可以表示為。
由于每個交點代表不同的圖像區域出現的概率轉換點,因此本文選用這些特征值的交點作為分割武術競賽區域的候選閾值,即對于第k個候選閾值來說,樣本xi, j屬于競賽區域的條件是xi, j≥tk。
1.4? 基于凸包算法的區域分割算法
由于存在多個閾值候選點,每個閾值候選點都有其對應的分割區域。即使采用最優的閾值進行圖像分割,也會產生過分割或者漏分割像素點。因此本文采用基于Jarvis步進法的凸包最優算法用于篩選候選點并準確地分割武術場地區域。
二、 實驗結果與分析
本文通過Matlab2016a對算法進行仿真驗證。實驗采用的硬件平臺處理器是i5-10210U,內存16G,顯卡MX250。實驗部分對比Hung算法,Homayounfar算法以及本文算法。各算法對于場景一的分割結果如圖1所示。
由圖1可知Hung算法的錯分割現象比較嚴重,除武術競賽場地區域外,Hung算法將與競賽場地區域亮度、色彩相近的區域也劃歸競賽場地區域;雖然Homayounfar算法能夠改善錯分割現象,但是該算法在競賽區域邊界的分割效果不理想,部分非邊界像素被劃入到競賽區域;通過本文算法分割出的區域與真實的武術競賽區域重合度非常高,因此本文算法的精度高于前兩種算法。
表1對比了兩個場景下競賽場地分割結果對應的準確率、召回率、交并比[12]。
由表1可以各算法的客觀評價指標與如圖2所示的圖像分割效果基本保持一致。因此本文算法可以有效地分割武術競賽場地區域,且分割的精確度較高。
三、結論
本文提出一種非監督武術競賽場地分割算法,該算法通過GMM模型對武術競賽區域進行建模,通過EM算法對GMM模型的未知參數進行最優估計,通過基于Jarvis步進法的凸包最優算法對候選閾值以及凸包區域進行篩選,進而篩選出最優的武術競賽區域。實驗結果表明本文算法能夠有效地分割武術競賽區域。
參? 考? 文? 獻
[1] Zhang F, Zhu X, Ye M. Fast human pose estimation[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2019: 3517-3526.
[2] Buri? M, Pobar M, Iva?i?-Kos M. Object detection in sports videos[C]//2018 41st International Convention on Information and Communication Technology, Electronics and Microelectronics, 2018: 1034-1039.
[3] Merler M, Mac K N C, Joshi D, et al. Automatic curation of sports highlights using multimodal excitement features[J]. IEEE Transactions on Multimedia, 2018, 21(5): 1147-1160.
[4]殷偉良, 陳臨強, 李偉. 體育視頻中場地自動檢測方法[J]. 計算機系統應用, 2012, 21(5): 184-188.
[5]張龍飛, 曹元大, 張明杰, 等.體育視頻中的對象檢測與分割[J]. 計算機工程, 2006(03): 229-230+239
[6] Hung M H, Hsieh C H, Kuo C M, et al. Generalized playfield segmentation of sport videos using color features[J]. Pattern Recognition Letters, 2011, 32(7): 987-1000.
[7] Homayounfar N, Fidler S, Urtasun R. Sports field localization via deep structured models[J]. 2017 IEEE Conference on Computer Vision and Pattern Recognition, 2017: 4012-4020.
[8] McLachlan G J, Rathnayake S. On the number of components in a Gaussian mixture model[J]. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 2014, 4(5): 341-355.
[9] Do C B, Batzoglou S. What is the expectation maximization algorithm?[J]. Nature Biotechnology, 2008, 26(8): 897-899.
[10]Wilderjans T F , Ceulemans E , Meers K . Multichull: A generic convex-hull-based model selection method[J]. Behavior Research Methods, 2017, 45(1):1-15.
[11] Gonzalez R C, Woods R E. Digital image processing [M]. 3nd ed. Beijing: Publishing House of Electronics Industry, 2017: 497-502.
[12]Zaitoun N M, Aqel M J. Survey on image segmentation techniques[J]. Procedia Computer Science, 2015, 65: 797-806.