韓美林
(商洛學院 電子信息與電氣工程學院,陜西商洛 726000)
隨著視頻技術的不斷進步,體育視頻數據急劇增加,但無論對觀眾還是運動員或教練都重點關注視頻中的一小部分,所以對于體育視頻中關鍵幀或運動員關鍵姿態的檢測非常重要[1]。目前對于體育運動員在比賽中的表現大多都是通過觀看體育視頻來實現,這無疑耗時又耗力。而目標檢測技術和深度學習技術為解決這一問題提供了新的思路,將其應用到舉重運動員關鍵姿態檢測,高效的提取體育視頻中舉重運動員關鍵姿態檢測,不僅可以帶來更好的體育視頻觀賞效果,還可以更好地輔助運動員的訓練[2]。
目標檢測法中基于像素點背景建模與更新的背景減除法具有計算簡單、實時性好的特點被廣泛使用,但由于學習時間長、運算速度慢、并且當攝像機抖動時目標檢測效果差等缺點[3],本文對檢測算法進行改進。主要針對原算法容易受到復雜背景干擾的問題,如舉重視頻中可能出現其他工作人員或設備,所以需要利用空間相關性對背景進行初始化和背景更新以提高檢測的準確率。整個目標檢測可以分為運動前景檢測和運動行人檢測兩部分,算法組成框圖如圖1 所示。

圖1 基于視頻監控中行為人目標檢測算法
采用基于像素塊的最小差分和算法對背景初始化,利用基于像素塊的信息熵估算法對背景模型選擇性更新,通過最小類間方差法求自適應閾值,并將該閾值應用于背景減除法求出二值圖像,即為運動前景的檢測結果[4];然后通過對運動前景圖像采用掃描連通域標記算法提取其運動區域游程信息和特征信息進行運動行人檢測[5]。
在圖像的智能監控領域,人體檢測只是處理的第一步,第二步是人體目標的特征提取,第三步是人體目標識別與驗證。其中人體目標特征提取是最關鍵的一步,它主要通過邊緣檢測技術來分離人體目標,進而根據邊緣特征來完成目標的特征提取,最終完成人體姿態的識別和分類[6]。
本文通過分析舉重運動員申膝、引膝、發力、最高點四種人體姿態特征,提取了8 種特征量,建立了人體姿態特征模型,模型各特征量具體如表1 所示。

表1 人體姿態特征模型
BP 算法雖然預測的通用性較好、精度高,但在應用中仍存在不少缺陷,比如隱含層數和隱含層節點數難以確定,收斂速度太慢等。因此,BP 算法被不斷地改進應用。針對體育視頻圖像中關鍵姿態研究,本文中神經網絡的訓練函數采用L-M 學習規則,動量法作為參數[7]。
3.2.1 BP 神經網絡的訓練策略
1)BP 網絡結構的確定
多數情況下,在不確定隱層數及節點的情況下,訓練從單隱層的BP 網絡即可。本文傳遞函數使用tansig,輸出層使用purelin 函數。隱含層節點數數量過多,會導致訓練時間過長、收斂速度慢、測試誤差增加等問題,而數量過少,訓練結果的正確性無法保證[8]。因此本文使用單隱層,逐漸增加節點數,最終達到學習誤差小于給定閾值的目的。
2)誤差的選取
為了克服傳統BP 算法中迭代誤差的缺陷本文選取均方誤差MSE[9]。
3.2.2 BP 神經網絡分類器的訓練過程
BP 神經網絡分類器的訓練流程圖如圖2 所示[10]。

圖2 BP 神經網絡分類器的訓練流程圖

圖3 BP 神經網絡分類器測試過程
1)確定BP 神經網絡的結構以及初始化。本文的姿態識別算法屬于分類問題,所以需要一個隱含層,人體姿態數據經過特征提取之后為8維,本文中需要識別的姿態共有4 種,因此BP 神經網絡的結構為8-10-4;然后完成對權值的初始化,最后給定學習速率和神經元激勵函數。2)隱含層輸出計算、輸出層輸出計算。3)誤差計算和權值更新。4)判斷訓練是否結束:如果將所有輸入樣本訓練,則算法結束;否,返回到步驟2。
3.2.3 BP 神經網絡分類器測試過程
BP 神經網絡分類器測試流程如圖3 所示[11]。
1)輸入測試樣本:將測試樣本庫里面的姿態數據輸入網絡。2)隱含層輸出計算、輸出層輸出計算。3)判斷測試是否結束:如果將所有輸入測試訓練,則測試結束;否則返回到步驟1。4)給出姿態識別整體結果和識別的正確率。
為了驗證算法的魯棒性采集不同姿態,分別是申膝、引膝、發力、最高點各100 個樣本,BP 神經網絡模型建立完成后,分別對四種姿態進行識別與分類。仿真結果如圖4、圖5、圖6、圖7 所示。

圖4 舉重運動員申膝姿態檢測

圖5 舉重運動員引膝姿態檢測

圖6 舉重運動員發力姿態檢測

圖7 舉重運動員最高點姿態檢測
最后,針對四種人體姿態利用攝像頭分別采集200 幀測試圖片,用于BP 網絡模型的人體姿態識別的統計分析,結果如表2所示。

表2 人體姿態識別結果
從表2 可以看出,申膝、引膝和發力的人體姿態識別率稍低,分別是95%、95.5%、96.5%。主要原因在于識別過程中有外界的干擾,比如鏡頭內突然有運動員之外的人員出現,或者申膝和引膝是非常相似的連續動作所引起的誤判。最高點姿態識別率較高,達98.50%,檢測效果相對比較準確。
本文面向舉重運動視頻,完成了基于BP 神經網絡的體育視頻關鍵姿態檢測,姿態識別部分采用了BP 神經網絡,通過深度學習的方法建立能夠表達圖像信息的特征參數,本文對舉重運動中四個關鍵姿態進行了識別,經仿真表明,人體姿態識別率較高。在今后的學習和工作中,還需要不斷優化算法,研究出高效且適應范圍更廣的人體姿態研究算法。