章明星
本文在對人體運動跟蹤方法及視覺運動捕捉技術難點進行分析的基礎上,提出了精確度更高的視覺捕捉系統設計方案,能夠取得良好的效果。
目前,在人體運動分析領域和攝像領域,視覺捕捉技術有著十分廣泛的應用范圍,是當前研究的熱點課題之一。在視覺捕捉系統的支持下,該技術能夠對運動中的物體進行跟蹤定位,從而獲得其三維運動軌跡,并通過數字解析過程,實現對運動過程的捕捉。運用視覺捕捉技術,能夠對物體的運動特診進行準確把握,得出其在三維空間內特定參數,從而了解到精確的運動狀況。在以計算機圖形學為理論基礎的同時,在空間內設置多個相關技術設備,用于對運動物體的跟蹤,最終以圖形的形式,將運動狀況加以記錄,所得到的運動信息較為不容易失真,因而在攝像技術中能夠有良好的應用前景。
人體運動跟蹤方法
為了完成人體運動分析,首先要做到科學的跟蹤定位,對于連續的圖像幀,互相之間應具備相匹配的特征,主要包括運動方向、速度、形態及方位等,這樣才能獲得完整的運動數據。在運動跟蹤的方案設計上,應用較廣泛的數學模型有動態貝葉斯網絡,卡爾曼濾波,以及粒子濾波等方法。由于跟蹤定位的對象各不相同,根據其各自的特征,可分別采用模型跟蹤方法,區域跟蹤方法,活動輪廓線跟蹤方法,特征跟蹤方法等[1]。 如果使用模型跟蹤法,在人體運動目標的表達上,傳統的處理手段有三種,即圖模型、二維模型以及三維模型;如果使用區域跟蹤方法,則需考慮整體跟蹤和局部跟蹤的不同;如果使用活動輪廓線跟蹤方法,在運動目標的表達上,主要手段為封閉的曲線范圍,隨著目標的移動變化,這一封閉的曲線范圍可進行自動更新。在最新的范圍曲線跟蹤算法當中,首先確定空間(x,y,t),然后構造一個曲面,并對初始曲線進行設置,此時曲線應為水平方向,得到關于該曲線的能量函數,包圍移動體區域,此時運動目標的運動變化,能夠反映到能量函數的曲線上,當運動目標區達到最小時,函數曲線將靠近運動目標區,實現對運動目標的跟蹤定位;如果使用特征跟蹤法,首先應完成特征提取,然后再進行特征匹配,從靜態圖像當中,可提取相應的人體特征,而在序列圖像之間,可對這些特征進行匹配,實現完整的跟蹤過程。
視覺運動捕捉技術難點
目前,視覺運動捕捉技術的應用仍然存在較多的難點,盡管視覺捕捉技術的研究工作始終熱度不減,對視頻運動的分析也越來越深入,但從取得的開發成果來觀察,由于多種客觀因素的作用,在掌握人體運動數據的過程中,整個過程依然十分復雜,操作在難度上還是具有一定的挑戰性。其中,最主要的難點在于,人體作為運動跟蹤的目標,其本身具有較強的復雜性,運動所涉及的要素也較多,因而在自攝像到成像的整個過程當中,極易造成原有信息的丟失。在研究階段,研究人員遇到的研究瓶頸則主要有:第一,人體構造的柔性特征,與此同時人體的運動狀況也屬于非剛性運動;第二,高維表達問題,,對運動過程進行跟蹤時,需對運動中的各要素進行仿真模擬,應如何精確再現人體的運動過程,即如何構建人體模型;第三,在視頻中,由于運動狀況與理論中的理想狀態有很大不同,人體極有可能被附近環境掩蓋,或自本身存在遮擋部分,這種情況下就無法獲得完整的人體運動數據,破壞跟蹤定位的精準度,從而給模型的重建造成困難;第四,在從三維到二維的投影過程中,往往會導致深度歧義,對三維的運動目標進行投影,所得到的二維圖像并不能完全再現原有的運動狀況,許多深度信息將會丟失[2]。如果使用單個攝像機進行攝像,這一問題的嚴重性尤為明顯,根據這種情況下所得到的視頻,試圖完成運動三維信息的推導,往往失真程度極高。對于這類問題的解決,通常采取逆向的研究方法,通過多種技術手段,將復雜的問題簡化,或者在先驗知識的指導下,盡量圓滿地解決這一問題。
視覺捕捉系統設計探討
在本次研究中,為了提高跟蹤定位的精確度,將選擇桿狀模型用來模擬人體骨架,同時為了便于完成視覺處理,還將使用HSI色彩模型。通過關節點的運用,可連接形成人體模型,從而得到更適用于數學處理的剛體集合,每一個剛體,都可利用不同的線段加以描述,通過這樣的模型轉換,原本復雜的運動將大大簡化,以骨架運動的形式進入建模和分析階段。在整個人體模型中,共包含18個關節點,為了便于研究,本文中稱其為特征點。在不同的特征點之間,所構成的線段即代表剛體。這樣一來,無論在任何時間點,都不會導致形變。同時,由于這些線段代表的是人體骨架,因此可通過解剖學理論,了解到互相間的大小比例關系,將難點順利轉化為先驗知識。在模型選用上,雖然RGB有更加廣泛的應用,且易于硬件實現。但如果光照強度發生變化,同樣一種顏色,所得到的RGB值差別顯著,造成色彩信息的失真。但在視覺捕捉技術的應用領域,由于色彩信息的醒目性,常常將其作為跟蹤的特征信息,因而需避免亮度的干擾,此時HSI模型的適用性更強[3]。在HSI模型中,其中H表示色調,S表示飽和度,I表示亮度。
在本次研究中,將采用Kalman 濾波與Camshift 相結合的跟蹤算法,能夠綜合二者的優勢。通過對運動圖像的觀察,可對目標物體的方位進行測定,在每一幀圖像中,可獲得其相應的位置信息數據,這樣就可還原人體的完整運動軌跡。在獲知前期人體位置信息數據的情況下,可利用Kalman 濾波,對本幀圖像進行預測,得出目標出現的大概位置,然后再使用Camshift算法使信息精確化,即在可能出現的區域當中,得到目標的準確位置。要完成精確度較高的視覺運動捕捉過程,可遵循以下步驟:首先,最好使用多個攝像機,得到視頻數據流;其次,通過二維跟蹤技術,對特征點進行準確計算,從而得出二維運動序列;最后,利用攝像機,對運動目標進行標定,實現三維重建,完成整個視覺運動捕捉過程。
在整個視覺捕捉系統當中,共包括四個不同模塊,分別為視頻采集、跟蹤定位、模型重建以及顯示,這四個模塊分別具備不同的功能。
視頻采集模塊。可使用普通的攝像頭,對人體運動的整個過程進行拍攝,得到運動的初始視頻。在人體的關節部位,分別使用不同的顏色進行標記,以示區分,標記時應注意所使用的顏色應與背景色彩相異,使標記色塊成為其他任意三種顏色的區域。對于視頻的背景特征,可不做特殊要求。
跟蹤模塊。通過預測機制,盡量避免運動目標被附近環境掩蓋的現象,對模型及運動目標的特征進行研究和分析,使用Kalman進行預測的同時,結合
Camshift算法的使用,以色彩信息為標識特征,進行信息跟蹤。針對各幀圖像,對其色塊中心數據進行提取,建立圖像坐標,此時就可得到色塊運動序列,獲知關節點的運動特征。
重建模塊。完成二維圖像坐標后,接下來向三維坐標進行映射。在完成攝像機標定之后,可根據人體生理約束,利用攝像機成像原理,對二維數據進行映射,使其在三維空間得以重建。
顯示模塊。通過OpenGL ,可用來代表特征點的三維坐標,這樣就可利用更加精確的數據,實現人體運動的視覺捕捉過程。
為了對本次研究的可行性進行驗證,使用普通攝像頭,對手臂的運動軌跡進行拍攝。在OpenGL 中,手臂的三維模型得以建立,通過200幀以上的跟蹤定位,多數情況下,誤差可控制在一個像素以內,取得了理想的試驗結果。
綜上所述,可知在視覺捕捉技術的應用領域逐漸擴大的發展趨勢中,為了更好實現其跟蹤及再現的功能,技術本身的精確性、可靠性等仍有較大的可提升空間,面臨的技術挑戰仍然較多。本文通過對視覺捕捉技術在攝像技術的應用進行深入的探究和分析,指出了視覺捕捉技術的優勢及發展困境。本文對人體運動跟蹤方法進行了較為詳盡的說明,分別介紹了模型跟蹤方法,區域跟蹤方法,活動輪廓線跟蹤方法,特征跟蹤方法,闡述了視覺運動捕捉技術難點,并在此基礎上,提出了視覺捕捉系統設計方案。
(作者單位:蘇州工藝美術職業技術學院)