文|章明星
視覺捕捉技術(shù)在攝像技術(shù)中的應(yīng)用
文|章明星

目前,在人體運動分析領(lǐng)域和攝像領(lǐng)域,視覺捕捉技術(shù)有著十分廣泛的應(yīng)用范圍,是當前研究的熱點課題之一。在視覺捕捉系統(tǒng)的支持下,該技術(shù)能夠?qū)\動中的物體進行跟蹤定位,從而獲得其三維運動軌跡,并通過數(shù)字解析過程,實現(xiàn)對運動過程的捕捉。運用視覺捕捉技術(shù),能夠?qū)ξ矬w的運動特診進行準確把握,得出其在三維空間內(nèi)特定參數(shù),從而了解到精確的運動狀況。在以計算機圖形學為理論基礎(chǔ)的同時,在空間內(nèi)設(shè)置多個相關(guān)技術(shù)設(shè)備,用于對運動物體的跟蹤,最終以圖形的形式,將運動狀況加以記錄,所得到的運動信息較為不容易失真,因而在攝像技術(shù)中能夠有良好的應(yīng)用前景。
為了完成人體運動分析,首先要做到科學的跟蹤定位,對于連續(xù)的圖像幀,互相之間應(yīng)具備相匹配的特征,主要包括運動方向、速度、形態(tài)及方位等,這樣才能獲得完整的運動數(shù)據(jù)。在運動跟蹤的方案設(shè)計上,應(yīng)用較廣泛的數(shù)學模型有動態(tài)貝葉斯網(wǎng)絡(luò),卡爾曼濾波,以及粒子濾波等方法。由于跟蹤定位的對象各不相同,根據(jù)其各自的特征,可分別采用模型跟蹤方法,區(qū)域跟蹤方法,活動輪廓線跟蹤方法,特征跟蹤方法等。 如果使用模型跟蹤法,在人體運動目標的表達上,傳統(tǒng)的處理手段有三種,即圖模型、二維模型以及三維模型;如果使用區(qū)域跟蹤方法,則需考慮整體跟蹤和局部跟蹤的不同;如果使用活動輪廓線跟蹤方法,在運動目標的表達上,主要手段為封閉的曲線范圍,隨著目標的移動變化,這一封閉的曲線范圍可進行自動更新。在最新的范圍曲線跟蹤算法當中,首先確定空間(x,y,t),然后構(gòu)造一個曲面,并對初始曲線進行設(shè)置,此時曲線應(yīng)為水平方向,得到關(guān)于該曲線的能量函數(shù),包圍移動體區(qū)域,此時運動目標的運動變化,能夠反映到能量函數(shù)的曲線上,當運動目標區(qū)達到最小時,函數(shù)曲線將靠近運動目標區(qū),實現(xiàn)對運動目標的跟蹤定位;如果使用特征跟蹤法,首先應(yīng)完成特征提取,然后再進行特征匹配,從靜態(tài)圖像當中,可提取相應(yīng)的人體特征,而在序列圖像之間,可對這些特征進行匹配,實現(xiàn)完整的跟蹤過程。
目前,視覺運動捕捉技術(shù)的應(yīng)用仍然存在較多的難點,盡管視覺捕捉技術(shù)的研究工作始終熱度不減,對視頻運動的分析也越來越深入,但從取得的開發(fā)成果來觀察,由于多種客觀因素的作用,在掌握人體運動數(shù)據(jù)的過程中,整個過程依然十分復雜,操作在難度上還是具有一定的挑戰(zhàn)性。其中,最主要的難點在于,人體作為運動跟蹤的目標,其本身具有較強的復雜性,運動所涉及的要素也較多,因而在自攝像到成像的整個過程當中,極易造成原有信息的丟失。在研究階段,研究人員遇到的研究瓶頸則主要有:人體構(gòu)造的柔性特征,與此同時人體的運動狀況也屬于非剛性運動;高維表達問題,對運動過程進行跟蹤時,需對運動中的各要素進行仿真模擬,應(yīng)如何精確再現(xiàn)人體的運動過程,即如何構(gòu)建人體模型;在視頻中,由于運動狀況與理論中的理想狀態(tài)有很大不同,人體極有可能被附近環(huán)境掩蓋,或自本身存在遮擋部分,這種情況下就無法獲得完整的人體運動數(shù)據(jù),破壞跟蹤定位的精準度,從而給模型的重建造成困難;第四,在從三維到二維的投影過程中,往往會導致深度歧義,對三維的運動目標進行投影,所得到的二維圖像并不能完全再現(xiàn)原有的運動狀況,許多深度信息將會丟失。如果使用單個攝像機進行攝像,這一問題的嚴重性尤為明顯,根據(jù)這種情況下所得到的視頻,試圖完成運動三維信息的推導,往往失真程度極高。對于這類問題的解決,通常采取逆向的研究方法,通過多種技術(shù)手段,將復雜的問題簡化,或者在先驗知識的指導下,盡量圓滿地解決這一問題。
在本次研究中,為了提高跟蹤定位的精確度,將選擇桿狀模型用來模擬人體骨架,同時為了便于完成視覺處理,還將使用HSI色彩模型。通過關(guān)節(jié)點的運用,可連接形成人體模型,從而得到更適用于數(shù)學處理的剛體集合,每一個剛體,都可利用不同的線段加以描述,通過這樣的模型轉(zhuǎn)換,原本復雜的運動將大大簡化,以骨架運動的形式進入建模和分析階段。在整個人體模型中,共包含18個關(guān)節(jié)點,為了便于研究,本文中稱其為特征點。在不同的特征點之間,所構(gòu)成的線段即代表剛體。這樣一來,無論在任何時間點,都不會導致形變。同時,由于這些線段代表的是人體骨架,因此可通過解剖學理論,了解到互相間的大小比例關(guān)系,將難點順利轉(zhuǎn)化為先驗知識。在模型選用上,雖然RGB有更加廣泛的應(yīng)用,且易于硬件實現(xiàn)。但如果光照強度發(fā)生變化,同樣一種顏色,所得到的RGB值差別顯著,造成色彩信息的失真。但在視覺捕捉技術(shù)的應(yīng)用領(lǐng)域,由于色彩信息的醒目性,常常將其作為跟蹤的特征信息,因而需避免亮度的干擾,此時HSI模型的適用性更強。在HSI模型中,其中H表示色調(diào),S表示飽和度,I表示亮度。
在本次研究中,將采用Kalman 濾波與Camshift 相結(jié)合的跟蹤算法,能夠綜合二者的優(yōu)勢。通過對運動圖像的觀察,可對目標物體的方位進行測定,在每一幀圖像中,可獲得其相應(yīng)的位置信息數(shù)據(jù),這樣就可還原人體的完整運動軌跡。在獲知前期人體位置信息數(shù)據(jù)的情況下,可利用Kalman 濾波,對本幀圖像進行預測,得出目標出現(xiàn)的大概位置,然后再使用Camshift算法使信息精確化,即在可能出現(xiàn)的區(qū)域當中,得到目標的準確位置。要完成精確度較高的視覺運動捕捉過程,可遵循以下步驟:首先,最好使用多個攝像機,得到視頻數(shù)據(jù)流;其次,通過二維跟蹤技術(shù),對特征點進行準確計算,從而得出二維運動序列;最后,利用攝像機,對運動目標進行標定,實現(xiàn)三維重建,完成整個視覺運動捕捉過程。
在整個視覺捕捉系統(tǒng)當中,共包括四個不同模塊,分別為視頻采集、跟蹤定位、模型重建以及顯示,這四個模塊分別具備不同的功能。
視頻采集模塊。可使用普通的攝像頭,對人體運動的整個過程進行拍攝,得到運動的初始視頻。在人體的關(guān)節(jié)部位,分別使用不同的顏色進行標記,以示區(qū)分,標記時應(yīng)注意所使用的顏色應(yīng)與背景色彩相異,使標記色塊成為其他任意三種顏色的區(qū)域。對于視頻的背景特征,可不做特殊要求。
跟蹤模塊。通過預測機制,盡量避免平也被譽為廣播界里的“電視明星”。
較強的活動策劃能力。自主持人中心制的概念提出并逐步實現(xiàn)以來,一些主持人真正成了一個節(jié)目的靈魂。有些電臺主持在廣播中也成立了新形式的廣播節(jié)目,比如連通了私家車、出租車以及公交車等的參與,這樣在進行活動的過程中,人們也可以通過廣播電臺來進行互動溝通和交流,從而提高了人們對廣播電臺的認可程度,而這也是廣播電臺在發(fā)展過程中的一個重大突破。
扎實的語言演播能力。在信息化不斷發(fā)展的過程中,信息傳遞對于廣播媒體也有著一定程度的影響,很多電臺節(jié)目中也都采用了信息碎片化的方式來作為廣播節(jié)目的傳播,并且很多廣播節(jié)目中主持人也作為了信息創(chuàng)博的主要途徑,在網(wǎng)絡(luò)上也有著一定的影響力,這樣對于播音主持人的語言演播能力也提出了更高的要求,在此情況下很多播音主持人也在逐步的進行著新的轉(zhuǎn)變,并且也因此被人們所認可和接受。
隨著新媒體技術(shù)的繼續(xù)進步,未來廣播發(fā)展必然會呈現(xiàn)出更多的融媒體特征,傳播介質(zhì)更加多樣,傳播手段更加豐富,節(jié)目類型也將趨于多元化。傳統(tǒng)廣播主持人只有主動適應(yīng)這種變化,不斷加強自身學習,在實踐中提高自己的技能,與時俱進,才能夠在激烈的媒體競爭中脫穎而出,成為一名綜合素質(zhì)過硬,適應(yīng)新媒體時代發(fā)展要求的合格的廣播主持人。
蘇州工藝美術(shù)職業(yè)技術(shù)學院)