徐煒文
(英國(guó)利物浦大學(xué) 英國(guó)利物浦市 L693BX)
三維圖形庫(kù)下的計(jì)算機(jī)視覺(jué)算法分析
徐煒文
(英國(guó)利物浦大學(xué) 英國(guó)利物浦市 L693BX)
隨著我國(guó)社會(huì)主義現(xiàn)代化建設(shè)的不斷發(fā)展,我國(guó)的計(jì)算機(jī)信息技術(shù)得到了前所未有的發(fā)展,這也在一定程度上促進(jìn)了人工智能技術(shù)以及圖像工程等技術(shù)的革新。作為當(dāng)前計(jì)算機(jī)領(lǐng)域中一個(gè)熱點(diǎn)問(wèn)題,三維圖形庫(kù)下的計(jì)算機(jī)視覺(jué)算法研究對(duì)計(jì)算機(jī)智能技術(shù)的發(fā)展有著重要的意義與價(jià)值。本文主要通過(guò)對(duì)四種計(jì)算機(jī)視覺(jué)算法進(jìn)行分析,進(jìn)一步探討了三維圖像的虛擬算法研究。
三維圖形;計(jì)算機(jī);視覺(jué)算法
在當(dāng)前三維圖形技術(shù)的高科技應(yīng)用背景下,計(jì)算機(jī)圖形學(xué)的快速發(fā)展進(jìn)一步縮小了真實(shí)世界與虛擬世界的差距。計(jì)算機(jī)視覺(jué)是通過(guò)相機(jī)系統(tǒng)完成目標(biāo)識(shí)別,并對(duì)現(xiàn)實(shí)環(huán)境目標(biāo)進(jìn)行跟蹤和三維重建,三維圖像庫(kù)是建立在虛擬現(xiàn)實(shí)環(huán)境中的一種圖形庫(kù)函數(shù),目前,計(jì)算機(jī)視覺(jué)算法正處在相對(duì)發(fā)展成熟階段,能夠從虛擬環(huán)境中獲得相應(yīng)的算法信息,并逐步完成圖像的渲染和完善[1]。由于在真實(shí)環(huán)境下獲取光照、環(huán)境顏色、玻璃反光等數(shù)據(jù)信息較為困難,而借助于三維圖像庫(kù)的計(jì)算機(jī)實(shí)驗(yàn),可以通過(guò)連接輸入端和輸出端,依據(jù)所獲得的虛擬環(huán)境信息實(shí)現(xiàn)圖像處理。
相機(jī)標(biāo)定是建立在相機(jī)的數(shù)學(xué)模型參數(shù)基礎(chǔ)之上的,通常可以采用一個(gè)3×4的相機(jī)矩陣P表示,P=A【RT】,其中A表示3×3的相機(jī)內(nèi)參矩陣,R表示3×3的3D旋轉(zhuǎn)矩陣,T表示3×1平移向量,,其中ax,ay表示相機(jī)焦距,u0、v0表示圖像中坐標(biāo),r表示像素的歪斜系數(shù),通過(guò)相機(jī)標(biāo)定算法聯(lián)合系數(shù)匹配,計(jì)算出相機(jī)的矩陣值。
仿真研究中往往需要搭建實(shí)驗(yàn)環(huán)境,創(chuàng)造合適的虛擬場(chǎng)景,將運(yùn)動(dòng)中的人物、動(dòng)態(tài)物體、靜態(tài)物體、光源等作為虛擬場(chǎng)景的部分,并將屏幕得到的圖像渲染進(jìn)行處理。在計(jì)算機(jī)視覺(jué)算法中,可以假設(shè)所有的相機(jī)矩陣均為未知,根據(jù)算法的不同,其虛擬環(huán)境的搭建也存在一定差異。計(jì)算機(jī)算法主要根據(jù)同步相機(jī)組的圖像,在多視幾何原理的基礎(chǔ)上完成多相機(jī)標(biāo)定。作為相機(jī)組點(diǎn)光源的同步視頻輸入[2]。
Visual Hull是建立在二值圖像中的3D重建算法,通過(guò)將空間切分為M×N×K(其中M、N、K均為正整數(shù))的長(zhǎng)方體,根據(jù)長(zhǎng)方體在相機(jī)矩陣P中的投影,獲得相應(yīng)的二值圖像。該計(jì)算機(jī)視覺(jué)算法的輸入信息包括所有相機(jī)矩陣計(jì)算值及相應(yīng)的二值圖像數(shù)據(jù)。在三維圖形庫(kù)OpenGL中,在除去圖像紋理后,可以較為置管的獲得相機(jī)的二值圖像。
所謂連續(xù)幀差法主要是指在對(duì)視頻圖像運(yùn)動(dòng)目標(biāo)進(jìn)行提取與計(jì)算的過(guò)程中,計(jì)算出當(dāng)前幀圖像與前一幀圖像的差值,并以此確定運(yùn)動(dòng)區(qū)域,其能夠使運(yùn)動(dòng)區(qū)域背景保持不變的狀態(tài),而對(duì)于非運(yùn)動(dòng)區(qū)域的背景則可以采用當(dāng)前幀實(shí)現(xiàn)動(dòng)態(tài)更新,在迭代作用下,對(duì)背景進(jìn)行提取。首先,原始圖像B0可以采用第一幀圖像I0進(jìn)行表示,將迭代參數(shù)設(shè)置為i= 1,所求為前幀與前一幀的差分二值圖像,即BW1,其具體計(jì)算方法為:其中當(dāng)前幀與前一幀圖像分別采用Ii與Ii-1表示,幀間差分則為ads(Ik-Ii-1)表示,幀間差分圖像的灰度直方圖用T表示,即最大峰值右側(cè)1/10對(duì)應(yīng)的灰度值。然后通過(guò)二值圖像對(duì)背景進(jìn)行更新,其具體計(jì)算方法為:,其中Bi(x,y),BWi(x,y)表示兩圖像在坐標(biāo)中的位置,將更新速度系數(shù)確定為0.1。設(shè)置條件i=i+1,然后將其代入BWi進(jìn)行迭代計(jì)算,達(dá)到一定數(shù)量后,結(jié)束迭代,將B1設(shè)置為提取背景。
人體動(dòng)作的捕獲在單一圖像中的呈現(xiàn)較為苦難,但是采用以骨架模型運(yùn)動(dòng)為主的動(dòng)作重建模式能夠構(gòu)建多路同步圖像[3]。通過(guò)對(duì)搜集不同時(shí)間圖像組資料,骨架模型的運(yùn)動(dòng)隨著時(shí)間的變化逐漸運(yùn)動(dòng)。多相機(jī)系統(tǒng)的運(yùn)動(dòng)主要依賴(lài)于兩種不同的實(shí)現(xiàn)方式:①通過(guò)在人體貼上反光的標(biāo)志,采用紅外相機(jī)系統(tǒng)記錄反光標(biāo)志的運(yùn)動(dòng)形式和運(yùn)動(dòng)時(shí)間,采用計(jì)算機(jī)算法進(jìn)一步分析各個(gè)相機(jī)在不同時(shí)間捕獲的運(yùn)動(dòng)標(biāo)志,并通過(guò)算法重建進(jìn)一步構(gòu)建骨架運(yùn)動(dòng)模型。②骨架運(yùn)動(dòng)的重建模型算法也可以依據(jù)于不帶反光標(biāo)志的運(yùn)動(dòng)。對(duì)于該計(jì)算機(jī)視覺(jué)算法,應(yīng)從各個(gè)相機(jī)的數(shù)據(jù)資料記錄中,經(jīng)圖像預(yù)處理而收集需要用到的圖像特征,通過(guò)通過(guò)圖像的特征變化,進(jìn)一步完成圖像測(cè)量,從而實(shí)現(xiàn)運(yùn)動(dòng)骨架模型的重建。
該三維圖像庫(kù)下的計(jì)算機(jī)視覺(jué)仿真研究中,采用多空間校對(duì)拍攝,將相機(jī)組能夠拍到的空間都設(shè)置為工作空間,如圖1,該圖表示實(shí)驗(yàn)環(huán)境的仿真系統(tǒng),上下兩列表示相機(jī)第3真的圖像。在游戲引擎Ogre的仿真過(guò)程中,設(shè)置六臺(tái)虛擬相機(jī)的環(huán)境搭建,并將其焦點(diǎn)設(shè)置為相機(jī)目標(biāo)的中心,常采用引擎中的骨痂動(dòng)畫(huà)模型進(jìn)一步實(shí)現(xiàn)虛擬場(chǎng)景和虛擬人物的運(yùn)動(dòng)軌跡的記錄。

圖1 虛擬同步多相機(jī)系統(tǒng)
綜上所述,基于開(kāi)放式的三維圖像庫(kù),計(jì)算機(jī)視覺(jué)算法的虛擬場(chǎng)景和相機(jī)參數(shù)都是一致的,能夠?yàn)樗惴ㄝ斎胩峁┹^為可靠的數(shù)據(jù)支持,三維圖形庫(kù)下的計(jì)算機(jī)算法成為計(jì)算機(jī)領(lǐng)域研究的一個(gè)重點(diǎn),其不僅是對(duì)計(jì)算機(jī)視覺(jué)仿真研究的理論分析,更是對(duì)視頻與圖像處理技術(shù)的實(shí)踐探究,有著廣闊的應(yīng)用前景。
[1]陳坤.基于立體視覺(jué)的三維重建理論與算法研究[D].南昌航空大學(xué),2011.
[2]姜大志,郁倩.計(jì)算機(jī)視覺(jué)中的設(shè)備標(biāo)定和三維圖形重構(gòu)綜述[J].計(jì)算機(jī)工程與應(yīng)用,2001,37(13):53~55.
[3]Domingo,Mery,李亞寧.X射線檢測(cè)的計(jì)算機(jī)視覺(jué)成像,系統(tǒng),圖像數(shù)據(jù)庫(kù)和算法[J].國(guó)外科技新書(shū)評(píng)介,2016,13(2):9~10.
TP391.4
A
1004-7344(2016)29-0257-01
2016-9-25