999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于HMM的虛擬場景控制手勢識別研究

2018-12-20 07:55:00張玉軍孟曉軍白漫濤
電子設計工程 2018年24期
關鍵詞:模型

張玉軍 ,孟曉軍 ,白漫濤

(1.解放軍69079部隊新疆烏魯木齊830013;2.解放軍69240部隊新疆烏魯木齊830011)

虛擬現實(VR)是一種可以創建和體驗虛擬世界的計算機系統,它由計算機生成,通過視、聽、觸、嗅覺等作用于用戶,為用戶產生身臨其境的感覺的交互式視景仿真[1]。人機交互是實現虛擬現實系統的關鍵技術之一,通過人機交互,人與虛擬環境可以建立起雙向感知機制,增加了虛擬仿真維度,提高用戶的沉浸感。人機交互應該以人為核心,在沒有鍵盤、鼠標等傳統交互設備的情況下,通過語言、姿態、手勢等自然表達方式實現人與虛擬世界的自然融合。

手勢交互是目前較為流行的交互方式,通過預先定義的手勢模型,可實現對虛擬場景的有效控制,如菜單選擇、音視頻播放以及移動控制等,其核心任務是動態手勢識別,主要工作有兩項:分割與識別。分割的任務是獲取手勢數據,從一個連續的動作序列中提取有意義的手勢動作序列,即確定手勢的起始點和終止點,可通過固定閾值(速度、角度等)的方法確定,也可通過閾值模型自動分割[2]。識別的任務是獲取手勢標識,根據手勢動作序列數據,判斷出對應的手勢標識,從而確定是何種手勢。本文主要討論識別問題,其難度在于手勢尺度的多樣性,即對于同一標記手勢,即使是相同人,也存在形狀、時長、軌跡等不同,隱馬爾可夫模型(Hidden Markov Model,HMM)具有很強的時序數據建模能力,可有效解決這一難題[3]。

1 基于HMM的手勢識別模型

20世紀60年代左右,L.E.Baum等人在發表的論文中首次提出了隱馬爾科夫模型(Hidden Markov Model,HMM),它是一種基于統計的模型,隨后經過發展與改進,被廣泛運用于語音識別、自然語言處理、生物信息和故障診斷等領域[4]。HMM是一個雙重隨機過程,即狀態間的隨機轉移過程和觀測的隨機輸出過程,其中,狀態轉移過程是隱藏的,通過觀測序列的觀測值表現。

1.1 HMM形式化表示

隱馬爾科夫模型通常由一組包含有5個基本要素的五元組λ=(S,V,A,B,π )表示,五元組中各要素的定義為[5]:

1)隱狀態集S={S1,S2,...,SN},N為隱狀態數量,不同時刻的狀態可以相互轉換,在t時刻HMM的狀態為qt,qt∈S。

2)觀測值集V={V1,V2,...,VM},M為可能的觀測數,在t時刻狀態的輸出為ot,ot∈V。O=(o1,o2,...,oT) 為一個HMM的觀測序列,其長度為T。

其中,1≤i,j≤N,且滿足:

其中,1≤j≤N,1≤k≤M,且滿足狀態Sj所有觀測值概率相加為1,即:

5)初始狀態分布 π=(πi),其中 πi表示在起始時刻模型處于狀態Si的概率,即:

其中,1≤j≤N

HMM工作時,模型的一般運行過程如下:系統根據初始分布隨機生成一個狀態,而后根據狀態轉移矩陣依次從一個狀態轉移到另一個狀態,并且在每個狀態輸出觀測值,通過這種方式,HMM將狀態序列與觀測序列構成統一系統進行分析[6]。

HMM有三類基本問題:評價問題、解碼問題和學習問題,各問題的經典算法可見文獻[7]。對于手勢識別應用而言,最關心的是學習問題和解碼問題,即模型的訓練和手勢的識別,其中:模型訓練常用Baum-Welch算法實現,這是一種非監督學習方法,在給定觀測序列O和初始化參數λ后,通過極大似然法調整參數獲得最優λ*=(A,B,π),使得在該模型下輸出的觀測序列概率P(O|λ)最大;手勢識別常用Viterbi算法預測,即在最優λ*=(A,B,π)和觀測序列O已知的情況下,通過動態規劃法計算最可能的狀態序列,從而求得手勢標識。

1.2 CGHMM模型

根據HMM輸出觀測值概率密度的連續性可以把HMM劃分為離散型HMM(DHMM)和連續型HMM(CHMM)兩種類型[8]。上述由五元組表示的一般型HMM即為DHMM,其隨機過程為離散的觀測序列,如果應用在手勢識別中,建模時需要把連續的數據進行離散化,處理過程中會丟失部分特征信息,從而影響識別效果。為此,論文采取連續型CHMM進行手勢識別建模。

CHMM建模時,可以用概率密度函數來描述狀態輸出的觀測值。對于多維特征,可以考慮使用混合高斯概率密度函數,記為CGHMM。CGHMM與普通HMM類似,只是觀測輸出概率矩陣B由離散形式改為概率密度函數,根據上述HMM定義,一個CGHMM由下列參數組成[9]:

1)模型拓撲結構及隱狀態數量N,每個狀態可能輸出的觀測值數量M。

4)觀測輸出概率矩陣B是一組觀測概率密度函數,即[10]:

為了將CGHMM更好的應用到手勢識別中,需要解決評價、訓練、解碼3個基本問題,詳見文獻[11]。

1.3 手勢識別中的模型參數設置

使用CGHMM進行手勢識別,需要確定模型的拓撲結構、隱狀態數量等參數設置問題。

1.3.1 拓撲結構選擇

根據隱狀態之間的轉換連接,HMM具有幾種典型的拓撲結構,包括全連接型(Fully Connected)遍歷型(Ergodic model)和左右型(Left-Right)。根據手勢運動的特點,希望模型可以描述出狀態轉移在時間上的先后關系,以便于識別計算,為此選擇左右型帶狀拓撲結構,如圖1所示。模型中的狀態只能在它本身或下一個相鄰狀態間轉換,不能返回上一個狀態。

圖1 模型拓撲圖

1.3.2 隱狀態數量優選

在實際應用中,一般而言,一個HMM的性能與隱狀態的數量呈正比,隱狀態數量越多,性能越好,但會降低識別速度。為此,要平衡HMM識別率和識別速度的矛盾,需要合理選擇隱狀態數量。在隱狀態數量選擇上,有啟發式選擇方法,如交叉驗證(cross validation);模型選擇方法,主要有AIC準則(Akaike’s Information Criterion)、BIC 準則(Bayesian Information Criterion)等方法[12]。文中采用BIC準則,通過引入模型復雜度的懲罰項,來確定狀態數量。

假設Θ為觀測序列集,L為觀測序列個數,為Θ中所有觀測的總量,則某一HMM狀態數量為k時的BIC(k)基本形式為[8]:

在 BIC準則中,最優的狀態數是k*=argmaxkBIC(k)。在實際應用中,可先根據經驗,設定狀態數目范圍,而后通過比較獲得最佳數量,文中手勢的狀態數目范圍選擇2個至8個。

2 基于Leap Motion的手勢識別系統設計

手勢識別系統在實際應用時主要有兩種方式,一種是借助于數據手套實現,通過手套內置傳感器反饋手指各關節的狀態,并將數據發送至處理系統進行手勢識別[13];另一種是基于計算機視覺技術,通過光學攝像頭采集手部圖像,對圖像進行處理后獲得手指及各關節信息[14]。單從手勢識別而言,基于計算機視覺的實現方式不會對用戶產生束縛和干擾,交互更加自然,而且成本低廉,適合于推廣。

2.1 手勢數據采集與分割

目前可用于捕捉手部信息的成熟設備主要有Kinect和Leap Motion[15],其中Kinect主要用于整個身體的捕獲,而Leap Motion則完全是針對手部設計的設備,其低成本和小體積的優勢,有利于在手勢交互系統中的封裝與二次開發。

Leap Motion傳感器內置3個紅外LED和2個紅外攝像頭,采用紅外成像技術從不同角度捕獲傳感器上方錐型體內的手部信息,形成三維數據,有效識別范圍在25~600 mm之間,識別信息主要有手部和關節的位置、姿態、速度等參數,識別精度為0.01 mm,精確、高效的數據獲取能力為手勢識別研究提供了基礎支持[16]。在使用過程中,用戶將手置于傳感器上方后,Leap Motion會自動捕獲手部信息,并以115 fps的幀速率刷新信息,以供用戶使用。Leap Motion傳感器的工作方式如圖2所示。

圖2 Leap Motion工作示意圖

課題選取手勢的位置作為特征值,以固定速度閾值的方式分割有效識別手勢,即確定手勢的起始點和終止點位置,考慮到手部的抖動及拐點的停頓,假設當速度連續n次大于或小于某一閾值時[17],手勢開始或結束。以手勢開始為例:假設計數器n初始為 0,如果獲取的手勢速度vt大于閾值vΘ,則n++;否則n重置為0,重新計數。當n大于計數閾值nΘ,則手勢開始;否則繼續計數。如圖3所示。手勢結束的判定流程與開始類似,改為手勢速度vt小于閾值vΘ即可。

圖3 手勢開始判定流程

經過測試分析,手勢開始判定的速度閾值可設為200 mm/s,計數閾值為2;手勢結束判定的速度閾值可設為100 mm/s,為了防止手勢在轉折、拐點等位置過早終止,終止計數閾值設定為5較為合適。

2.2 手勢識別系統設計

在具體應用中,開發者可通過LeapSDK對Leap Motion進行二次開發[18]與集成,目前主要有Orion和V2兩個系列的開發工具包。二次開發的核心是異步調用Leap.dll服務以獲取Leap Motion提供的數據,以實現各種預定功能。手勢識別系統技術框架如圖4所示。

圖4 技術框架

手勢識別系統中主要模塊的功能如下:

1)Leap服務模塊。Leap動態庫通過USB接口獲取Leap Motion傳感器的實時跟蹤數據,并對原始數據進行處理后以推送至其它應用,可通過Leap Motion設置面板對服務進行設置和狀態檢測。

2)手勢訓練模塊。通過Leap服務采集訓練數據,提取特征向量并進行手勢標記,而后進行訓練與測試,將訓練好的模型存入手勢識別模型庫,每種手勢對應1個HMM模型。

3)手勢識別模塊。應用時,通過Leap服務實時接收手勢數據,而后通過識別模型庫中的模型[19]進行計算,輸出識別結果。

3 仿真實驗分析

假設虛擬場景中有控制手勢7種,如表1所示。其中圖標所示圓點表示手勢軌跡的起點,箭頭為手勢軌跡的走向。

利用Leap Motion對這7種手勢特征數據進行采集,每種手勢分別采集50組訓練數據和20組測試數據。在實際訓練時,為了得到較好的訓練效果,需要將數據進行正則化處理,使得訓練好的模型有較強的普適性。

表1 控制手勢

在上述準備的基礎上,選取訓練數據[20],對模型進行訓練,首先將隱狀態數量從2~8進行遍歷,選擇最佳的數量,結果如圖5所示。

圖5 隱狀態數量與BIC關系

由圖5可知各HMM模型應該設定的隱狀態數量,將表中確定的隱狀態數量代入模型中,對手勢識別模型進行訓練與測試,其結果如表2所示。

表2 模型訓練結果

由表2的結果可知,對于前4個簡單的手勢識別率基本可滿足百分百,對于后3個較為復雜的手勢也可滿足場景控制需要。

4 結束語

基于手勢的人機交互方式,可使用戶以較為自然的方式與虛擬環境進行交流,增加了用戶的參與感和沉浸感,有利于提升用戶在虛擬場景中的整體體驗效果。文章討論了連續隱馬爾科夫模型在單個動態手勢識別中的應用問題,對模型的拓撲結構和隱狀態數量的設置進行了分析,最后基于Leap Motion傳感器設計了手勢識別系統對模型進行仿真分析,結果表明模型基本可滿足單個手勢的識別要求,下一步,將深入研究自適應手勢分割和連續動態手勢識別等問題。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 午夜激情婷婷| 亚洲成年网站在线观看| 亚洲国产亚洲综合在线尤物| 韩日午夜在线资源一区二区| 中文字幕 欧美日韩| 特级精品毛片免费观看| 99视频在线免费观看| 国产精品99久久久久久董美香| 2021国产乱人伦在线播放| 亚洲第一天堂无码专区| 国产AV无码专区亚洲A∨毛片| 白浆免费视频国产精品视频| 黄色在线不卡| 久久婷婷色综合老司机| 亚洲精品手机在线| 在线观看欧美国产| 欧美性猛交xxxx乱大交极品| 青青草原国产精品啪啪视频| 专干老肥熟女视频网站| 免费毛片在线| 波多野结衣二区| 国产精品微拍| 欧美精品伊人久久| 中国一级特黄视频| 91小视频在线| 亚洲综合片| 深夜福利视频一区二区| 欧美精品伊人久久| 日本三级黄在线观看| 三级国产在线观看| 色综合网址| 亚洲av日韩综合一区尤物| 亚洲伊人久久精品影院| 天天爽免费视频| 麻豆精选在线| 亚洲欧美日韩成人在线| 亚洲一级毛片| 毛片基地美国正在播放亚洲| 国产亚洲现在一区二区中文| 色有码无码视频| 亚洲码一区二区三区| 91福利在线看| 55夜色66夜色国产精品视频| 91久久国产综合精品女同我| 无码网站免费观看| 国产肉感大码AV无码| 大香网伊人久久综合网2020| 国产一级α片| 久草青青在线视频| 五月六月伊人狠狠丁香网| 99精品视频播放| 午夜福利视频一区| 亚洲免费毛片| 国产精品美女在线| 国产精品jizz在线观看软件| 国模私拍一区二区| 亚州AV秘 一区二区三区| 国产欧美日韩在线一区| 国产欧美另类| 国产精品一区在线观看你懂的| 亚洲黄色高清| 亚洲国产精品日韩av专区| 亚洲精品免费网站| 国产粉嫩粉嫩的18在线播放91| 亚洲床戏一区| 欧美日韩国产在线观看一区二区三区| AV不卡在线永久免费观看| 欧美精品在线免费| 亚洲无码视频喷水| 手机精品视频在线观看免费| 午夜精品福利影院| 日本人妻一区二区三区不卡影院| 四虎永久在线| 色精品视频| 激情五月婷婷综合网| 亚洲日本中文字幕天堂网| 伊人成人在线| 不卡无码网| 熟妇丰满人妻av无码区| 国产成人区在线观看视频| 亚洲小视频网站| 久久黄色影院|