羅國強(qiáng) 李家華 左文濤 方斌

摘? ?要:計算機(jī)視覺技術(shù)在現(xiàn)代社會中獲得了非常廣泛的應(yīng)用,加強(qiáng)對手勢識別技術(shù)的研究有助于促進(jìn)社會智能化的快速發(fā)展。目前,手勢識別技術(shù)的實現(xiàn)需要完成圖形預(yù)處理、手勢檢測以及場景劃分以及手勢識別3個步驟。此外,手勢特征可以分為動態(tài)手勢以及靜態(tài)手勢,在選用手勢識別方法時要明確兩者之間的區(qū)別,通常情況下選用的主要手勢識別技術(shù)有運用模板匹配的方法、運用SVM的動態(tài)手勢識別方法以及運用DTW的動態(tài)手勢識別方法等。文章對此展開研究。
關(guān)鍵詞:計算機(jī)視覺;手勢識別;方法
隨著現(xiàn)代科學(xué)技術(shù)水平的不斷發(fā)展,計算機(jī)硬件與軟件部分都獲得了較大的突破,由此促進(jìn)了以計算機(jī)軟硬件為載體的計算機(jī)視覺技術(shù)的進(jìn)步,使得計算機(jī)視覺技術(shù)廣泛地應(yīng)用到多個行業(yè)領(lǐng)域中。手勢識別技術(shù)就是其中非常典型的一項應(yīng)用,該技術(shù)建立在計算機(jī)視覺技術(shù)基礎(chǔ)上來實現(xiàn)人類與機(jī)器的信息交互,具有良好的應(yīng)用前景和市場價值,吸引了越來越多的專家與學(xué)者加入到手勢識別技術(shù)的研發(fā)中。手勢識別技術(shù)是以計算機(jī)為載體,利用計算機(jī)外接檢測部件(如傳感器、攝像頭等)對用戶某些特定手勢進(jìn)行精準(zhǔn)檢測及識別,同時將獲取的信息進(jìn)行整合并將分析結(jié)果輸出的檢測技術(shù)[1]。這樣的人機(jī)交互方法與傳統(tǒng)通過文字輸入進(jìn)行信息交互相比較具有非常多的優(yōu)點,通過特定的手勢就可以控制機(jī)器作出相應(yīng)的反饋。
1? ? 基于計算機(jī)視覺技術(shù)的手勢識別主要步驟
通常情況下,要順利的實現(xiàn)手勢識別需要經(jīng)過以下幾個步驟:
第一,圖形預(yù)處理。該環(huán)節(jié)首先需要將連續(xù)的視頻資源分割成許多靜態(tài)的圖片,方便系統(tǒng)對內(nèi)容的分析和提取;其次,分析手勢識別對圖片的具體要求,并以此為根據(jù)將分割完成的圖片中的冗余信息排除掉,最后,利用平滑以及濾波等手段對圖片進(jìn)行處理[2]。
第二,手勢檢測以及場景劃分。計算機(jī)系統(tǒng)對待檢測區(qū)域進(jìn)行掃描,查看其中有無手勢信息,當(dāng)檢測到手勢后需要將手勢圖像和周圍的背景分離開來,并鎖定需要進(jìn)行手勢識別的確切區(qū)域,為接下來的手勢識別做好準(zhǔn)備[3]。
第三,手勢識別。在將手勢圖像與周圍環(huán)境分離開來后,需要對手勢特征進(jìn)行分析和收集,并且依照系統(tǒng)中設(shè)定的手勢信息識別出手勢指令。
2? ? 基于計算機(jī)視覺的手勢識別基本方法
在進(jìn)行手勢識別之前必須要完成手勢檢測工作,手勢檢測的主要任務(wù)是查看目標(biāo)區(qū)域中是否存在手勢、手勢的數(shù)量以及各個手勢的方位,并將檢測到的手勢與周圍環(huán)境分離開來。現(xiàn)階段實現(xiàn)手勢檢測的算法種類相對較多,而將手勢與周圍環(huán)境進(jìn)行分離通常運用圖像二值化的辦法,換言之,就是將檢測到手勢的區(qū)域標(biāo)記為黑色,而周邊其余區(qū)域標(biāo)記為白色,以灰度圖的方式將手勢圖形顯現(xiàn)出來[4],圖像二值法分離出的常見手勢圖形如圖1所示。
在完成手勢與周圍環(huán)境的分割后,就需要進(jìn)行手勢識別,該環(huán)節(jié)對處理好的手勢特征進(jìn)行提取和分析,并將獲得的信息資源代入到不同的算法中進(jìn)行計算,同時將處理后的信息與系統(tǒng)認(rèn)證的手勢特征進(jìn)行比對,從而將目標(biāo)轉(zhuǎn)化為系統(tǒng)已知的手勢。目前,對手勢進(jìn)行識別主要通過以下幾種方法進(jìn)行。
2.1? 運用模板匹配的方法
眾所周知,被檢測的手勢不會一直處于靜止?fàn)顟B(tài),也會存在非靜止?fàn)顟B(tài)下的手勢檢測,相對來說動態(tài)手勢檢測難度較大,與靜態(tài)手勢檢測的方式也有一定的區(qū)別,而模板匹配的方法通常運用在靜止?fàn)顟B(tài)下的手勢檢測。這種辦法需要將常用的手勢收錄到系統(tǒng)中,然后對目標(biāo)手勢進(jìn)行檢測,將檢測信息進(jìn)行處理后得到檢測的結(jié)果,最后將檢測結(jié)果與數(shù)據(jù)庫中的手勢進(jìn)行比對,匹配到相似度最高的手勢,從而識別出目標(biāo)手勢指令[5]。常見的輪廓邊緣匹配以及距離匹配等都是基于這個方法進(jìn)行的。這些辦法都是模板匹配的細(xì)分,具有處理速度快、操作方式簡單的優(yōu)點,然而在分類精確性上比較欠缺,在進(jìn)行不同類型手勢進(jìn)行區(qū)分時往往受限于手勢特征,并且能夠識別出的手勢數(shù)量也比較有限。
2.2? 運用SVM的動態(tài)手勢識別方法
在21世紀(jì)初期,支持向量機(jī)(Support Vector Machine,SVM)方法被發(fā)明出來并獲得了較好的發(fā)展與應(yīng)用,在學(xué)習(xí)以及分類功能上都十分優(yōu)秀。支持向量機(jī)方法是將被檢測的物體投影到高維空間,同時在此區(qū)域內(nèi)設(shè)定最大間隔超平面,以此來實現(xiàn)對目標(biāo)特征的精確區(qū)分。在運用支持向量機(jī)的方法來進(jìn)行動態(tài)手勢識別時,其關(guān)鍵點是選取適宜的特征向量。為了逐步解決這樣的問題,相關(guān)研發(fā)人員提出了利用尺度恒定特征為基礎(chǔ)來獲得待檢測目標(biāo)樣本的特征點,再將獲得的信息數(shù)據(jù)進(jìn)行向量化,最后,利用支持向量機(jī)方法來完成對動態(tài)手勢的識別。
2.3? 運用DTW的動態(tài)手勢識別方法
動態(tài)時間歸整(Dynamic Time Warping,DTW)方法,最開始是運用在智能語音識別領(lǐng)域,并獲得了較好的應(yīng)用效果,具有非常高的市場應(yīng)用價值。動態(tài)時間歸整方法的工作原理是以建立可以進(jìn)行調(diào)整的非線性歸一函數(shù)或者選用多種形式不同的彎曲時間軸來處理各個時間節(jié)點上產(chǎn)生的非線性變化。在使用動態(tài)時間歸整方法進(jìn)行目標(biāo)信息區(qū)分時,通常是創(chuàng)建各種類型的時間軸,并利用各個時間軸的最大程度重疊來完成區(qū)分工作。為了保證動態(tài)時間歸整方法能夠在手勢識別中取得較好的效果,研究人員已經(jīng)開展的大量的研發(fā)工作,并實現(xiàn)了5種手勢的成功識別,且準(zhǔn)確率達(dá)到了89.1%左右。
3? ? 結(jié)語
通常情況下許多手勢檢測方法都借鑒人們?nèi)粘I钪杏^察目標(biāo)與識別目標(biāo)的思路,人類在確認(rèn)目標(biāo)事物時是依據(jù)物體色彩、外形以及運動情況等進(jìn)行區(qū)分,計算機(jī)視覺技術(shù)也是基于此,所以在進(jìn)行手勢識別時也要加強(qiáng)人類識別方法的應(yīng)用,促使基于計算機(jī)視覺技術(shù)的手勢識別能夠更快速、更精準(zhǔn)。
[參考文獻(xiàn)]
[1]童欣.一種基于OpenCV的手勢輪廓識別與指尖定位跟蹤方法[J].福建電腦,2018(12):96-97,109.
[2]張忠軍.基于膚色橢圓邊界模型和改進(jìn)幀差分算法的手勢分割方法[J].福建電腦,2018(5):8-10.
[3]張春燕.基于計算機(jī)視覺的可變形手勢跟蹤算法改進(jìn)研究[J].計算機(jī)測量與控制,2016(11):219-221,225.
[4]季越.基于計算機(jī)視覺的手勢識別人機(jī)交互技術(shù)探討[J].電腦迷,2016(9):39.
[5]張毅,劉鈺然,羅元.基于視覺的手勢識別方法及其在數(shù)字信號處理器上的實現(xiàn)[J].計算機(jī)應(yīng)用,2014(3):833-836,856.