徐倩倩,陳平平
(廣州中醫藥大學醫學信息工程學院,廣州 510006)
基于深度技術手勢的圖像分類方法研究
徐倩倩,陳平平
(廣州中醫藥大學醫學信息工程學院,廣州510006)



規定6種常見的手勢,如圖1所示。

圖1 6種規定手勢圖像
利用Kinect傳感器硬件和上述的程序獲取規定6種規定手勢的深度圖像如圖2所示。

圖2 深度手勢圖像
3.1閾值分割
所謂閾值分割方法就是確定某個閾值Th,根據圖像中每個像素的灰度值大于或小于該閾值Th,來進行圖像分割。閾值方法的數學模型如下[3]:

根據上式可知,閾值方法的核心就是閾值Th的確定方法。
3.2實驗結果
以手勢1深度圖像進行直方圖分析為例,其他手勢圖像以此類推。對圖3進行灰度值分析,可獲得如圖4的灰度直方圖,通過觀察圖3可知,深度手勢圖像中手勢的顏色幾乎接近白色,即灰度值在255附近,由圖4分析可得,在灰度值255存在一波峰波谷并且區間范圍較小,這個區間就是深度手勢圖像區域,故只要找到第一個波峰,這個波峰的灰度值就是深度手勢圖像的分割閾值。按照此辦法,尋找圖3的分割閾值為灰度值222,對圖3進行閾值分割后如圖5所示,由此可見閾值分割算法對于深度手勢圖像具有較好的分割效果。
傅里葉描述符的主要思想是利用表示形狀整體頻率分量的一組數字來描述輪廓特征。傅里葉描述主要包括兩個方面:首先,需要定義一個曲線表達式。其次利用傅里葉理論將其展開。傅里葉描述分為累加角函數和橢圓傅里葉描述等,由于橢圓描述符能保持曲線在二維空間的描述,所以本文采用橢圓傅里葉描述符對手勢圖像進行描述。橢圓傅里葉描述符可定義為:

其中:

分別取規定手勢的深度圖像各10幅,并使用MATLAB求其橢圓傅里葉描述符,然后取手勢橢圓傅里葉描述符的前25數值,并求每種手勢10幅圖像的平均值,數據如表1所示。

圖3 深度手勢1圖像

圖4 深度手勢1圖像的直方圖

圖5 深度手勢1圖像的分割效果
以表1橢圓傅里葉描述符作為標準樣品,每種手勢再取5幅深度圖像作為測試樣品,利用歐幾里得距離公式計算其相異度,作為手勢分類的依據。不同手勢的相異度如表2所示,相同手勢的相異度如表3所示。
由結果可知,測試數據與訓練數據之間的相異度越小,說明手勢即可分類為那一種,例如,表3中,手勢1與測試1的相異度為1.523,小于規定的量值(本文規定為2.5),即可接受為手勢1,而測試5中手勢1的相異度為3.689,大于2.5,不可接受,所以拒絕,即不是手勢1,以此類推。

表1 6種橢圓傅里葉描述符平均后數據

表2 不同手勢的相異度

表3 相同手勢的相異度
Kinect傳感器是基于視覺手勢識別系統的較好的圖像采集工具。而采用橢圓傅里葉描述符對處理后的深度手勢圖像進行描述,橢圓傅里葉描述符可以保持曲線在二維空間的描述[4]。通過計算橢圓描述符相異度的計算,橢圓描述符對于手勢具有較好的分類效果。通過分析可得,不同手勢圖像的橢圓傅里葉描述符的差異性基本超過2.5,具有較大的差異性。而相同手勢的不同圖像的差異性較小。
[1]王輝.基于視覺的實時手勢跟蹤與識別及其在人機交互的應用:[浙江大學碩士學位論文].杭州:浙江大學計算機科學與技術工程學院,2008,3-4.
[2]Pavlovic V I,Sharma R,Huang T S.Visual interpretation of hand gestures for human-computer interaction:a review.IEEE Transactions on Pattern Analysis and Machine Intelligence,1997,19(7):677-695.
[3]江立.基于CAS-GLOVE數據手套的手勢識別技術研究:[北京交通大學碩士學位論文].北京:計算機與信息技術學院,2006,12-14.
[4]莫舒.基于視覺的手勢分割算法的研究:[華南理工大學碩士學位論文].廣州:華南理工大學電子與信息學院,2012,5-6.
Kinect Sensor;Depth of the Images;threshold Segmentation;Elliptical Fourier Descriptors
Research on the Classification Method of Gesture Image Based on the Depth Technical
XU Qian-qian,CHEN Ping-ping
(College of Information Engineering,Guangzhou University of Chinese Medicine,510006)
1007-1423(2015)19-0020-04
10.3969/j.issn.1007-1423.2015.19.005
徐倩倩(1992-),女,安徽安慶人,碩士研究生,學生,研究方向為圖形圖像學、多媒體信息處理
2015-04-29
2015-06-20
利用微軟的Kinect傳感器采集手勢圖像,通過微軟提供的軟件開發工具包接口,將采集的手勢圖像轉換為深度手勢圖像,并加強目標區域的灰度級,即手勢區域的灰度值[1]。由于深度圖像包含距離信息,同時又因為人在用手勢示意信息時,往往會將手向前伸展,這樣,手勢距離Kinect傳感器的攝像頭更近,和人體的絕大部分不在一個平面上,也就是說手勢部分灰度值將異于身體的其他部分,這樣只要采用閾值分割算法就可以將手勢從背景中分離出來。
Kinect傳感器;深度圖像;閾值分割;橢圓傅里葉描述符
國家級大學生創新創業訓練計劃項目(No.201310572016)
陳平平(1980-),女,廣東梅州人,碩士,副教授,研究方向為計算機網絡
Uses Microsoft's Kinect sensor to capture gesture image.Through the software development tools packet interface which provided by Microsoft,changes the gesture image into depth gesture image acquisition,and strengthens the gray level value of the target area.Since the depth image contains distance information,and when people express information gestures,often will stretched forward the hands,so the gesture is closer to the camera Kinect sensor,and the vast majority of the human body is not in a plane on,that gesture is different from other parts of the gray values of the body,so long as the use of threshold segmentation algorithm can be separated from the background gesture.