999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于手部動作的人機交互算法實現(xiàn)

2016-12-08 06:40:00袁楓,趙玉生,羅軍
中國科技信息 2016年20期
關(guān)鍵詞:背景特征

基于手部動作的人機交互算法實現(xiàn)

當前智能人機交互系統(tǒng)逐漸成為科技研究的一個重要方向。在這一發(fā)展潮流下,手勢識別成為了一種新興的人機交互操作方式。本文對人機交互系統(tǒng)進行研究,提出了一套基于手部動作的人機交互算法。該算法通過攝像頭捕捉圖像,并對采集來的圖像進行高斯濾波等前端處理,然后利用背景差分進行運動目標檢測,接著利用基于Ycbcr空間的膚色檢測技術(shù)找到運動目標中的手部區(qū)域,并對手部區(qū)域進行運動分析,最后根據(jù)識別出來的手部動作進行相應(yīng)的操作。實驗結(jié)果表明該算法可以較好的去除背景噪聲的干擾,對操作者手勢進行實時有效的識別,并對遙控小車發(fā)出指令,實現(xiàn)了基于手部動作的智能人機交互。該算法具有廣闊的發(fā)展和應(yīng)用前景,實現(xiàn)了更為智能方便的人機交互。

隨著科技的發(fā)展,人機交互在各行各業(yè)都有著廣泛的應(yīng)用前景。而隨著人機交互的發(fā)展,智能化成為了人機交互系統(tǒng)的主要發(fā)展方向。相較于傳統(tǒng)的人機交互方式,比如鍵盤輸入,鼠標輸入,新型的人機交互方式可以為使用者帶來更大的便利,比如圖像輸入,語音輸入。簡單地說,圖像輸入是基于數(shù)字圖像處理技術(shù)的輸入方式,經(jīng)過攝像頭采集和計算機處理對圖像和視頻進行處理,屏蔽噪音,提取有用信息,進而完成相應(yīng)的操作指令。圖像輸入的主要方式是手勢識別、人臉識別、動作識別。

動作識別算法是對一系列圖像中包含的動作進行識別分析的算法,主要由前端噪聲處理、目標檢測、和目標行為分析組成。對運動檢測的主要方法有幀間差分法,背景差分法。幀間差分法實時性好,背景不積累,算法簡單,計算量小;背景差分法不受背景干擾,算法簡單易實現(xiàn)。

本文對基于手部動作的人機交互算法進行研究,目的是通過識別操作者的手部動作對小車進行控制。本算法直接調(diào)用攝像頭采集實時視頻,對操作者手部動作進行噪聲過濾,運動和膚色檢測、動作分析并發(fā)送相應(yīng)的指令。

基于手部動作的人機交互算法

本文提出的基于手部動作的人機交互算法框圖如圖1所示。在初始視頻采集模塊,通過攝像頭采集視頻,對采集來的視頻流進行高斯濾波、形態(tài)學(xué)濾波等做前端處理,濾除噪聲,以便對操作者手部動作進行提取和檢測。在運動目標檢測模塊,通過背景差分得到運動目標。在膚色特征檢測模塊,通過膚色識別,輪廓提取等處理進一步濾除圖像中的干擾信息,得到更為精準的手部區(qū)域。在手部運動分析模塊,通過質(zhì)心提取,運動特征點定位識別手部動作在圖像中的位置,進一步確定操作者手部的運動軌跡和方向,從而翻譯出操作者的真實意圖,并在人機交互模塊對遙控小車進行操控。

圖1 基于手部動作的人機交互算法框圖

初始視頻采集

捕捉靜態(tài)背景

由于在實際操作中背景會因為操作者身處的環(huán)境不同而受到或多或少的干擾,要想從復(fù)雜的背景中提取出清晰的影像,需要考慮采集時,背景是否受光線因素影響,操作者是否移動等相關(guān)因素。所以為了提取出相對穩(wěn)定清晰的影像,本算法自視頻開始采集后采用第26幀的圖像作為背景圖像,

濾除前25幀圖像中的噪聲和干擾。這樣提取出來的的背景相對干凈,噪聲干擾少。

確定背景圖重心

為了準確的定位重心坐標,需要使用矩計算物體形狀的重心,面積,主軸和其它的形狀特征等。由公式(1):

其中x,y,i,j是待處理區(qū)域的坐標(單幀圖像中的像素點坐標)。

令Xc,Yc表示區(qū)域重心的坐標,則如公式(2)所示:

在二值圖像的情況下,M00表示區(qū)域的面積。

因為操作者體型不同,所以為了更準確的定位重心,需要設(shè)定一個重心上移量。

高斯濾波

高斯濾波的作用在于消除高斯噪聲,對信號做平滑處理。在圖像處理中,高斯濾波是一種常用的減噪手段。其算法原理就是將中心像素點的值用其鄰域內(nèi)像素值的加權(quán)平均代替。

形態(tài)學(xué)濾波

形態(tài)學(xué)濾波的基本方法有:腐蝕、膨脹、開啟、閉合。腐蝕可以細化圖像中的目標,消除邊界點;膨脹可以粗化圖像中的目標,可以填補圖像中的縫隙;開啟可以使圖像變得光滑,有效過濾噪聲點,具體操作是先腐蝕,再膨脹;閉合可以消除圖像中的狹窄的間斷,填補輪廓的裂痕,具體操作是先膨脹再腐蝕。本算法采用了開啟運算。

運動目標檢測

背景差分法

背景差分法是一種常用的運動區(qū)域檢測的方法,通過將當前幀與背景幀作對比差分,檢測出運動區(qū)域。背景差分法檢測運動目標速度快,檢測準確,易于實現(xiàn)。

如不考慮噪音n(x,y,t)的影響,視頻每一幀圖像I(x,y,t)可以看作是由背景圖像b(x,y,t)和運動目標m(x,y,t)組成:

由式(3)可得運動目標m(x,y,t):

而在實際中,由于噪音的影響,式(4)不能得到真正的運動目標,而是由運動目標區(qū)域和噪音組成的差分圖像d(x,y,t),即:

得到的運動目標需要做進一步處理,閾值分割是最常用的方法:

式中T為一閾值,本文既采用這種閾值分割法。

膚色特征檢測

膚色識別

在現(xiàn)實生活中受限于環(huán)境因素,不同時刻的光照、顏色各異的燈光、噪聲的背景等很多因素都可以對膚色識別產(chǎn)生或大或小的干擾。為了盡可能小的減少環(huán)境因素的干擾,本算法采用YCbCr膚色空間。因為人眼對于亮度的變化較為敏感,且根據(jù)相關(guān)研究顯示,不同人種的膚色的不同主要在于亮度分量,因此在膚色識別中一般剔除亮度分量, ,只關(guān)注Cb、Cr兩個顏色分量。

YCbCr與RGB的轉(zhuǎn)換公式如下:

圖像二值化

圖像的二值化處理就是將圖像上每一個像素的灰度置為0或255,即將256個亮度等級的灰度圖像通過適當?shù)拈撝颠^濾,大于閾值的置為255,小于閾值的置為0,從而獲得仍然可以反映圖像整體和局部特征的二值化圖像。在本算法中,高于閾值的圖像即為手部目標,低于閾值的圖像即為背景。

理想方式下,為選取一個合適的閾值,記t為目標與背景的分割閾值,目標像素數(shù)占圖像比例,平均灰度;背景像素占圖像比例,平均灰度。圖像的總平均灰度為:

從最小灰度值到最大灰度值遍歷t,當t使得值

最大時,t即為分割的最佳閾值。

在本算法中,由于膚色檢測比較特殊,并不能簡單采用理想方式找到最佳閾值。經(jīng)試驗設(shè)定,當Y分量像素值在70~255,Cb分量像素值在80~128,Cr分量像素值在134~165之間視為膚色區(qū)域,即該區(qū)域像素點置為255,其他區(qū)域像素點置為0。

繪制輪廓集

為了更好地識別運動目標的形狀,也為了更好地定位運動目標的坐標,需要將運動目標的輪廓勾勒出來。因為輸入的圖像為二值圖像,可以較為容易的將整幅圖像中的輪廓掃描出來,并將所有輪廓的邊界點坐標存儲于一個特殊的矩陣中。利用這些坐標,我們可以輕易地繪制出一個包含多個輪廓的輪廓集。

設(shè)定輪廓最小外界矩形的面積閾值

雖然膚色識別可以過濾掉大多數(shù)背景干擾,但在實際應(yīng)用中,人體的其他部位以及背景環(huán)境中的類膚色干擾因素依然會影響系統(tǒng)對于手勢的識別。因此本算法采用設(shè)定一個輪廓最小外接矩形的面積閾值,從而在整幅圖像所有輪廓中找到手臂的輪廓,即輪廓的最小外接矩形。這樣可以提高算法的準確性和實用性。

手部運動分析

信息提取

設(shè)重心坐標為(Gx,Gy),輪廓最小外界矩形的四個頂點坐標是(Ax,Ay)、(Bx,By)、(Cx,Cy)、(Dx,Dy)

設(shè)(AVERx,AVERy)為頂點坐標平均值

將四個坐標點橫坐標排序,設(shè)橫坐標最小的頂點為(MINx,MINy),橫坐標最大的頂點為(MAXx,MAXy)。

若AVERx>Gx,則運動特征點為(MAXx,MAXy),反之特征點為(MINx,MINy)。

信息分析

攝像頭開始采集后,每隔48幀系統(tǒng)會采集一幅圖像,共采集4次。經(jīng)過上述處理后得到一個特征點,記為特征點1、特征點2、特征點3、特征點4。然后根據(jù)特征點坐標變化的規(guī)律進行手部運動分析。若特征點4的橫坐標大于特征點3,特征點2和特征點1橫坐標,則視為向右移動;若特征點4的橫坐標小于特征點3,特征點2和特征點1橫坐標,則視為向左移動;若特征點4的縱坐標大于特征點3,特征點2和特征點1縱坐標,則視為向上移動;若特征點4的縱坐標小于特征點3,特征點2和特征點1縱坐標,則視為向下移動。

指令發(fā)送與接收

借助 Visual C++編譯環(huán)境的MFC模式下的MSComm控件可以實現(xiàn)系統(tǒng)與串口的通信。MSComm是Microsoft公司提供的用于串行通信編程的控件。借助該控件,應(yīng)用程序可以方便的借助串口收發(fā)數(shù)據(jù)。MSComm控件提供了多種通信命令的使用接口以及兩種處理通信的方法:事件驅(qū)動方式和查詢方式。本系統(tǒng)采用查詢方式。借助無線收發(fā)模塊可以實現(xiàn)指令的遠距離傳輸,本系統(tǒng)采用的是BM100B模塊,BM100B模塊采用GFSK調(diào)制方式,可工作在315/433/490/868/91MHZISM頻段,具有尺寸小,功率大,靈敏度高,傳輸距離遠,通信數(shù)慮高,內(nèi)部自動完成通信協(xié)議轉(zhuǎn)換和數(shù)據(jù)收發(fā)控制等特點。用戶可以利用該模塊提供TTL、232或485串行數(shù)據(jù)接口自行配置摸塊的串行速率,工作信道,發(fā)射功率,通訊數(shù)率等參數(shù)。

實驗結(jié)果

本文采用Visual C++ 編程軟件和OpenCV對實時采集的視頻進行了前端噪聲處理,之后通過背景差分法得到運動目標,通過膚色檢測找到具有膚色特征的目標,然后通過運動分析識別手部運動,最后與小車進行交互。圖2為基于手部動作的人機交互算法實驗結(jié)果示例,實驗中規(guī)定當操作者手從上到下移動時,系統(tǒng)發(fā)出前進指令;當操作者手從下往上移動時,系統(tǒng)發(fā)出后退指令;當操作者手從左往右移動時,系統(tǒng)發(fā)出左轉(zhuǎn)指令;當操作者手從右往左移動時,系統(tǒng)發(fā)出右轉(zhuǎn)指令。如圖2(a)和(b)所示,當操作者手從左往右移動時,小車也從左往右移動。如圖2(c)和(d)所示,當操作者手從下往上移動時,小車也從下往上移動。

圖2 基于手部動作的人機交互算法實驗結(jié)果示例

結(jié)語

本文提出了一套基于手部運動的人機交互算法,該算法可以對手部運動進行提取,進而根據(jù)提取到的特征點進行運動分析,最后根據(jù)分析的結(jié)果能夠通過智能控制系統(tǒng)進行人機交互。該方法可以用于一些適用于殘障人士的特殊場合,方便他們進行操作,具有識別準確,反應(yīng)速度快的特點。

10.3969/j.issn.1001- 8972.2016.20.019

猜你喜歡
背景特征
抓住特征巧觀察
“新四化”背景下汽車NVH的發(fā)展趨勢
《論持久戰(zhàn)》的寫作背景
當代陜西(2020年14期)2021-01-08 09:30:42
黑洞背景知識
新型冠狀病毒及其流行病學(xué)特征認識
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
晚清外語翻譯人才培養(yǎng)的背景
背景鏈接
主站蜘蛛池模板: 91麻豆精品视频| 国产男女免费视频| 综合亚洲网| 国产91无码福利在线| 国产无码精品在线| 亚洲中文字幕无码爆乳| 国产精品内射视频| 中文一级毛片| 国产在线精品人成导航| 欧美精品啪啪一区二区三区| 尤物午夜福利视频| 小说 亚洲 无码 精品| 国产成人无码AV在线播放动漫 | 欧美亚洲日韩不卡在线在线观看| 国产好痛疼轻点好爽的视频| 波多野结衣国产精品| 中国国产A一级毛片| 无码免费的亚洲视频| 亚洲色无码专线精品观看| 911亚洲精品| 亚洲AV免费一区二区三区| 亚洲精品国产自在现线最新| 日韩视频福利| 欧美国产日韩一区二区三区精品影视| 欧美黄网站免费观看| 精品无码国产自产野外拍在线| 亚洲人成在线精品| 欧美一区二区福利视频| 国产亚洲精品91| 浮力影院国产第一页| www成人国产在线观看网站| 久久这里只有精品国产99| 免费观看亚洲人成网站| 日韩AV无码一区| 国产女人爽到高潮的免费视频| 日本午夜在线视频| 亚洲区第一页| 中文成人在线| 亚洲最大福利网站| 亚洲综合片| 欧美高清三区| 亚洲高清无码久久久| 国产正在播放| 欧美日韩专区| 直接黄91麻豆网站| 国产凹凸一区在线观看视频| 精品综合久久久久久97超人| 国产激情第一页| 99性视频| 8090成人午夜精品| 91在线免费公开视频| 欧美视频免费一区二区三区| 黄色网址手机国内免费在线观看| 久久久久人妻一区精品色奶水| 国产一级特黄aa级特黄裸毛片| 国产日韩av在线播放| 亚亚洲乱码一二三四区| 国产成人精品一区二区三区| 国产精彩视频在线观看| 99热6这里只有精品| 91久久国产综合精品女同我| 中文字幕无码制服中字| 国产97视频在线| 欧美国产日韩在线| 国产麻豆va精品视频| 国产全黄a一级毛片| 天堂av综合网| 四虎国产永久在线观看| 国产网站在线看| 亚洲成在人线av品善网好看| 亚洲最大福利视频网| 美女国内精品自产拍在线播放| 蝌蚪国产精品视频第一页| 欧美日韩一区二区三| 2024av在线无码中文最新| 欧美狠狠干| 人妻91无码色偷偷色噜噜噜| 成人精品免费视频| 久久一级电影| 婷婷亚洲视频| 国产人成在线视频| 国产凹凸一区在线观看视频|