999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

手語識別和翻譯

2012-04-29 00:00:00陳俊杰舒劍飛劉瑞峰
電子產品世界 2012年9期

摘要:為了使聾啞人與更多不懂手語的人自然地交流,本作品將手語翻譯成文字和語音,利用Microsoft Kinect記錄手語手勢的三維坐標,通過機器學習和優化算法,在Intel Atom平臺上實現了手語翻譯。

關鍵詞:手語;識別;手勢;英特爾;Kinect

DOI: 10.3969/j.issn.1005-5517.2012.9.019

簡介

手語是聾啞人士的主要溝通工具,它是利用手部和身體的動作來傳達意義。雖然手語幫助它的使用者之間互相溝通,但聾啞人士與一般人的溝通卻十分困難,這個溝通障礙是源于大部分人不懂得手語。

另一方面,聾啞小朋友由于很難表達自己,以及中國的聾啞教師數量有限,導致他們的學習出現困難,得不到和普通小朋友同等的學習機會。

為了解決這個問題,我們設計實現了一個從手語動作翻譯成文字和聲音的翻譯器,令學習手語更有趣、更方便、更容易,以達到這個項目縮少聾啞人士與其他人的溝通障礙的目的。

工作原理和算法

特征提取

深度圖像的分辨率是640x480,意味著每秒鐘的數據有17.6MB,存儲如此大量的數據是不可能的。同時許多沒有用處的數據(例如背景)都包含在原始數據中。因此我們必須從原始數據中提取出有用的信息。骨架是一種可以用來表示手語的有用信息。

我們利用Kinect和OpenNI提取用戶的骨架節點得到XYZ三點的坐標。我們一共提取了6個骨架節點,左手、左手肘、左肩、右手、右手肘、右肩。對于每一幀,我們從這些節點中計算出14個特征向量來表示這一幀的手語動作。經過標準化計算,我們用121幀來表示一個手語詞語,因此每一個詞語有1694個特征。

原始數據標準化

我們通過均勻分配和插值使原始數據標準化。通過二次插值法,利用最相近的三個原始數據計算出標準化的數據,使得每一個手語動作都統一用121幀來表示。

支持向量機

SVM(支持向量機)是統計學和計算機科學中的概念,簡而言之,給定一組已經分好類別的數據,而且分類依據是未知的,支持向量機訓練算法可以通過計算構建一個模型 ,一組新的數據到來時可以預測出新的數據屬于哪一個類別。

SVM的模型將所有數據映像到一個高維空間里,并計算出不同類別數據之間的最大化幾何邊緣區,然后把新的數據映射到同一個空間,根據之前計算出的最大化幾何邊緣區來預測新的數據屬于哪一個類別。

平臺限制與解決方法

平臺限制

使用Kinect的建議系統需求是CPU有雙核2.66 GHz或以上,內存有2GB或以上,但Intel提供的平臺只有分別1GHz CPU和1G 內存,明顯與系統需求有差異。

即使我們使用Linux操作系統,處理器使用率依舊滿載,并且幀率只有大約2到4左右,遠少于正常的30幀。在這種條件下,再加上處理器資源已被提取資源的線程占據,所以不可能在處理器里進行資料分析的工作。

瓶頸

為了找出瓶頸,我們首先關閉了圖像用戶接口。雖然處理器使用率降至85%,但幀率跟之前的一樣。我們觀察得到其中一個OpenNI控制的線程依然是占領了整個線程。只是由于所提供的平臺是雙線程的關系,使用率分別被定在50%及35%。

其后我們關掉骨架提取的功能,使用率大幅降低到只有25%。經過進一步性能分析的工作,我們證實了瓶頸的來源就是骨骼提取。不幸地,骨骼提取的算法并不是開源的,而是被PrimeSence所保護。所以我們并不能通過修改原代碼或是把算法放到 FPGA里以達致降低處理器使用率的效果。

解決方法

為了解決這個問題,我們嘗試選擇性地使用原始數據。原來數據傳遞方式是用戶產生器(User Generator)直接從深度圖像產生器(Depth Generator)得到原始數據。新的方法就是設立一個仿真深度圖像產生器(Mock Depth Generator)。它會仿真成原來的產生器,而用戶產生器則從它得到數據。

當Kinect得到新的數據,它會將數據傳給深度產生器,然后后者會發給仿真深度圖像產生器。而每隔一個幀,仿真深度圖像產生器會將得到的數據傳給用戶產生器。換言之,兩幀從Kinect上得到的數據,只有一幀會真正被用作提取骨架,而另一幀將會被忽略。

這個做法雖然令幀率降低到15,但處理器使用率卻降至只有50%。而且經過我們的驗證,幾乎沒有出現丟幀的情況,即使出現亦沒有影響到提取骨架節點的質素。經過這個特殊處理,我們確定在這平臺使用Kinect是可行的,甚至還可提取額外的處理器資源用以其他運算工作。

圖1 數據處理流程

設計和實現

概述

系統通過Kinect獲取深度影像,并使用應用程序OpenNI從深度影像中提取用戶的骨架。在獲取的骨架中,我們選取左右手、肘、肩六個關節點。總的來看,用戶完成了一個手語,通過Kinect和OpenNI,系統將記錄一系列的幀,每一幀由左右手、肘、肩六個關節點的三維空間向量組成。用戶每一次完成同一個手語都會有差別,所以我們在特征提取之前需要對記錄的幀進行常態化處理。我們使用支持向量機(SVM)對提取的特征向量進行分類。每一類表示一個手語。圖2描述了整個手語識別的流程。

手語獲取

雙手交叉握于腹部前方。這一動作我們稱之為“預備動作”,表示手語的開始和結束。為了避免潛在的識別錯誤,我們要求每相鄰的兩幀(0.13s),用戶至少移動5厘米。如果用戶做預備動作超過100幀(6.67s),系統將會停止獲取手語數據。

數據處理

正如我們之前提到的常態化處理,我們將獲取的一系列幀通過均分和插入的方法統一成121幀,即2178個三維空間向量。我們對常態化處理后的數據進行特征提取,產生1694個特征向量。最后我們將所有的特征向量放在一個矩陣里,用于SVM分類。

手語訓練和分類

LIBSVM是一個用于支持向量機的集成軟件,支持多類分類。用戶使用LIBSVM提供的庫,可以更容易地使用SVM。我們使用“svm-train”讀取輸入文件(Input File),生成模型文件(Model file)。我們的輸入文件包含1694個特征向量。我們對每個手語單詞訓練20到30次。到目前為止,我們總共訓練了48個手語。我們可以通過訓練更多的手語擴展我們的數據庫。

使用“svm-predict”可以預測用戶所做的手語屬于哪一類。

圖2 識別流程

主站蜘蛛池模板: 精品人妻无码中字系列| 国产成人精品男人的天堂下载| 国产不卡一级毛片视频| 免费A级毛片无码免费视频| 国产自在自线午夜精品视频| 国产免费一级精品视频| 福利一区在线| 国产亚洲精品91| 欧美午夜在线视频| 亚洲欧洲天堂色AV| 激情无码视频在线看| 在线国产91| 日韩AV无码一区| 91在线日韩在线播放| 国产成人精品一区二区免费看京| 精品三级网站| 国产福利免费视频| 国禁国产you女视频网站| 亚洲男人的天堂视频| 在线国产欧美| 乱人伦99久久| 9久久伊人精品综合| 亚洲综合第一页| 欧美日韩中文字幕在线| 久久久久青草大香线综合精品 | 思思热在线视频精品| 久久香蕉国产线看精品| 成人在线第一页| 亚洲色图欧美一区| 国产精品久久久久久久伊一| 99精品这里只有精品高清视频| 国产欧美日本在线观看| 啪啪免费视频一区二区| 久久先锋资源| 日韩a级毛片| 国产成人调教在线视频| 国产原创第一页在线观看| 国产精品综合色区在线观看| 美女免费精品高清毛片在线视| 免费又爽又刺激高潮网址| 免费一看一级毛片| 欧美日韩成人| 强奷白丝美女在线观看| 亚洲成在人线av品善网好看| 一级做a爰片久久毛片毛片| 1769国产精品免费视频| 日韩在线视频网| 欧美狠狠干| 18禁高潮出水呻吟娇喘蜜芽| 亚洲人成网址| 国产传媒一区二区三区四区五区| 在线观看免费AV网| 婷婷丁香色| 一本一道波多野结衣一区二区 | 呦系列视频一区二区三区| 本亚洲精品网站| 国产欧美亚洲精品第3页在线| 日韩毛片视频| 22sihu国产精品视频影视资讯| 日韩国产黄色网站| 亚洲中文字幕久久无码精品A| 亚洲精品国产自在现线最新| 亚洲成人黄色网址| 亚洲国产成人麻豆精品| 99热亚洲精品6码| 色综合激情网| 国产成人1024精品下载| 999国产精品永久免费视频精品久久 | 国产女人爽到高潮的免费视频| 性视频久久| 99re在线观看视频| 三级国产在线观看| 亚洲三级a| 国产福利免费视频| 欧美日韩成人在线观看| 中文字幕 91| 蝴蝶伊人久久中文娱乐网| 亚洲中文字幕日产无码2021| 精品国产一区91在线| 国产一区二区人大臿蕉香蕉| 又爽又大又黄a级毛片在线视频| 免费中文字幕一级毛片|