999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

手語識別研究綜述

2021-03-12 07:01:22秦夢現
軟件導刊 2021年2期
關鍵詞:特征提取分類深度

秦夢現

(河北工業大學人工智能與數據科學學院,天津 300401)

0 引言

中國是聾啞人口最多的國家,聾啞人由于聽力受損、發聲不完全等原因,只能用手語與健聽人士進行溝通交流。手語由連續手勢動作組成,指使用手形變化,手的位置、方向以及手臂擺動,再配以口型表達、面部動作和一定語法規則表示特定語義,是聾啞人和外界溝通交流的一種語言。然而,聾啞人畢竟是少數群體,大部分人由于不懂手語而極大影響聾啞人在日常生活中的正常交流及生活。如何減少聾啞人溝通障礙,實現聾健融合是亟待解決的問題。隨著計算機技術的快速發展,自然語言處理技術正在不斷打破局限,并逐漸應用于各相關領域。在語音識別方面,科大訊飛的語音識別技術可實現精準的語音識別,為聾啞人和健聽人之間的正常溝通搭建了良好通道。將聾啞人的手語以文本或語音交互方式反饋到計算機上的技術被稱為手語識別技術,該技術為聾啞人士與健聽人群的交流提供了支持,其在人機交互、手勢控制和手語教學等領域具有廣闊的應用前景。

1 手語識別技術

手語識別研究是將手語通過計算機處理翻譯成文字,涉及圖像識別、自然語言處理等多個方向。手語視頻中手臂運動速度、手形變化及口型等信息均對計算機處理能力有較高要求。計算機視覺[1]是手語識別技術的關鍵技術,其在人工智能的推動下得到快速發展。近年來,人工智能領域中的深度學習受到高度關注,深度學習讓數以百計的實際問題得到了更好解決,已廣泛應用于自然語言處理、人機交互等領域。隨著數據的增長和計算能力的提高,深度神經網絡中數據缺少、難以訓練等問題正逐步得到解決。目前,以深度學習為基礎的計算機視覺發展最快且最成熟,其在圖像分類[2]如人臉識別[3]等領域已具有極大優勢,在其它方面,比如人體行為檢測、無人駕駛等領域也有了快速發展。計算機視覺技術應用廣泛,能夠幫助聾啞人更好地融入社會、認識并了解世界。

2 手語識別研究現狀

隨著計算機技術和人工智能的不斷發展,手語識別在國內外受到了越來越多的關注[4]。手語識別方法根據特征處理方式可分為兩類:基于傳統方法的手語識別[5]和基于深度學習的手語識別[6]方法。

2.1 基于傳統方法的手語識別

基于傳統方法的手語識別算法涉及4 個階段:圖像預處理、手部分割、特征提取和分類識別。圖像預處理是為了減小噪聲等因素影響;手部分割是對手語演示過程中的感興趣區域進行定位;特征提取是對能夠表達手語信息的關鍵點進行采集;識別是根據提取的特征訓練一個分類器,以便對后續輸入的特征映射到事先設定好的分類中。其中,特征提取和分類識別是手語識別算法的核心關鍵(見圖1)。

Fig.1 Sign language recognition process based on the traditional method圖1 基于傳統方法的手語識別流程

2.1.1 圖像預處理與手部分割

采集到的原始圖像中存在大量噪聲,因此需對圖像進行預處理以減少噪聲干擾,使其突出肢體運動區域信息。Pansare 等[7]首先將輸入圖像閾值化為二值圖像,然后采用高斯濾波對圖像中的每一個像素點進行卷積計算,并加入到原始圖像中進行噪聲點覆蓋。但這會造成圖像中的像素點與周圍像素點相似,降低圖像清晰度。因此,Rao 等[8]采用索貝爾算子進行邊緣計算,對肢體部分進行邊緣銳化,增強圖像關鍵信息。

分割目的是將手語圖像分割成感興趣區域和其它區域,并將感興趣區域從圖像中分離出來。手語圖像由于膚色和背景存在差異,因此一般采用膚色分割獲得手部這一感興趣區域。例如,Chen 等[9]在RGB 色彩空間中,使用R>G>B 的規則進行膚色選擇定位,將得到的區域與預先存儲的樣本膚色匹配,以找到手部區域并將其分離。

2.1.2 特征提取

特征是對輸入圖像中的關鍵信息進行描述,為了方便算法對圖像數據的處理,將圖像轉換成緊湊的特征向量集。在手語識別研究中,一般采用針對圖像空間外觀特征(肢體的輪廓、顏色、紋理、運動方向)的方法進行數據建模。如Huong 等[10]使用主成分分析(Principal Components Analysis,PCA)對25 個手語類別特征進行降維,以加快對樣本有價值信息的處理速度,找到肢體運動的關鍵特征,達到91.5%的準確度。但是,使用PCA 進行線性降維后,樣本間的非線性相關性很可能丟失,導致識別結果降低。Harwat 等[11]利用二維圖像提取手勢,通過尺度不變特征轉換(Scale-Invariant Feature Transform,SIFT)對手部特征點進行有效的特征提取,獲得手的形狀、方向等信息,形成對手部這一局部圖像的描述,提升算法魯棒性。

2.1.3 分類識別

分類的主要作用是將樣本數據中提取的特征映射到與其對應的類別中,這是整個手語識別模型中的最后一步。根據識別圖像種類不同,可以分為靜態手語和動態手語兩類。靜態手語識別的是單幀圖像,不涉及時間框架。KNN 是常用的分類方法,其核心思想是尋找訓練樣本中與其距離最短的K 個樣本。如Gupta 等[12]將KNN 用于對每26 個手勢的30 張測試圖像進行分類,總體精度最高達90%。與靜態手語分類不同,動態手語分類增加了時間維度。HMM 由于能夠對齊手語幀并計算相似性而被廣泛應用,方高林等[13]將自組織映射的強大提取能力和HMM 良好的處理時間序列屬性相結合,實現非特定人群手語識別,實驗結果表明,該方法比傳統HMM 識別率高5%。

綜上所述,基于傳統方法的手語識別需根據經驗知識設計和提取區分度較強的特征,尤其是在特征提取和分類識別兩個階段,需基于強大的理論基礎知識對其進行多次實驗驗證。并且,傳統手語識別方法少,進行手工特征提取需耗費大量時間,且多數用于手語孤立詞[14]的識別,不具有普適性。動態手語識別需要建立更為可靠的長期時序關聯性,這些因素導致手語識別發展受限。

2.2 基于深度學習的手語識別

隨著計算機性能的大幅度提升,深度學習技術逐漸興起。它能夠避免人工經驗特征提取的主觀性及繁瑣性,使得手語識別方向有了新的切入點,有效提高了手語識別率。具體流程如圖2 所示。

Fig.2 Sign language recognition process based on deep learning圖2 基于深度學習的手語識別流程

2.2.1 特征提取

隨著深度學習在計算機視覺領域的快速發展,其在手語識別方面的運用也得到不斷提升。在視頻特征提取方面,卷積神經網絡(Convolution Neural Network,CNN)[15]在分類、分割等視覺任務上展現出了強大的能力,尤其是三維卷積神經網絡(3D Convolution Neural Network,3D-CNN)的出現,更是促使該方法以高效率、高性能的優點逐漸取代了傳統手工特征模型。手語信息由姿勢、運動軌跡、面部表情等組成,這些包含在視頻的時序信息中,3D-CNN 可以對其進行較好提取。如Zhu 等[16]利用3D-CNN 提取視頻幀序列的時間和空間特征,充分保證特征的完整性,最終取得了較好識別效果。3D-CNN 通過構建一個三維卷積神經網絡實現較短時間片段上時空信息的有效學習,增強了相鄰視頻幀間的連續性。

2.2.2 手語識別

循環卷積神經網絡(Recurrent Neural Network,RNN)針對提取的特征建立語言模型,將手語視頻序列翻譯成完整句子。如Ye 等[17]將3D-CNN 的全連接層和RNN 進行融合,極大地降低了序列塊之間的信息丟失率。但是RNN 無法解決長時依賴問題,因此Xu 等[18]將提取的特征通過長短期記憶(Long Short-Term Memory,LSTM)進行時間關系學習,提高了序列時間建模準確率;Cihan 等[19]在手語識別編碼和解碼階段采用門控循環單元(Gated Recurrent Unit,GRU),以更好地捕捉時間序列中時間步距離較大的依賴關系。

此外,手語識別可以看作視頻序列和文本語句序列對應的關系任務。HMM 可以進行連續時間學習,如Koller等[20]將CNN 端到端地嵌入到HMM 中,以進行良好的時間序列處理,但序列匹配度不高,某一隱藏狀態對之前隱藏狀態的依賴程度較大。為了解決此問題,Pu 等[21]通過(Connectionist Temporal Classification,CTC)損失建立不同手語單詞之間的依賴關系;Huang 等[22]在編解碼器中使用注意力機制,將輸入序列分配的不同權重加入到解碼階段進行手語識別。

綜上所述,基于深度學習的手語識別利用深度學習強大的學習能力和擬合能力獲取更全面、更抽象的特征,突破了傳統手語識別方法的局限性。但大部分連續手語識別方法只注重網絡結構創新,忽略了數據本身的優化處理,使得模型在輸入階段丟失大量有用信息,增加了識別難度,且對序列內部上下文間的關聯性關注度較低,導致序列時序關系提取不完整等問題。因此,手語識別仍然是一個需深入研究的課題。

3 結語

隨著計算機視覺領域的不斷發展,手語識別研究初顯成效,很多有效算法相繼被提出。但是依然存在一些不足,如輸入階段數據較為單一、特征提取到的關鍵信息較少等。如何在當前基礎上進一步優化模型,最終實現實時手語識別是未來研究方向。此外,不同類型的手語數據分布不同,如何將不同的手語數據訓練成同一分布,以更好地進行手語識別也有待深入研究。

猜你喜歡
特征提取分類深度
分類算一算
深度理解一元一次方程
基于Gazebo仿真環境的ORB特征提取與比對的研究
電子制作(2019年15期)2019-08-27 01:12:00
分類討論求坐標
深度觀察
深度觀察
深度觀察
數據分析中的分類討論
教你一招:數的分類
一種基于LBP 特征提取和稀疏表示的肝病識別算法
主站蜘蛛池模板: 一级毛片免费高清视频| 欧美黄色网站在线看| 日韩欧美高清视频| 在线欧美一区| 漂亮人妻被中出中文字幕久久| 日本爱爱精品一区二区| 亚洲视频色图| 国产XXXX做受性欧美88| 99久久国产综合精品女同 | 久久综合AV免费观看| 亚洲swag精品自拍一区| 免费观看精品视频999| 国产成人高清精品免费5388| 国产精品美女自慰喷水| 久久香蕉国产线看观| 国产在线自乱拍播放| 女人av社区男人的天堂| 激情视频综合网| 国产福利一区视频| 国产成人无码综合亚洲日韩不卡| 制服丝袜 91视频| 国产毛片高清一级国语 | 国产成人乱码一区二区三区在线| 亚洲国产日韩欧美在线| 欧美色视频网站| 色偷偷综合网| 四虎精品国产AV二区| 亚洲国产一成久久精品国产成人综合| 中文字幕色在线| 午夜国产在线观看| 国产又大又粗又猛又爽的视频| 热久久这里是精品6免费观看| 一本色道久久88综合日韩精品| 六月婷婷精品视频在线观看| 国产无码高清视频不卡| 亚洲国产欧美国产综合久久 | 一区二区三区国产精品视频| 国产色婷婷| 亚洲男人的天堂在线观看| 色一情一乱一伦一区二区三区小说 | 久久毛片免费基地| 99久久亚洲精品影院| 亚洲嫩模喷白浆| 久久不卡精品| 全部免费特黄特色大片视频| 波多野结衣中文字幕一区| 91网在线| 日韩福利在线视频| 美女无遮挡被啪啪到高潮免费| 深爱婷婷激情网| 中文字幕亚洲综久久2021| 日韩亚洲高清一区二区| 亚洲av无码专区久久蜜芽| 欧美午夜理伦三级在线观看| 国产高清在线丝袜精品一区| 日本www色视频| 无码粉嫩虎白一线天在线观看| 国产午夜在线观看视频| 日韩不卡高清视频| 欧美国产成人在线| 国产精品人莉莉成在线播放| 天天躁夜夜躁狠狠躁躁88| 亚洲区第一页| 成人综合网址| 国产无码精品在线| 亚洲一级毛片在线观播放| 日本国产精品一区久久久| 国产一级毛片yw| 狠狠五月天中文字幕| 国产精品女人呻吟在线观看| 亚洲床戏一区| 一本久道久综合久久鬼色| 国产主播在线一区| 亚洲性视频网站| 在线a视频免费观看| 国产av色站网站| 午夜日b视频| 伊人婷婷色香五月综合缴缴情| 99视频精品全国免费品| 日韩人妻无码制服丝袜视频| 中文字幕乱妇无码AV在线| 国产精品密蕾丝视频|