999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

視頻中人體行為識別的時序建模算法的分析

2021-04-13 08:46:36李韻鄧曉軍李濤哲賀迅宇
電腦知識與技術 2021年5期
關鍵詞:深度學習

李韻 鄧曉軍 李濤哲 賀迅宇

摘要:目前人體行為識別是視頻分析領域的研究熱點,準確有效的人體行為識別的關鍵是動作時序建模和特征表示。該文歸納了人體行為識別常用的數據集,對人體行為識別表示方法進行了全面的回顧,并介紹了人體行為識別研究的最新方法,包括RGB和深度數據中手工設計的動作特征的進展,基于深度學習的時序表示方法的最新進展及當前研究的熱點。最后總結了目前待解決的問題,對未來行為識別可能的發展方向進行了論述。

關鍵詞:人體行為識別;深度學習;動作特征表示;數據驅動;視頻分析

1引言

人體行為識別具有廣泛的應用,例如智能視頻監控、視頻存儲和檢索、醫療康復、人機交互等。人體行為識別根據采集到的視頻時間序列數據來分析,在計算機視覺和機器學習領域,這也是一個具有挑戰性的問題。目前,人體行為識別中有許多關鍵問題尚未解決。

視頻是時域上有序圖像的集合,其獨有的時域相關性可以縮小很多視覺問題的搜索空間,魯棒的人體動作建模和特征表示是人體行為識別的關鍵,也是視頻領域和機器學習中的經典問題,圖1是動作識別的原理框圖。近年來,已經提出了多種時序建模方法,包括基于關鍵點跟蹤的軌跡特征,基于時空變化的局部和全局特征提取,基于深度信息的運動變化等。傳統的表示依賴人工設計,通用性差,近年新興的深度學習則能實現一定程度的自動學習,許多研究人員也將深度學習應用于視頻領域人體行為識別。然而視頻的特征學習研究剛起步,大部分算法移植自圖像領域,尚不能有效利用視頻特有的時域相關性先驗。豐富的視頻數據使得行為分析有更好的擴展性和靈活度,對這些人體行為識別方法進行調查是非常有意義的。

本文從數據集開始介紹,總結了許多近期的工作,將動作分類方法概括為基于手工特征的方法和基于特征學習的方法,這些方法可以應用于不同類型的數據。

2 數據集

在計算機視覺領域中,有許多數據集可用于評估人體行為識別算法性能。最先開始人體行為識別主要是識別一些比較簡單的視頻,這樣的視頻稱為實驗室拍攝的視頻,如跑步、拍手等,這類數據的背景都比較干凈,代表數據庫有KTH,Weizmann等;Hollywood和UCF Sports數據庫是基于電影或者電視節目,因為電影都是由專業的設備拍攝的,所以視頻質量都比較高;HMDB51、UCF101等數據庫是對網絡端的視頻進行識別,這類數據的差異性非常大,通常是用戶根據自己的手持設備拍攝進行上傳的,因此這類數據的復雜程度往往是最高的。

基于深度學習的方法比基于手工特征的方法具有更好的識別性能,通過將深度學習方法用于動作特征學習,行為識別精度得到了顯著提高。在這些RGB數據集中,HMDB51和UCF 101最常用于評估所提出的方法,幾乎所有基于深度學習的最新方法的研究都使用這兩個數據集來驗證算法的有效性,UCF101數據集的識別精度已超過98%,但是HMDB51尚未達到等效精度,表1列出了人體行為常用二維數據集,注意到Kinetics數據集是用于人體行為識別的新的且更具挑戰性的數據集。

二維數據并不能很好地解決人體行為存在的自遮擋等問題,而三維數據對自遮擋的信息得到了補充,但這使得數據集變得復雜,處理也變得相對困難。由于計算機硬件的發展,微軟Kinect等設備的出現,使得三維數據更容易采集和處理,表2列出了常用的三維數據集。

與RGB數據集相比,基于深度學習的方法在RGBD和骨架數據集上的應用較少,造成這種情況的主要原因之一是這些數據集規模較小。然而,隨著大規模且具有挑戰性的RGBD和骨架數據集的發展,例如NTURGB + D數據集,基于深度學習的深度和骨架數據方法已成為人體行為識別領域的主要研究主題。

3傳統方法

傳統方法主要是人工提取特征,旨在捕獲視頻中表示動作的人體運動和時空變化,RGB數據和深度數據有各自的特性和優勢,不同數據有不同的建模方法。

3.1基于RGB數據

基于時空體積的方法是應用模板匹配技術,這些方法的關鍵是使用時空模板并基于該模板執行有效的匹配。這是最早的人體行為識別方法,主要方法有二維全局特征提取,MEI(運動能量圖像)和MHI(運動歷史圖像)使用幀差法檢查像素點運動并分別通過二值化和灰度化生成,包含有關視頻上下文的有用信息。Blank等人提出MEI模板的體積擴展,通過視頻序列中的剪影信息得到3D時空體(STV),如圖2所示。當相機固定時,這些方法可以使用背景差分得到人體剪影來獲取人體輪廓等形狀信息,然而在復雜的場景和相機運動的情況下,難以獲得準確的剪影和輪廓,并且在人體被遮擋時不能識別出準確的外觀信息。而局部特征不依賴底層的人體定位和跟蹤,對人體外觀變化和遮擋等問題也不是很敏感,因此在行為識別中局部表示方法更多。

基于STIP的方法從視頻中提取局部特征點來表示動作,STIP中的“興趣點”的檢測發生在視頻運動突變時,所以當人體進行直線或勻速運動時這些特征點就很難被檢測出來。Laptev將Harris空間興趣點擴展到3D Harris,檢測時空的局部結構,局部特征提供旋轉不變性,在光照變化下保持穩定,并且比其他方法具有更強的遮擋力,但是在背景運動和相機運動的情況下,基于局部時空特征的方法會生成許多背景特征點,并且物體的運動估計會產生較大的誤差。

時空特征點在時間延伸下可能并不位于相同的空間位置,因此提取到的特征并不一定描述興趣區域,而軌跡特征追蹤給定坐標圖像沿時間的變化,使用人體骨架的關鍵點的跟蹤路徑來表示動作。基于軌跡的經典行為識別方法是Wang等人提出的改進的密集軌跡(iDT),運動描述子(主要指HOF和MBH)能更準確的描述動作,使描述子更準確地描述人體運動。這種方法可以克服視角的變化,然而需要精確的二維或三維人體骨架模型及關鍵點的精確跟蹤,同時人體動作建模和跟蹤仍然是計算機視覺領域的一個難題。

3.2基于深度圖像與骨骼數據

與基于RGB視頻的人體行為識別不同,骨骼數據僅包含人體關鍵點的2D或3D坐標提供了高度抽象的信息,并且沒有環境噪聲(例如光照、衣著),使得行為識別算法能夠專注于動作的魯棒特征。隨著深度傳感器在行為識別中的應用,使用深度數據已經展現了良好的行為識別性能。

基于深度序列的方法主要使用人體深度圖中的運動變化來描述動作。Yang等人提出的深度運動圖(DMM),從正面、側面和俯視面投影來壓縮時空深度結構,形成三個運動歷史圖,然后用HOG特征表示這些運動歷史記錄圖,并將生成的特征連接起來描述動作。基于骨架的行為識別方法是使用深度數據進行研究的另一個活躍領域,其方法利用視頻幀之間人體關節的變化來描述動作。Xia等人從Kinect深度圖中提取3D骨骼關節位置,如圖3所示,并使用該3D關節點直方圖表示人體姿勢,從不同角度獲得關節點之間的對應關系提取更多的魯棒特征。基于深度信息的方法比基于RGB的方法能夠實現實時的動作識別和更好的識別性能,盡管深度數據可以更準確地描述人體的運動特征,但RGB的數據外觀信息豐富,因此一些研究人員還嘗試使用多特征融合對人體行為進行建模。

Chaaraoui等人嘗試融合關節特征和深度信息特征,降低因遮擋和視角變化而錯誤提取骨架特征。基于數據融合的方法試圖保持多種數據模式間的特性來獲得更好的特征表示,大多數基于多模態數據融合的方法可以提供更優的識別結果,但同時這意味著需要處理更大的數據量,使得算法的計算復雜度增加,多模態數據的有效組合仍然是人體行為識別和深度學習中的未解決問題。

4深度學習方法

深度學習在多層神經網絡的支持下,逐層地把視頻從原始的像素空間變換到高層特征空間,能自動學習視頻表示,不需要人工介入,從效果來講,一般優于傳統方法,在人體行為識別領域,深度學習方法已得到廣泛應用。

4.1 RGB數據驅動方法

在人體行為識別的研究中,關鍵且具有挑戰性的一個問題是如何表示視頻時間維度上的特征,基于RGB視頻數據的深度學習方法根據時序建模方式的不同可分為基于雙流結構的方法,基于3D卷積的方法和基于LSTM的方法。

Tran等人[7]探討了一個新的3D CNN結構,直觀來講視頻信號與二維圖像不同,是一種三維的信號,因此簡單的做法就是把二維CNN進行三維的擴展,它從視頻中同時學習空間和時間信息,效果優于二維CNN。而大多3D卷積是基于片段的方法,并沒有考慮視頻級的時空特征變化,Zhang等人提出了視頻級四維卷積神經網絡(V4D),利用四維卷積來建模長距離的時空變化,同時利用殘差結構來保存三維時空特征。

雙流網絡的輸入是單幀圖像和多光流幀圖像堆疊,在雙流網絡中光流根據圖像序列計算得到,相比之下,3D卷積網絡將視頻視為三維時空結構,并使用3D卷積方法學習人體行為特征,從結果上來看,雙流網絡的效果更好一些,然而光流需要消耗大量的計算資源。有許多研究嘗試改善這兩種網絡結構的性能。雙流卷積網絡的一些代表性擴展包括,Wang等人詳細討論了雙流網絡的輸入、卷積網絡結構和訓練策略,引入分段和稀疏采樣的思想,提出時序分割網絡(TSN),如圖4所示,進一步改善了雙流網絡的結果。Feichtenhofer等人提出了SlowFast網絡結構,Slow路徑以低幀率運行捕獲空間語義信息,Fast路徑以高時間分辨率捕獲快速變化的運動信息,這種快慢結合的雙路徑通過側向連接(lateral connection)進行融合,考慮了時間維度上不同速度對時空信息捕捉的影響。

上述基于卷積神經網絡的模型一次僅能處理有限少量的視頻幀,而LSTM可以很好地對長序列結構建模,基于LSTM的方法則將視頻視為幀的有序序列,并通過每個幀的特征變化來表示人體行為。Ng等人用LSTM將卷積網絡輸出的幀級特征聚合成視頻級,獲取更全局的視頻時序信息。由于3DCNN輸入是固定的片段,不能像LSTM一樣建模全視頻,復雜度也較高,但是卻相比單純CNN與LSTM的組合效果更好,時間卷積很好地捕捉了視頻中的時序信息,將3DCNN與LSTM組合也是一個很好的策略。

4.2 深度數據驅動方法

深度學習方法可以從各種形式的數據中學習人體動作特征,傳統的RGB數據容易受環境、衣著等無關行為的因素影響,深度數據給行為分析研究帶來不少便利。

傳統的DMM無法很好地展現三維運動特性且傾向于忽略外觀信息,Wang等人使用時間秩池將深度視頻中的3D運動信息緊湊地編碼為常規體素集(3DV)建模三維空間和運動特征,然后將3DV抽象為一個點集,并端到端地輸入點云網絡中以進行3D動作識別。人體3D骨架數據是自然的拓撲圖,而不是基于RNN或CNN方法處理的序列向量或偽圖像,因此最近很多研究將有效表示圖形結構數據的圖卷積網絡(GCN)應用到骨架行為識別任務。Yan等人首次提出了時空圖卷積網絡 (ST-GCN),使用面向圖的卷積網絡(GCN)來建模帶有圖的骨架關節之間的基本關系,如圖5所示,其中每個節點對應于人體的一個關節,將人體連通性和時間作為圖的邊。

然而,深度傳感器的準確性和成本意味著基于深度和基于骨架的行為識別方法目前僅適用于有限范圍內和特定環境中。如基于結構光和基于TOF的深度傳感器很容易受到光線的影響,在室外環境中誤差較大且精度較低。此外,還有其他可用于測量深度的傳感器,例如激光掃描儀,但是這些設備價格昂貴,不適合用于視頻監控和家居監控。

4.3 無監督方法

除了上述數據驅動的監督方法外,還有一些比較優秀的新方法延伸到視頻領域,特別是一些無監督方法的出現。無處不在的視頻中含有豐富的動態結構信息,很自然想到將視頻數據作為強大的無監督學習信號進行視覺表示,然而大規模視頻數據的實現仍是人工智能的重大挑戰。Zhuang等人提出了視頻實例嵌入(VIE)框架,如圖6所示,在視頻中學習視覺嵌入,使得在嵌入空間相似視頻距離近,而無關視頻距離遠,在大規模視頻數據上進行訓練時VIE可以為行為識別和圖像分類提供強大的表示,他們得出同時具有靜態和動態處理路徑的兩路徑模型是最佳的。

視頻領域的弱監督/無監督學習才剛剛開始,由于無須人工標注或少量標注,具有很大應用價值,是未來非常值得研究的方向之一。但是由于效果沒有標注的監督方法好,未來會有很多新方法延伸到視頻分析領域,以解決目前存在的問題。

5 結束語

在行為識別研究中,選擇合適的數據來捕獲動作至關重要,對于動作特征學習問題,基于深度學習的方法具有出色的性能,但諸如人體姿勢的多樣性和復雜性、遮擋和背景雜亂之類的混雜因素,意味著真實場景中的人體行為識別仍然具有挑戰性,除了要解決以上難題,行為定位和多模態信息融合也是未來發展方向。視頻本身有一個很好的特性就是多模態,有圖像有運動,乃至于還有一些文本信息,怎樣用一些文字信息與RGB結合起來做自監督或者弱監督的學習是發展趨勢。同時不同應用場景具體的應用框架都不是很成熟,一個具體的應用場景開發一款比較成熟的框架也是一個比較重要的研究方向。

參考文獻

[1] 陳煜平,邱衛根.基于視覺的人體行為識別算法研究綜述[J].計算機應用研究,2019,36(7):1927-1934.

[2] Gorelick L,Blank M,Shechtman E,et al.Actions as space-time shapes[J].IEEE transactions on pattern analysis and machine intelligence,2007,29(12):2247-2253.

[3] Laptev I.On space-time interest points[J].International journal of computer vision,2005,64(2-3):107-123.

【通聯編輯:朱寶貴】

猜你喜歡
深度學習
從合坐走向合學:淺議新學習模式的構建
面向大數據遠程開放實驗平臺構建研究
基于自動智能分類器的圖書館亂架圖書檢測
搭建深度學習的三級階梯
有體驗的學習才是有意義的學習
電子商務中基于深度學習的虛假交易識別研究
現代情報(2016年10期)2016-12-15 11:50:53
利用網絡技術促進學生深度學習的幾大策略
考試周刊(2016年94期)2016-12-12 12:15:04
MOOC與翻轉課堂融合的深度學習場域建構
大數據技術在反恐怖主義中的應用展望
深度學習算法應用于巖石圖像處理的可行性研究
軟件導刊(2016年9期)2016-11-07 22:20:49
主站蜘蛛池模板: 国产va在线| 国产在线精品网址你懂的| 综合社区亚洲熟妇p| 色老头综合网| 露脸真实国语乱在线观看| 日韩精品一区二区三区视频免费看 | 亚洲精品无码日韩国产不卡| 免费无码网站| 欧美性天天| 97超碰精品成人国产| 国产精品尤物铁牛tv| 免费国产不卡午夜福在线观看| 老司机精品久久| 亚洲精品福利视频| 曰韩人妻一区二区三区| 国产成人亚洲无吗淙合青草| 香蕉国产精品视频| 欧美国产菊爆免费观看 | 中文字幕在线日本| 四虎在线观看视频高清无码 | 国产噜噜噜| 在线观看国产黄色| 一级毛片视频免费| 99re热精品视频中文字幕不卡| 精品免费在线视频| 爱爱影院18禁免费| 91精品国产麻豆国产自产在线 | 日韩国产欧美精品在线| 欧美激情第一区| 日韩在线永久免费播放| 米奇精品一区二区三区| a级毛片视频免费观看| 久久99国产乱子伦精品免| 国产成人精品一区二区| 日本免费a视频| 3344在线观看无码| 久久亚洲国产视频| 日本人妻丰满熟妇区| 色视频国产| 青青热久免费精品视频6| 国产成人亚洲毛片| 亚洲日韩第九十九页| 国产永久免费视频m3u8| 精品视频91| 亚洲国产精品无码AV| 亚洲欧美在线看片AI| 999国产精品永久免费视频精品久久| 精品少妇人妻无码久久| 国产三级韩国三级理| 99精品福利视频| 亚洲最大在线观看| 精品无码一区二区三区电影| 日本在线欧美在线| 日韩成人在线网站| 欧美精品另类| 伊人精品成人久久综合| 久久国产av麻豆| 最新国语自产精品视频在| 99久久亚洲精品影院| 99久久国产综合精品女同| 色噜噜狠狠色综合网图区| 一本一道波多野结衣一区二区| 国产欧美精品一区二区 | 中文字幕免费在线视频| 一级毛片免费观看久| 国产美女在线观看| 97超碰精品成人国产| 亚洲第一综合天堂另类专| 國產尤物AV尤物在線觀看| A级毛片高清免费视频就| 性欧美在线| 久久人人妻人人爽人人卡片av| 亚洲开心婷婷中文字幕| 99视频在线免费| 亚洲伊人天堂| 亚洲成人在线免费| 素人激情视频福利| 欧美亚洲国产精品久久蜜芽 | 国产91精品调教在线播放| 亚洲欧美日韩成人高清在线一区| 91po国产在线精品免费观看| 国产成人夜色91|