999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于注意力機制的改進殘差網絡的人體行為識別方法

2021-11-09 06:49:51王昊飛李俊峰
軟件工程 2021年11期

王昊飛 李俊峰

摘? 要:針對ResNeXt網絡(殘差網絡)中存在的對特征提取不充分,以及數據集中背景信息干擾的問題,將ResNeXt網絡和注意力機制相結合,提出了一種基于注意力機制的ResNeXt模型。首先,在ResNeXt網絡的基礎上,將淺層和深層的特征融合生成新型網絡結構。其次,將全連接層由全局平均池化層替代,然后在通道空間注意力機制中添加一個條件因子,同時將改進后的注意力機制嵌入上述網絡中。最后,在UCF101和HMDB51上分別進行實驗,得到了95.2%和65.6%的準確率。研究表明,本文提出的模型可以有效地提取關鍵特征,充分利用不同層次的特征信息獲得較好的準確率。

關鍵詞:人體行為識別;注意力機制;ResNeXt;全局平均池化

中圖分類號:TP183? ? ?文獻標識碼:A

Human Action Recognition Method based on Attention

Mechanism and Improved ResNeXt Network

WANG Haofei, LI Junfeng

(Faculty of Mechanical Engineering & Automation, Zhejiang Sci-Tech University, Hangzhou 310018, China)

haofeiwang@yeah.net; ljf2003zz@163.com

Abstract: Aiming at problems of insufficient feature extraction in ResNeXt network and background information interference in the dataset, this paper proposes a ResNeXt model based on attention mechanism, which combines the ResNeXt network and attention mechanism. First, based on ResNeXt network, shallow and deep features are merged to generate a new network structure. Second, the fully connected layer is replaced by a global average pooling layer. Then channel attention mechanism is improved by adding a condition factor. At the same time, the improved attention mechanism is embedded in the above-mentioned network. Finally, experiments are performed on UCF101 and HMDB51 respectively, and the accuracy rates of 95.2% and 65.6% are obtained. Experiments show that the proposed model can effectively extract key features, and make full use of feature information of different layers to achieve better accuracy.

Keywords: human action recognition; attention mechanism; ResNeXt network; global average pooling

1? ?引 言(Introduction)

人體行為識別技術是從包含運動信息的圖像、視頻中進行識別的。在視頻監控、智能家居、運動分析以及VR等領域都離不開人體行為的識別。人體行為識別已成為計算機視覺研究中的一個非常重要的領域[1]。由于視點的不同、背景的復雜性以及光照條件等的影響,人體行為識別仍然是一項非常具有挑戰性的課題。傳統人體行為識別是基于手工設計的特征[2]進行識別,并且依賴數據集特征提取的先驗知識,耗費大量的時間和精力。隨著深度學習的興起,解決了手動設計特征的不足,在人體行為識別領域取得了重大進展[3],已經明顯超過了手工設計的特征。XIE等[4]提出了ResNeXt網絡,用一種平行堆疊相同拓撲結構的blocks來代替殘差網絡三層卷積的block,同時增加了“基數”這一概念,減少了超參數數量,計算效率高,準確率高。注意力機制可以將其他不重要的信息忽略掉,重點關注關鍵信息[5]。將注意力機制應用到視頻中的行為識別,能夠有效提取視頻幀中的關鍵信息。基于上述方法,為了充分提取視頻中的特征,本文對ResNeXt網絡進行改進并嵌入了改進后的通道空間注意力機制模型。

2? 改進后的ResNeXt網絡結構(Improved ResNeXt network architecture)

首先,本文將使用改進后的ResNeXt網絡作為特征提取網絡來提取時空特征,并將不同層次的特征進行融合,以充分利用各類特征信息。其次,網絡中嵌入改進后的通道空間注意力機制,使網絡更加關注有強反饋能力的特征。最后,經過全局平均池化操作后送入softmax函數進行分類,得到最終結果。本文提出的網絡結構如圖1所示。

本文采用的卷積網絡為ResNeXt101,主體由四個殘差模塊組成。殘差模塊的結構如圖2所示,1×1×1和3×3×3表示卷積核大小,F表示通道數,group表示分組卷積的組數,即將特征圖分成group組的小特征圖。ResNeXt網絡結構采用VGG網絡和inception網絡中轉換合并的思想,用一種平行的相同拓撲結構的block進行堆疊來進行分組卷積,用來控制分組數量,在沒有增加參數復雜度的情況下提高了準確率。

本文中網絡的殘差模塊分別用layer1、layer2、layer3、layer4表示,網絡的具體結構如圖3所示。隨著網絡的加深,一些細節特征被過濾掉,導致對提取到的特征利用不充分。本文改進后的ResNeXt網絡將淺層網絡提取的細節特征和深層網絡提取的特征相融合,以充分利用各個層次所提取的特征信息。

對注意力機制輸出的特征進行步長為2、卷積核大小為1的卷積,卷積操作后的特征和layer2輸出的特征相融合輸入layer3中繼續進行卷積操作。同理,將和layer2融合后的特征進行兩次步長為2、卷積核大小為1的卷積操作,并和layer4輸出的特征相融合。進行卷積操作的目的是為了降低維度,使特征圖能夠進行融合。文中沒有采用逐層特征融合,而是采用跳層融合的方式,首先是為了降低模型參數,減少計算量;其次,如果采用逐層融合的方式,包含過多的特征,會造成冗余的信息。兩種特征采用element-wise進行融合。

3? ?注意力機制(Attention mechanism)

注意力機制模型[6]如圖4所示,由通道注意力機制和空間注意力機制串聯組成,對特征圖在通道和空間維度上進行注意力生成,可以在不明顯增加計算量的基礎上提高準確率。

(1)通道注意力機制

本文對通道注意力機制進行了改進,由于平均池化和最大池化提取到的特征有所區別,添加了條件因子來對不同的特征進行權重分配。改進后的通道注意力機制如圖5所示。首先將輸入特征圖在空間維度上進行壓縮,分別進行平均池化和最大池化操作,得到和。然后對得到的這兩個特征圖進行權重分配,將這兩個重新分配的特征輸入一個共享網絡中,該共享網絡是包含一個隱藏層的多層感知機(MLP),經過共享網絡的處理后,用element-wise求和輸出特征向量。

(2)空間注意力機制

空間注意力機制如圖6所示,將特征圖在通道維度上進行壓縮。對輸入的特征圖分別在通道維度做平均池化和最大池化操作,得到兩個二維特征;然后,按照通道將特征進行拼接得到一個特征圖;最后,對其進行卷積操作,使得最終得到的特征圖和輸入的特征圖在空間維度上一致。

4? ?全局平均池化(Global average pooling)

傳統的卷積神經網絡分類時使用全連接層和softmax回歸層。但是,由于全連接層參數過多,計算量大,容易造成過擬合,同時全連接層容易導致特征圖損失空間位置信息。因此,本文采用全局平均池化層[7]來代替ResNeXt的全連接層,使特征圖和行為類別之間的聯系更加直觀,轉換為分類的概率更加容易,對空間位置信息的魯棒性更強。

全局平均池化是對每一個通道圖的所有像素求平均值,在特征提取的最后一個卷積層生成k 個特征圖;經過全局平均池化層后得到k 個1×1的特征圖,將這些特征圖輸入softmax層,輸出結果就是k 個類別的置信度。

圖7為全局平均池化示意圖,圖8為全連接示意圖。本文對圖7和圖8進行參數計算,假設輸入特征圖大小為3×3×3,則全連接層產生的參數個數為3×3×3×3=81 個,而全局平均池化層將輸入特征進行池化后直接送入softmax,所以參數個數為3×1×1×3=9 個。相比于全連接層,全局平均池化層的參數成倍數減少。

5? ?實驗(Experiment)

5.1? ?數據集

(1)UCF101數據集

UCF101[8]是行為類別和樣本數量最多的數據庫之一,其中包含13,320 個視頻和101 個類別。數據庫的樣本取自從BBC/ESPN收集并從網絡上下載的各種運動的樣本。UCF101多樣性較強,在相機運動,人體的外形、形態、視點、背景、光照條件等各種不同的條件下存在較大差異,是目前為止最具挑戰性的數據庫之一。101 類行為被分成25 組,每組包括4—7 個視頻,主要分為人與物體之間的交互、人與人之間的交互、人體自身的行為、演奏樂器和運動五類,如畫眼妝、打籃球、打太極拳、彈吉他、攀巖等。同一組視頻可能有一些共同的特征,如背景、視點等。如圖9所示為部分動作示意圖。

(2)HMDB51數據集

HMDB51[9]包含6,849 個視頻,總共51 個類別,每個類別至少包含101 個視頻。大多數視頻來自電影片段,有些來自公共數據庫,例如YouTube。動作主要包含一般面部的行為、面部的操作與對象的操作、身體的行為、身體與對象交互的行為和人體自身的行為五類,如交談、喝水、倒立、騎自行車、擁抱等。部分動作示意圖如圖10所示。

5.2? ?視頻采樣與參數設置

本文將視頻隨機的一個位置進行均勻采樣生成16 幀的輸入片段,并通過裁剪的方式將樣本尺寸統一為112×112,所以網絡的輸入樣本大小為3×16×112×112。訓練過程中,初始學習率設置為0.05,并在驗證損失達到飽和后將其除以10,進行學習率衰減優化。使用動量為0.9的隨機梯度下降優化器來對網絡進行優化,使用ReLU激活函數,采用交叉熵損失函數計算損失。

5.3? ?結果與分析

(1)不同條件因子下的比較實驗

該部分就改進的注意力機制中的條件因子的不同取值進行實驗,分別在UCF101和HMDB51數據集劃分的spilt1部分進行實驗,條件因子分別取0.1、0.3、0.5、0.7、0.9,得到的結果如圖11所示。可以看出,在UCF101上,當取值為0.5時,效果較好;在HMDB51上,當取值為0.7時,效果較好。所以本文選取為0.5和0.7分別進行實驗。

(2)拆分實驗

該部分將數據集UCF101和HMDB51分別拆分成三個部分進行實驗,取三者的平均值作為最終結果。UCF101數據集被分成三個部分,每個部分包含測試集和訓練集,每類行為的測試集和訓練集總共為25 組,其中測試集包含7 組,訓練集包含18 組。三種不同的拆分方式中的測試集交叉取前中后7 組,訓練集取剩下的18 組,三個部分的測試集和訓練集一一對應。而HMDB51數據集隨機生成三種拆分方式。首先選擇元標簽分布最平衡的片段,然后選擇與之關聯最小的第二、第三片段,一次得到三種不同的拆分方式。每種拆分方式的每類行為都包含70 組訓練片段和30 組測試片段,結果如表1所示。

(3)有無注意力機制對比實驗

該部分對添加了注意力機制的特征圖進行了可視化,將生成的熱力圖和原圖相結合,如圖12所示。圖中熱力圖深色區域表示所預測到的行為,淺色區域表示背景部分,深色越深代表所受的關注越多。可以看出,添加注意力機制模型后,能夠更有效地集中在關鍵信息處,能夠更好地提取行為的關鍵信息,以便提高識別的準確率。本部分有無注意力機制模型進行對比的實驗結果如表2所示。由表2可知,添加注意力機制后,無論是在UCF101還是在HMDB51上的準確率都有一定的提升。

(4)與其他算法的對比實驗

為了驗證本文算法的有效性,在數據集UCF101和HMDB51上,與近年來主流的iDT[10]、TSN[11]、Two-Stream CNN[12]等人體行為識別方法進行了比較,實驗結果如表3所示。結果表明,本文的識別模型相比一些主流模型準確率有了大幅度提高,尤其在UCF101數據集上比iDT、Two-Stream分別提高了8.8%和7.2%。

6? ?結論(Conclusion)

本文提出了一種基于注意力機制的改進ResNeXt模型,并將其用于視頻中的人體行為識別,將ResNeXt網絡中的淺層特征和高層特征相融合,充分利用不同層次的特征。在通道空間注意力機制中加入條件因子,對不同的池化分配權重,并嵌入改進后的ResNeXt網絡中,能夠有效提取行為的關鍵特征;網絡的最后用全局平均池化層取代全連接層,降低了網絡過擬合的可能性,同時減少了參數。實驗結果表明,本文提出的改進ResNeXt人體行為識別模型在UCF101和HMDB51數據集上獲得了較好的識別率,具有一定的泛化性。

參考文獻(References)

[1] 周波,李俊峰.結合目標檢測的人體行為識別[J].自動化學報,2020,46(09):1961-1970.

[2] 朱煜,趙江坤,王逸寧,等.基于深度學習的人體行為識別算法綜述[J].自動化學報,2016,42(6):848-857.

[3] 周風余,尹建芹,楊陽,等.基于時序深度置信網絡的在線人體動作識別[J].自動化學報,2016,42(7):1030-1039.

[4] XIE S, GIRSHICK R. Aggregated residual transformations for deep neural networks[C]// IEEE.IEEE Conference on Computer Vision and Pattern Recognition. Honolulu, Hawaii, USA: IEEE, 2017:1492-1500.

[5] 王翔,任佳.基于多注意力機制的深度神經網絡故障診斷算法[J].浙江理工大學學報(自然科學版),2020,43(02):224-231.

[6] 徐巖,李曉振,吳作宏,等.基于殘差注意力網絡的馬鈴薯葉部病害識別[J].山東科技大學學報(自然科學版),2021,40(02):

76-83.

[7] LIN M, CHEN Q, YAN S. Network in network[J/OL]. (2013-10-16)[2021-3-18]. https://arxiv.org/abs/1312.4400.

[8] SOOMRO K, ZAMIR A R, SHAH M. UCF101: A dataset of 101 human actions classes from videos in the wild[J/OL]. (2012-10-3)[2021-3-18]. https://arxiv.org/abs/1212.0402.

[9] 朱紅蕾,朱昶勝,徐志剛.人體行為識別數據集研究進展[J].自動化學報,2018,44(6):978-1004.

[10] 程海粟,李慶武,仇春春,等.基于改進密集軌跡的人體行為識別算法[J].計算機工程,2016,42(08):199-205.

[11] WANG L, XIONG Y, WANG Z, et al. Temporal segment networks: Towards good practices for deep action recognition[C]// ECCV. The 14th European Conference on Computer Vision. Berlin, Germany: Springer, 2016:20-36.

[12] SIMONYAN K, ZISSERMAN A. Two-stream convolutional networks for action recognition in videos[J/OL]. (2014-6-9)[2021-3-18]. https://arxiv.org/abs/1406.2199.

作者簡介:

王昊飛(1994-),女,碩士生.研究領域:模式識別與智能系統.

李俊峰(1978-),男,博士,副教授.研究領域:智能信息處理,缺陷檢測.

主站蜘蛛池模板: 国产女人在线视频| 久久这里只有精品国产99| 亚洲欧美成aⅴ人在线观看| 成人综合网址| 国产精品污视频| 国产激爽大片在线播放| 亚洲福利一区二区三区| 99久久精彩视频| 久久久久久久久亚洲精品| 全部免费特黄特色大片视频| 日韩AV无码免费一二三区| 国产精品无码AV中文| 特级毛片8级毛片免费观看| 欧美精品v| 欧美激情,国产精品| 国产麻豆福利av在线播放 | 国产在线自在拍91精品黑人| 免费日韩在线视频| 黄色在线不卡| 欧美成人一区午夜福利在线| 欧美午夜在线播放| 久久亚洲国产最新网站| 亚洲高清资源| 亚洲美女视频一区| 国内视频精品| www.91在线播放| 亚洲午夜国产精品无卡| 成人午夜网址| 综合网天天| 干中文字幕| 国产微拍精品| 日韩久草视频| 91在线免费公开视频| 青青极品在线| 亚洲一级毛片免费观看| 四虎国产成人免费观看| 69免费在线视频| 国模视频一区二区| 国产91线观看| 无码高潮喷水在线观看| 亚洲91在线精品| 国产成人1024精品下载| 亚洲欧美成人综合| 免费黄色国产视频| 色AV色 综合网站| 亚洲天堂网2014| 日韩精品毛片| 九色在线观看视频| 日韩高清欧美| 精品视频第一页| 精品自窥自偷在线看| 国产美女叼嘿视频免费看| 久久久久国产一区二区| 99精品在线看| 久久久久免费精品国产| 69国产精品视频免费| 日韩高清成人| 欧洲日本亚洲中文字幕| 丁香五月亚洲综合在线| 国产精品亚洲综合久久小说| 午夜福利在线观看入口| 99福利视频导航| 91小视频版在线观看www| 青青草国产一区二区三区| 久久久国产精品无码专区| 狠狠v日韩v欧美v| 四虎综合网| 亚洲免费毛片| 老司机精品一区在线视频| 国产成人凹凸视频在线| 国产成人精品男人的天堂| 久久香蕉国产线| 六月婷婷激情综合| 亚洲福利片无码最新在线播放| 欧美性色综合网| 欧洲极品无码一区二区三区| 在线观看国产精品一区| 国产激情无码一区二区APP| 国产免费黄| 男人天堂亚洲天堂| 91精品国产丝袜| 成人福利在线视频|