999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于多輸入流的卷積行為識別網絡*

2023-03-18 11:40:48劉石磊李欽楊耿
科學與信息化 2023年5期
關鍵詞:方法

劉石磊 李欽 楊耿

1. 深圳信息職業技術學院 廣東 深圳 518172;

2. 香港理工大學 香港 999077

引言

行為識別作為計算機世界領域的研究重點,在視頻監控、人機交互、環境輔助生活、智能駕駛等應用方面有很大的應用空間。但是,受到遮擋、視角變化、尺度變化、陰影、光照變化和類內變異與類間相似性等的影響,人體行為識別率并不理想。

由當前的行為識別方法上看,主要體現在以下方面:第一,基于圖像局部特征檢測的方法,即利用多極體系結構分級的建構實施行為識別的方法;第二,運用深度學習開展行為識別的方法。

基于圖像局部特征檢測的方法:使用方向梯度直方圖(Hog)或尺度不變(SHIFT)檢測子來提取視頻中的形狀信息,并用光流直方圖(HOF)或運動邊界直方圖特征提取視頻中的運動信息(MBH),然后用詞包形式進行編碼,并訓練分類器識別人體行為[1-3]。

基于深度學習的方法:以上所提出的基于圖像局部特征的人體行為識別方法,即把視頻圖像中所提取的局部特征,依托手工制造獲得高維特征,所以這些方法具有很強的針對性,但通用性并不是很好。為了獲取通用性強的視頻中人體行為識別的方法,近些年來,學者們開始對基于深度學習算法應用的研究。

由目前的基于深度學習的方法上看,主要如下:第一,基于雙流的方法,即運用空間流(spatial)、結合幀圖像提取到的光流場圖像(temporal flow),并對視頻圖像、密集分流開展CNN模型的訓練,判斷兩個分支網絡關于動作的識別,融合兩個網絡的直接平均分類得分、svm分類得分,從而得出最終的結果[4-6]。

第二類是基于3D卷積網絡的方法,通過3D卷積,可以直接處理視頻[7-9]。

當前,在基于視頻的行為識別應用領域,深度學習得到了普遍應用,但是仍面臨著兩個主要問題:一是長范圍時間結構在理解視頻中較長時間的行為上起著重要作用,但是目前的神經網絡結構大多只關注表象和短時間段的運動;二是在實際中,對于深度卷積神經網絡的訓練而言,亟須大量的訓練樣本,進一步優化其網絡性能,但視頻數據的樣本量是有限的。因此如何設計有效的深度網絡來學習視頻序列的最佳表示,并在有限的訓練樣本下,訓練網絡以提高模型的性能是目前急需解決的研究課題。本文提出一種基于多輸入流的行為識別網絡,首先將視頻分段,然后利用稀疏采樣策略提取視頻序列, 使得網絡能學習到較長時間范圍結構,同時提出基于多輸入流的卷積網絡結構來提高雙流卷積神經網絡在視頻行為識別方面的處理能力。

1 方法

1.1 稀疏采樣

在時間結構上視頻的連續幀是高度冗余的。因此,密集的時間采樣,通常導致高度相似的采樣幀,這是不必要的。相反,基于這種情況,使用稀疏時間采樣策略更有利。所以,我們在長視頻序列上,利用稀疏采樣方案,對短片段進行提取,值得注意的是,樣本依時間維度進行均勻分布。在這一前提下,使用分段結構,對源自采樣片段的信息實施聚合處理。由這個層面上看,時間段網絡能夠在整體上建模遠程時間結構視頻。此外,這種稀疏采樣策略,使用比較低的成本,對相關信息進行保留,對時間和資源進行合理預算,以此開展對長視頻序列的端到端學習。為了充分利用視頻中的視覺內容,我們提出基于多輸入流的卷積行為識別網絡。

具體的網絡結構如下:

具體實施方法:首先,將一個輸入的視頻分割成K個部分,如接著,對得到的K組視頻序列稀疏隨機采樣得到并將輸入雙流(two-stream)卷積神經網絡中(圖中K組網絡共享參數W),輸出對應K組得分;接下來,運用平均均值的融合方法得到最終類別得分,該部分對應圖1中segmental consensus部分,并且用 表示融合后的輸出。最后將提取出時間和空間信息合并作為最終特征來進行分類處理。

在此,我們使用Softmax函數來進行分類,使用標準的分類交叉熵損失(cross-entropy loss)來度量損失函數,以及隨機梯度下降法(SGD)來訓練網絡參數。

網絡損失函數定義如下:

其中,C是動作的類別數,yi代表第i類的groundtruth標簽。

網絡結構:選擇BN-Inception結構設計時空雙流(twostream)卷積神經網絡,其中,空間流卷積神經網絡作用在單幀的RGB圖像上(single RGB images),而時間流卷積神經網絡以堆疊的光流數據幀(stacked optical flow field)作為輸入。

1.2 防止過擬合

視頻數據量過少會使得網絡面臨嚴重的過擬合問題。針對此類問題我們提出三種防止過擬合的方法

1.2.1 數據增強。數據增強能出現不同的訓練樣本,能有效避免出現嚴重的過擬合情況。在傳統的 two-stream 中,運用隨機裁剪、水平翻轉方法,拓展訓練樣本的量。此外,還可以采用兩種新方法:①角裁剪(corner cropping),即只由圖片的中心、邊角對區域進行提取,以此防止對關注圖片的中心進行默認。②尺度抖動(scale-jittering),即把輸入圖像、光流場的大小進行固定,對于裁剪區域的寬和高而言,對其進行隨機選擇。最終,這些裁剪區域能被調整成最為恰當的大小,并在網絡訓練中得以運用。事實上,這種方法不光包括了尺度抖動,還包括了寬高比抖動。

1.2.2 交叉 - 模態預訓練(Cross modality Pre-training)。當訓練樣本較少時,預訓練是一種較好的訓練神經網絡防止過擬合的方法。

1.2.3 正則化(Regularization Technique)。批量歸一化(BN)可以用來解決協方差偏移(covariate shift)的問題。

2 實驗結果

在HW[10]和Caltech101[11]數據可上進行了實驗,表1和表2給出了幾種算法和我們提出的算法的比較。由表1和表2可知,我們算法明顯優于其他幾種算法。

表1 幾種算法在HW數據庫上的識別率(%)和方差

表2 幾種算法在Caltech101數據庫上的識別率(%)和方差

3 結束語

長范圍時間結構在理解視頻中較長時間的行為上起著重要作用。深度學習雖然已經被有效地運用到靜止圖像的分類研究上,但并不能有效地提取出較長時間范圍視頻序列中的時序結構信息,因此如何設計出合適的卷積神經網絡結構來有效提取長時間范圍結構是目前行為識別需要解決的一個關鍵問題和難點。本文設計了一種卷積神經網絡,能夠有效地提出視頻序列中的圖像信息和時序結構,從而達到對行為視頻進行分類的目的。

猜你喜歡
方法
中醫特有的急救方法
中老年保健(2021年9期)2021-08-24 03:52:04
高中數學教學改革的方法
河北畫報(2021年2期)2021-05-25 02:07:46
化學反應多變幻 “虛擬”方法幫大忙
變快的方法
兒童繪本(2020年5期)2020-04-07 17:46:30
學習方法
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
最有效的簡單方法
山東青年(2016年1期)2016-02-28 14:25:23
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 亚洲色欲色欲www网| 国产精品无码久久久久AV| 国产一级一级毛片永久| 色AV色 综合网站| 亚洲欧洲国产成人综合不卡| 91丨九色丨首页在线播放| 亚洲中字无码AV电影在线观看| 青草娱乐极品免费视频| 99re在线观看视频| 国产aⅴ无码专区亚洲av综合网| 全部毛片免费看| 99视频在线看| 国产精品成人一区二区不卡 | 福利在线一区| 欧美亚洲国产视频| 国产丝袜无码精品| 日韩欧美国产综合| 国产区免费精品视频| 精品99在线观看| 国产特级毛片aaaaaa| 大陆国产精品视频| 特黄日韩免费一区二区三区| 欧美在线网| 国产美女精品一区二区| 亚洲国产综合精品中文第一| 亚洲色无码专线精品观看| 国产福利小视频在线播放观看| 亚洲中文精品久久久久久不卡| 国产青青操| 久久熟女AV| 毛片视频网址| 在线看片中文字幕| 爆乳熟妇一区二区三区| 99福利视频导航| 奇米影视狠狠精品7777| 日韩第八页| 日韩欧美国产精品| 麻豆AV网站免费进入| 国产精品成| 日韩精品成人在线| 亚洲天堂啪啪| a亚洲视频| 无码人中文字幕| 自拍偷拍欧美日韩| 永久免费av网站可以直接看的| 国产精品性| 国产高清免费午夜在线视频| 亚洲第一黄片大全| 欧美成人精品一级在线观看| 亚洲国产91人成在线| 亚洲第一成人在线| 国产又大又粗又猛又爽的视频| 国产裸舞福利在线视频合集| 亚洲an第二区国产精品| 97精品国产高清久久久久蜜芽| 精品国产欧美精品v| 最新亚洲av女人的天堂| 69国产精品视频免费| 国产区免费| 亚洲成人黄色网址| 素人激情视频福利| 亚洲成人高清无码| 亚洲成人播放| 欧美在线免费| 国产精品无码久久久久久| 亚洲综合一区国产精品| 免费一级毛片完整版在线看| 国产欧美视频一区二区三区| 无码福利视频| 精品剧情v国产在线观看| 国产综合另类小说色区色噜噜| 日韩成人在线网站| 国产一级二级三级毛片| 欧美无专区| 国产99视频精品免费视频7| 91激情视频| 国产毛片网站| 亚洲精品无码在线播放网站| 国产欧美一区二区三区视频在线观看| 欧美成人国产| 亚洲AⅤ综合在线欧美一区| 久久这里只有精品8|