999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度學習的視頻檢索方法研究*

2021-10-09 08:33:42薛繼偉劉濟塵劉顯德
計算機與數字工程 2021年4期
關鍵詞:檢測模型

薛繼偉 劉濟塵 劉顯德 李 冰

(1.東北石油大學計算機與信息技術學院 大慶 163318)(2.吉林大學軟件學院 長春 132200)

1 引言

隨著互聯網的飛速發展,視頻數據每天以驚人的速度在增加,通過人工方式在大量的視頻中檢索到特定人變得越來越困難和不切實際。由于多種原因,各類影視公司和數字媒體公司往往面臨著對特定視頻中的特殊人進行定位和再編輯的需求,而目前絕大多數非線性編輯系統中沒有智能檢索功能,都是靠人工方式進行,浪費大量人力物力。

機器學習技術推動了現代社會的許多方面:從網絡搜索到社交網絡的內容過濾,再到電子商務網站的推薦等[1]。傳統的機器學習技術因為使用數據的原始形式進行處理而受到限制。深度學習模型由于使用多個處理層來學習原始數據的多級抽象表示,在圖像識別[2~3]、語音識別[4~5]、預測潛在藥物分子的活性[6]等領域取得了重大進展。

本文提出了一種基于深度卷積網絡的視頻檢索方法,實現了在特定視頻中檢索特定人的功能,為非線性編輯及相關人員提供視頻的快速定位。

2 相關工作

自2012年Krizhevsky等利用一個8層的卷積神經網絡AlexNet[2]在當年的ImageNet圖像分類競賽(ILSVRC2012)中以top-5錯誤率15.3%的絕對優勢取得冠軍以來,卷積神經網絡在大規模圖像和視頻識別方面取得了巨大的成功。AlexNet中使用了11×11、5×5和3×3卷積核,網絡參數較多。2014年Simonyan等全部使用3×3小卷積核設計了深層卷積網絡VGG16和VGG19,獲得了ILSVRC2014比賽的亞軍,使得top-5錯誤率降低到6.8%[7]。同年Google公司的Szegedy等在網絡寬度和深度兩方面對AlexNet進行了改進,設計了22層的GoogleNet,獲得了ILSVRC2014比賽的冠軍[8]。GoogleNet的成功證明了卷積網絡不僅可以在深度上進行疊加,在寬度上同樣可以進行疊加,寬度上的疊加避免了到底選擇多大的卷積核比較合適的煩惱。之后Szegedy對GoogleNet進行了改進,于2015年推出了InceptionV2、InceptionV3[9],2016年推出了InceptionV4和Inception-ResNet[10]。當網絡層數疊加過多時往往會出現梯度彌散現象,導致網絡性能下降。2015年He Kaiming等設計了一個152層ResNet網絡,獲得ILSVRC 2015分類比賽的冠軍,使得top-5錯誤率降低到3.57%[11]。ResNet成功開創了卷積網絡不僅可以相鄰層進行連接而且可以跨層連接的歷史,使得網絡層數更深、錯誤率更低。受ResNet啟發,2017年Gao Huang等設計了DenseNet,DenseNet的任一層不僅與相鄰層有連接,而且與它的隨后的所有層都有直接連接,DenseNet緩解了梯度消失問題,增強了特征傳播,促進了特征再用,大大減少了參數的數量[12]。圖像分類網絡的成功也促進了圖像定位與識別領域的快速發展。

人臉識別系統集成了人工智能、機器識別、機器學習、模型理論、專家系統、視頻圖像處理等多種專業技術。隨著深度卷積網絡的成功應用,2016年Zhang Kaipeng等提出了基于多任務級聯卷積網絡的人臉檢測與對齊方法MTCNN,該方法在FDDB比賽和WIDERFACE測試集上取得很好的精度并保持了實時性能[13]。2015年Schroff等提出一種用于人臉識別和聚類的統一嵌入方法FaceNet,該方法在LFW數據集上的準確率達到99.63%,在You-Tube Faces DB上準確率達到95.12%,在兩個數據上的錯誤率比當時公開發表的結果降低了30%[14]。

3 本文方法

鑒于MTCNN和FaceNet的良好性能,本文以二者為基礎,實現了人臉視頻檢索功能,流程如圖1所示,包括模型訓練與人臉檢索兩個階段。

圖1 人臉視頻檢索流程

本文所用到的FaceNet和MTCNN模型代碼來源于http://github.com/davidsandberg/facenet。為適應本文方法,作者在此基礎上進行了修改。

3.1 模型訓練

模型訓練過程如圖2所示,主要由三步組成。

圖2 模型的訓練過程

step1:準備好將要被檢索的人物圖像文件,并把文件按照不同的人分別存儲到不同的文件夾中,文件夾結構如圖3所示,其中文件夾名即為人名,用于后期的分類與識別。圖4為本文用到的部分人物圖像文件。

圖3 人物圖像文件存儲結構

圖4 部分人物圖像

step2:利用MTCNN算法檢測圖像中的人臉,并把檢測到的人臉裁剪出來,為了便于后期卷積神經網絡處理,本文把檢測到的人臉圖像統一縮放到160×160像素并保存成新的文件,圖5為本文得到的部分人臉圖像。

圖5 部分人臉圖像

step3:利用得到的人臉圖像對FaceNet預訓練模型的SVM分類器進行訓練,得到自己的人臉識別模型。

3.2 在視頻中進行人臉檢索

給定一張人物照片和一段視頻,按照圖6所示過程可在視頻文件中檢索出該人出現的所有幀。具體過程如下。

圖6 視頻中人臉檢索過程

step1:輸入將要進行檢索的人物圖像文件和視頻文件;

step2:利用MTCNN模型對準備好的人物圖像進行人臉檢測與對齊得到人臉圖像;

step3:利用訓練好的FaceNet模型對step2檢測到的人臉進行識別,得到被檢索人名;

step4:利用MTCNN和FaceNet模型按照一定幀間隔對視頻的圖像進行人臉檢測,如果含有被檢索人則在framelist中添加1,否則添加0;

step5:對framelist進行處理,得到含有被檢索人的視頻的開始幀與結束幀;

step6:輸出檢索結果。

4 實驗結果

本文的主要實驗環境配置為Intel Core i7-7800X 6核CPU,32G內存,NVIDIA RTX 2080Ti顯卡,操作系統為Ubuntu16.04,Python 3.6,tensorflow 1.13.1。

4.1 實驗數據

實驗數據包括訓練集、驗證集和測試集,所有照片都是作者從網上下載的。訓練集由10名演員各20張照片共200張照片組成;驗證集由10名演員各5張照片共50張照片組成,驗證集中的照片在訓練集中未出現過。利用MTCNN進行人臉檢測與對齊的批處理語句如下:

4.2 模型訓練

由于本文實驗數據有限,所以采用預訓練模型“20180402-114759”對人臉進行特征提取,該模型使用的網絡結構為Inception ResNet v1,訓練數據集為VGGFace2,LFW準確率為99.65%。實驗中只利用200張人臉數據對FaceNet模型的SVM分類器進行訓練,批處理語句如下:

訓練后利用下面的批處理語句對驗證集中的50張人臉數據對模型進行驗證,準確率達到98%。

在訓練數據只有200張人臉圖像的情況下,能達到如此高的準確率,已是難能可貴,另一方面也說明了預訓練模型的強大。

4.3 視頻檢索

從github上下載的代碼中沒有視頻檢索功能,所以作者對利用攝像頭進行人臉識別的src/real_time_face_recognition.py文件進行了修改,一方面可以對視頻文件進行人臉檢測與識別,另一方面可以對檢測結果列表進行合并,輸出含有被檢索人的開始幀與結束幀。下文以從網上下載的一段含有趙麗穎的視頻檢索為例進行說明,利用如下的批處理語句進行視頻檢索:

檢索后將會輸出如圖7所示的framelist列表,其中:“1”表示當前幀含有被檢索人,“0”表示當前幀中不含被檢索人。

圖7 部分檢索結果列表

從圖7中我們可以看出存在如下兩種情況。

1)在多個含有被檢索人的幀之間存在少數幾幀不含檢索人(如圖7中劃線部分);

2)在多個不含有被檢索人的幀之間存在少數幾幀含檢索人;

實驗結果表明這兩種情況大多是因為漏檢或誤檢造成的。第1種情況屬于漏檢或誤檢,第2中情況屬于誤檢。為了避免漏檢或誤檢,本文對第1種情況進行特殊處理。即:當兩個“1”之間存在的“0”的個數少于所設定的threshold時,把“0”當成“1”處理,處理之后的結果如圖8所示,框起來的“1”為發生改變的元素。

圖8 threshold=10時framelist處理結果

然后對處理之后的framelist進行統計,得到若干連續“1”的開始幀和結束幀,輸出結果如下:

接下來可以根據視頻的播放頻率把幀區間轉換成如下所示的與非編時間線一致的時間區間:

與人工檢索方式對比,本段視頻共有1719幀,其中含有趙麗穎的共有1069幀,臉部不被大范圍遮擋的有859幀,本文共檢索出558幀,召回率64.96%,圖9為誤檢或漏檢的部分圖像。

圖9 部分誤檢或漏檢的圖像

5 結語

本文利用MTCNN和FaceNet模型對視頻文件進行人臉檢索,獲得該人在視頻中出現的所有幀,便于非線性編輯人員快速進行視頻幀的定位與編輯,從而節省大量勞力。但本文方法也存在如下不足:一是存在漏檢和誤檢情況;二是檢索速度離實時檢索還有距離。今后將從以下幾個方面進行改進:1)增大訓練數據集,提高識別的準確率;2)繼續研究如何利用更好、更快的人臉識別算法提高檢索的準確率和速度;3)研究如何讀取視頻的關鍵幀,免得逐幀或按固定間隔進行處理以提高檢索速度;4)改進MTCNN算法,提高人臉檢測的準確率。

猜你喜歡
檢測模型
一半模型
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
“幾何圖形”檢測題
“角”檢測題
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
小波變換在PCB缺陷檢測中的應用
主站蜘蛛池模板: 亚洲熟女偷拍| 国产AV无码专区亚洲A∨毛片| 2020最新国产精品视频| 尤物特级无码毛片免费| 日本一区中文字幕最新在线| 九九免费观看全部免费视频| 日韩欧美高清视频| www.国产福利| 成人a免费α片在线视频网站| 亚洲欧美日韩视频一区| 亚洲无码视频一区二区三区| 国产日韩AV高潮在线| 亚洲丝袜中文字幕| 黄色成年视频| 欧美亚洲国产精品第一页| 喷潮白浆直流在线播放| aaa国产一级毛片| 精品视频一区二区观看| 国产三级国产精品国产普男人| 国产精品美乳| 国产网友愉拍精品| 日本a∨在线观看| 欧美另类精品一区二区三区| 91福利在线看| 91外围女在线观看| 亚洲,国产,日韩,综合一区| 久久精品欧美一区二区| 欧美激情第一欧美在线| 久久性视频| 色天天综合| 亚洲国产中文在线二区三区免| vvvv98国产成人综合青青| V一区无码内射国产| 亚洲综合国产一区二区三区| 中文字幕资源站| 美女国产在线| a级毛片免费看| 91精品亚洲| 一区二区三区高清视频国产女人| 亚洲第一区欧美国产综合| 久久精品人妻中文系列| 三上悠亚一区二区| 国产人免费人成免费视频| 国产成人综合亚洲欧美在| 最新国产网站| 高清国产va日韩亚洲免费午夜电影| 久久无码免费束人妻| 久久毛片基地| 91久久偷偷做嫩草影院| 欧美性色综合网| 亚洲va视频| 日本日韩欧美| 免费国产黄线在线观看| 怡春院欧美一区二区三区免费| 欧美翘臀一区二区三区| 亚洲娇小与黑人巨大交| 日韩A∨精品日韩精品无码| 午夜视频在线观看免费网站| 97狠狠操| 色网站在线视频| 一级毛片免费观看不卡视频| 天堂成人在线| 99成人在线观看| 日韩一级二级三级| 毛片卡一卡二| 国产精品久线在线观看| 人妻一区二区三区无码精品一区| 国产人妖视频一区在线观看| 国产性精品| 欧美无遮挡国产欧美另类| 久草国产在线观看| 乱人伦中文视频在线观看免费| 国产精品欧美在线观看| AV熟女乱| 91精品国产自产91精品资源| 青青操国产视频| 久久免费视频6| 免费在线看黄网址| 五月综合色婷婷| 国产成人高清精品免费| 福利在线不卡一区| 亚洲欧美精品一中文字幕|