999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

語境信息約束下的多目標檢測網絡

2019-03-11 07:29:31鄔亞男,李君君,張彬彬
智能計算機與應用 2019年6期

鄔亞男,李君君,張彬彬

摘要:目標檢測問題一直是計算機視覺以及機器學習領域非常重要的研究課題,并且在交通監控、醫學影像、輔助駕駛等方面有著廣泛的應用。由于現實任務對于檢測速度和精度的要求,目標檢測一直是計算機視覺領域具有挑戰性的任務。語境信息可以作為推理的關鍵證據應用于多目標識別領域。由此,提出語境信息約束下的直接預測目標類別和目標位置的多目標檢測網絡。該網絡采取端對端的訓練方式,分層提取特征,并利用語境信息微調網絡的輸出結果以更好地進行實時預測。在PASCAL VOC 2007數據集上的定性及定量實驗結果,證明了深度語境網絡下的目標檢測模型具有顯著的目標檢測性能,優于當前先進的方法。實驗證明,利用語境信息可以為目標檢測提供有效的判定依據,提高檢測的準確率。

關鍵詞:目標檢測;語境信息;實時檢測;卷積神經網絡

0引言

目標檢測的任務是集目標分類、目標定位兩者之所長,檢測輸入圖像中所有感興趣的目標的類別屬性和位置屬性,輸出相對應的概率標簽,表明將目標分類為該類別的概率,明確輸入圖像中感興趣物體的位置和范圍,以矩形框表示物體的所在。目標檢測問題一直是計算機視覺以及機器學習領域非常重要的研究課題,并且在視頻監控、行人檢測、行為識別、場景理解等方面有著廣泛的應用。

傳統目標檢測模型主要由人工設計特征以及分類決策構成。通過人工設計特征表達,然后設計相應的分類器對目標進行檢測。雖然這些手工制作的方法取得了令人矚目的成功,但其在實踐中不能靈活捕獲圖片信息,這可能會阻礙性能進一步提高。隨著機器學習理論逐步完善以及深度學習技術的日益發展,深度網絡模型不斷發展壯大,對于特征的表達能力日益增強,檢測精度也得以提升。目標檢測任務從傳統模型逐漸向基于深度學習的模型研究,涌現了一大批深度網絡下的目標檢測模型。盡管如此,由于現實任務高精度、高速度的目標檢測需求,當前的目標檢測結果仍然差強人意。因此,深度檢測模型設計仍然面臨著巨大的壓力,仍然是亟待優化和解決的具有挑戰性的研究課題。

語境線索在搜索和檢測物體中有著重要作用,并且在計算機視覺和認知神經科學等方面有著重要的應用。語境有助于圖像理解,符合現實世界的客觀規律,語境信息對于人類識別物體也至關重要,計算機視覺的許多研究證明,通過適當的語境建模能夠有效改進識別算法。由于視覺對象在其外觀、動作等方面變化很大,通常難以僅使用局部線索來學習魯棒模型。同時,由于物體幾乎不是孤立地發生的,其語境信息,可以用來評估目標檢測模型的輸出并提高檢測性能。本文的主要貢獻如下:

(1)在SSD模型基礎上,提出語境信息約束下的直接預測目標類別和目標位置的多目標檢測網絡,該網絡采取端對端的訓練方式,分層提取特征并進行實時的目標檢測。

(2)采用語境信息作為約束條件,預測目標類別和目標位置,利用語境信息微調網絡的輸出結果,以更好地進行實時預測。

(3)在PASCAL VOC 2007數據集上的實驗結果,證明了本文方法在公開數據集測試中具有顯著的目標檢測性能,優于當前先進的方法。

1相關工作

針對圖像目標檢測問題,通常有兩種常見的目標檢測模型,一種為基于滑動窗口的目標檢測模型,另一種為基于區域提議的目標檢測模型。在卷積神經網絡出現之前,DPM和選擇性搜索受到了許多的關注。在R-CNN結合選擇性搜索、區域提議以及卷積神經網絡帶來顯著改進后,基于區域提議的目標檢測方法變得流行。

SPPnet顯著加快了原有的R-CNN方法,其引入了一個空間金字塔池化層,對區域大小和尺度更加魯棒,并允許分類層重用多個圖像分辨率下生成的特征映射上計算的特征。Fast R-CNN擴展了SPPnet.使得其可以通過最小化置信度和邊界框回歸的損失,來對所有層進行端到端的微調,并初次利用MuhiBox學習目標信息。然而,Fast R-CNN仍然選擇使用選擇性搜索進行區域提議,浪費了太多的檢測時間。據此,Faster R-CNN提出區域提議網絡進行區域提議,并引入了一種方法,通過微調共享卷積層和預測層將區域提議網絡和Fast R-CNN結合在一起,使用區域提議網絡池化中級特征,提升了檢測速度。

基于滑動窗口的目標檢測模型完全跳過提出步驟,直接預測多個類別的邊界框和置信度。OverFeat是首先利用滑動窗口進行目標檢測的方法,在知道了底層目標類別的置信度之后,直接從最頂層的特征映射的每個位置預測邊界框。之前常見的檢測方法都將檢測轉換為分類問題,而YOLO另辟蹊徑,僅僅經過一個神經網絡,將檢測轉換為回歸問題,從而實現端對端優化。YOLO使用整個最頂層的特征映射來預測多個類別和邊界框(這些類別共享)的置信度。YOLO經過不斷更新多次優化升級得到目前的YOLOv3.并在設計上進行了一定的改進:首先融合先前的Darknet-19網絡以及殘差網絡,設計出DarkNet-53網絡進行特征提取,功能更加強大。此外,YOLOv3還能夠進行跨尺度預測,利用金字塔網絡的概念預測出三個不同的尺度上邊界框。

語境信息可以作為推理的關鍵證據應用于多目標識別領域。然而,上述研究忽略了語境信息的重要作用,僅僅利用設計的目標檢測器檢測對象類別及位置,結果可能會違反現實世界中的規律。在考慮語境信息之后,準確性得到了很大改善。在傳統模型中,檢測算法由人工設計特征及淺層分類器構成。語境信息可作為正則化約束條件,調整檢測結果以提高性能,也可以約束深度學習模型,利用這種豐富的且有區別的語境信息有助于機器獲取行為發生時相應的場景信息,獲得圖像內容的理解,提高檢測的準確度。例如,Bell等人也分別對語境和外部場景進行了建模。利用空間循環神經網絡分別對感興趣區域的外部環境整合了多尺度語境,有助于特定的小目標檢測。Zhe等人通過可學習的直方圖層在端到端訓練中學習深度神經網絡中的統計語境特征,將可學習的直方圖層集成到深層網絡中,探索了語義分割和目標檢測兩個視覺問題。Heilbron等人提出語境級聯模型,通過采用與人類活動相關的語義先驗,語境級聯模型產生高質量的特定類別的行動提議,并通過級聯的方式抑制無關的活動提議。

2語境信息約束下的多目標檢測網絡

利用語境信息作為約束條件,能夠準確且有效地捕捉圖片中除了目標物本身之外的所有信息(包括其它目標信息和背景信息)。語境信息作為目標檢測推理過程的關鍵證據,具有重要的作用及意義。以此作為切入點,構建語境信息約束下實時的多目標檢測網絡,如圖l所示。該網絡分層提取特征并依次進行邊框回歸和分類,從而得到圖像中所有感興趣的目標類別屬性和位置屬性。

語境信息約束下的多目標檢測網絡的主要貢獻如下:

(1)在SSD模型基礎上進行改進,提出語境信息約束下能夠端對端訓練的多目標檢測網絡,并依次進行邊框回歸和分類。

(2)采用語境信息約束網絡輸出結果,微調網絡的輸出結果以更好地進行實時預測。

2.1語境約束

多目標檢測網絡經過初步訓練,將得到訓練集圖像所有候選框中目標的語義類別、標簽以及所有候選框的位置坐標。由此,可以計算出候選框中心位置點的坐標。已知語義類別集合,可得候選目標O的位置屬性v.以及候選目標的語義屬性a。定義語義存在矩陣,統計每一幅圖像中出現的類別,語義存在矩陣,統計所有訓練集圖像中同時出現的類別,對即可得語義類別共現頻率矩陣,統計訓練集圖像中同時出現的類別頻率。由候選目標的語義屬性以及語義類別共現頻率矩陣作為語義信息獲取目標類別關系。目標類別之間語義約束置信度獲取方法如下:

其中,I表示訓練集圖像I(n)∈Itrain;a表示語義類別集合am,an∈a;v表示候選框vi,vj∈ v;o候選框中目標的語義類別標簽;I表示計數函數。

由目標對的位置信息可計算類別間的相對位置信息。該信息是一個向量,包含兩個類別間的距離和角度信息,由目標對的相對位置信息可計算類別間相對位置,分別作為位置信息獲取目標類別關系。目標類別之間位置約束置信度獲取方法如下:

其中,[xi,yi]表示候選框的中心位置坐標;[△xij,△yij]表示屬于兩個類別am,an之間的候選框vi,vj相對位置;v為目標對的相對位置均值;σ2為目標對的相對位置方差;f為標準正態分布函數。

根據捕獲的目標類別關系,微調候選目標框的類別得分。通過語境約束Csemantic以及Clocation判斷后,對于每張圖片的每個目標,考慮所有與之相關的候選框類別,得到最終類別置信度c。

2.2網絡模型

語境信息約束下的多目標檢測網絡與Faster R-CNN中的區域提議網絡非常相似,也使用了一組固定的邊界框進行預測,類似于RPN中的錨邊界框。但并不是使用這些來池化特征并評估另一個分類器,而是為每個目標類別在每個邊界框中同時生成一個分數。因此,本文的方法避免了將區域提議網絡與Fast R-CNN合并的復雜性,并且更容易訓練,更快且更直接地集成到其它任務中。語境信息約束下的多目標檢測網絡使用默認邊界框,方法比現有方法更靈活,可以在不同尺度的多個特征映射的每個特征位置上使用不同長寬比的默認邊界框。如果只從最頂層的特征映射的每個位置使用一個默認框,語境信息約束下的多目標檢測網絡將具有與OverFeat相似的架構,若使用整個最頂層的特征映射,并添加一個全連接層進行預測來代替卷積預測器,并且沒有明確地考慮多個長寬比,將近似地再現YOLO。

利用在ILSVRC CLS-LOC數據集上已經預先訓練好的VGG16網絡,作為基礎卷積神經網絡架構。通過多層卷積分層提取特征,直接檢測圖像中的目標,最終獲得固定尺度的邊界框以及對象的類別。將多個卷積層添加到VGG16第五個卷積層之后,VGG第六、七層原本為全連接層,將其替換為卷積層,從其中重采樣參數。然后繼續增加4個卷積層,所以總共含有6種尺度的卷積層,尺寸逐漸減小,每種尺度的卷積層都能學習到一個特征圖,將6種尺度卷積層學習的多個特征圖預測組合在一起,以便于針對不同尺度的目標檢測問題。SSD模型訓練一開始,需要將真實信息分配給固定的檢測器,輸出集合中的特定輸出,一旦確定了這個分配,損失函數和反向傳播就可以應用端到端了。通過計算交疊面積,保證唯一的默認框與真實標簽一一對應,之后只要交疊面積大于設定的閾值就將默認框與真實標簽進行隨機匹配,使網絡可以預測同個位置的多個框。測試時,根據訓練好的模型得到每個候選框中的目標類別的預測分數,同時對候選框進行調整以便于更好地匹配目標形狀。使用隨機梯度下降,對得到的語境信息約束下的實時多目標檢測網絡模型進行微調,初始學習率為10-3,動量為0.9.權重衰減為0.0005.批處理數據大小為32。針對每個數據集的學習速率衰減策略略有不同,本文使用Caffe框架,實驗環境硬件平臺配置為CoreX i7-6800k 6核、3.4GHz CPU、2塊NIVDIA GTX10808GB顯卡。整個語境信息約束下的實時多目標檢測網絡訓練過程的損失函數為:

其中,x為網絡輸入;c為類別置信度;l和g分別為預測框和真實標簽;Lconf代表置信損失,置信度損失是在多類別置信度上的softmax損失;Lloc代表定位損失,定位損失是預測框與真實框參數之間的Smooth L1損失,

3實驗結果與分析

3.1數據集與評價標準

由于PASCAL VOC 2007數據集是一個有著明顯層級結構的多類別、多目標類型的數據集,類別、目標之間具有明顯的共生關系。所以本文選擇在PASCAL VOC 2007數據集上評估DCN方法。該數據集包括20個對象類別,9963張高質量圖片。其中5011張訓練和驗證集圖像,4952張測試圖像,包含24640個已標注的目標,該數據集為圖像分割、目標識別和目標檢測提供標準。為了證明DCN方法的檢測精度,本文采用類別平均精準度(Ap.Average Precision)值和平均AP(mean AP)值進行評測。

其中,N(TruePositives)ci為正確預測的數量;N(TotalObjects)ci該圖像中給定類別ci的實際目標的數量;Precisionci為類ci的精度。平均AP值即為所有類別的平均精度求和除以所有類別。

實驗方法中,如果預測窗口與數據集標定的ground-truth窗口面積IoU重疊大于50%(mAP@IoU=0.5),則認為此提議窗口的檢測是正確的,否則是錯誤的,

3.2實驗結果分析

本文在PASCAL VOC 2007數據集上進行實驗驗證,并與當前先進檢測方法R-CNN、Fast R-CNN、Faster R-CNN、G-CNN、OHEM、SSD進行對比,以驗證語境信息約束下的多目標檢測網絡方法的目標檢測效果。

表1給出了不同線索下語境信息約束下,多目標檢測網絡在PASCAL VOC 2007數據集上得到平均準確率值,以證明不同線索對檢測結果的影響。其中semantic代表語義約束,location代表位置約束。由表1可得,語境信息約束分別作用以及共同作用下的多目標檢測網絡對于檢測精度的提升效果。

表2給出了語境信息約束下的多目標檢測網絡與對比方法,分別在PASCAL VOC 2007數據集上的平均AP值以及20個類別條件下得到平均準確率值。由表2可得,在PASCAL VOC 2007數據集下以及20個類別條件下得到的平均準確率,總體優于當前先進方法。

語境信息約束下的多目標檢測網絡能夠在一定程度上處理漏檢(chair、bird)、誤檢(potted plant、sofa)等問題,針對檢測錯誤以及不準確等問題進行修正,提升檢測的精準度,具有更好的檢測效果,如圖2所示。

圖3給出了PASCAL VOC 2007數據集上6個示例類別的平均精準度柱狀圖結果,驗證了利用語境信息約束能夠提升多目標檢測網絡的檢測效果,語義約束和位置約束對于目標檢測有著重要的作用。

4結束語

本文介紹了語境信息約束下的多目標檢測網絡,是一種快速的單次多類別目標檢測器,模型的關鍵特性是使用網絡頂部多個特征映射的多尺度卷積邊界框輸出,這種表示能夠高效地建模可能的邊界框形狀空間。語境信息約束下的多目標檢測網絡在準確性和速度方面與其對應的最先進的目標檢測器相比毫不遜色。在PASCAL VOC 2007數據集上的實驗結果證明了本文方法在公開數據集測試中具有顯著的目標檢測性能,提高了檢測精度,優于當前先進的方法,在此基礎上仍然存在許多可以深入研究的方向,其中有前景的未來方向是探索其作為系統的一部分,使該模型作為目標檢測組件的大型系統有用的構建模塊,同時檢測和跟蹤視頻中的目標。

主站蜘蛛池模板: 素人激情视频福利| 国产高清毛片| 欧美一道本| 国产成人无码综合亚洲日韩不卡| 亚洲欧洲日产国码无码av喷潮| 国产办公室秘书无码精品| 一级爆乳无码av| 视频国产精品丝袜第一页| 亚洲一区二区在线无码| 综合亚洲网| 三级欧美在线| 免费一级成人毛片| 97在线免费| 亚洲丝袜中文字幕| 香蕉视频在线精品| 一级全免费视频播放| 国产噜噜在线视频观看| 青青青国产免费线在| 免费播放毛片| 国产AV毛片| 成人午夜视频免费看欧美| 久久黄色免费电影| 国产欧美高清| 精品超清无码视频在线观看| 天天综合网色中文字幕| 午夜一区二区三区| 91视频区| 免费看久久精品99| 国产亚洲精品资源在线26u| 97国产在线播放| 女人18毛片一级毛片在线 | 久久99这里精品8国产| AV老司机AV天堂| 亚洲成人www| 国产本道久久一区二区三区| 国产成人三级| 国产网友愉拍精品| 天天综合色网| 国产精品亚洲欧美日韩久久| 一级看片免费视频| 国产成a人片在线播放| 国产美女在线观看| 第九色区aⅴ天堂久久香| 国产草草影院18成年视频| 99精品在线视频观看| 在线精品欧美日韩| 亚洲成人在线免费| 精品成人一区二区三区电影| 国产国拍精品视频免费看| 国产欧美日韩专区发布| 国产亚洲精品91| 欧美区国产区| 激情乱人伦| 国产精品不卡永久免费| 全部毛片免费看| 青青国产视频| 午夜电影在线观看国产1区| 98超碰在线观看| 天天摸天天操免费播放小视频| 国产日本视频91| 免费看a级毛片| 亚洲精品在线91| 色综合五月婷婷| 秋霞午夜国产精品成人片| 国产屁屁影院| 欧美另类第一页| 国产精品思思热在线| 免费日韩在线视频| 黄色在线不卡| 欧美日韩福利| 国外欧美一区另类中文字幕| 欧美日韩高清在线| 国产精品观看视频免费完整版| 激情综合婷婷丁香五月尤物| 国产精品视频a| 黑色丝袜高跟国产在线91| 国内毛片视频| 国产精品lululu在线观看| 国产欧美另类| 999国产精品| 在线观看免费AV网| 久青草国产高清在线视频|