999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于可見光圖像和紅外圖像決策級融合的目標檢測算法

2020-03-26 05:36:16侯志強劉曉義馬素剛余旺盛
空軍工程大學學報 2020年6期
關鍵詞:融合檢測

白 玉, 侯志強, 劉曉義, 馬素剛, 余旺盛, 蒲 磊

(1.西安郵電大學計算機學院, 西安, 710121;2.西安郵電大學陜西省網(wǎng)絡數(shù)據(jù)分析與智能處理重點實驗室, 西安, 710121;3.空軍工程大學信息與導航學院, 西安, 710077)

目標檢測作為計算機視覺領域的重要研究內(nèi)容,廣泛應用于目標跟蹤、行人識別、醫(yī)學圖像、視頻監(jiān)控和智能機器等方面[1-5]。目標檢測的主要任務是對圖像中預定義類別的實例目標進行高效、精確的識別與定位。

近年來,隨著深度學習技術的迅速發(fā)展,出現(xiàn)了越來越多與之相關的目標檢測算法。按照是否有區(qū)域候選框(Region Proposals)生成階段,可以將基于深度學習的檢測算法分成2類:基于區(qū)域候選框的檢測算法和非基于區(qū)域候選框的檢測算法。基于區(qū)域候選框的檢測算法首先生成區(qū)域候選框,然后使用深度學習網(wǎng)絡進行特征提取,以獲得特征對應的類別信息和坐標信息。這類算法的檢測精度較高,但是速度較慢,主要算法有SPP-NET[6]和Faster R-CNN[7]等。非基于區(qū)域候選框的檢測算法不產(chǎn)生候選框,直接使用深度學習網(wǎng)絡對圖像中每個位置存在目標的可能性進行預測。這類算法具有速度快、泛化能力強等優(yōu)點,主要算法有SSD[8]和YOLOv3[9]等。

以上所有的目標檢測算法均是對可見光圖像進行檢測,但在一些特殊場景中,紅外圖像比可見光圖像的表現(xiàn)更好。與可見光圖像相比,紅外圖像主要呈現(xiàn)目標的溫度信息,能夠抵抗遮擋等情況,在一些光照不足的環(huán)境或者隱蔽場合中,能夠很好地突出目標,例如,夜間監(jiān)控場景下的行人和復雜海天背景下的船舶等。檢測算法可以使用在精度和速度方面都有很好表現(xiàn)的基于深度學習的目標檢測算法[10-11]。但是,紅外圖像存在對比度較低、細節(jié)信息缺失嚴重等問題,因此,將可見光圖像和紅外圖像進行融合可以實現(xiàn)信息互補,以達到提高檢測精度的目的。

為了實現(xiàn)這一目標,針對可以同時獲取可見光圖像和紅外圖像的應用場景,本文提出了一種基于決策級融合的目標檢測算法,主要工作如下:建立并標注了包含可見光圖像和紅外圖像的實驗數(shù)據(jù)集,用于重新訓練YOLOv3網(wǎng)絡。提出了基于決策級圖像融合的方式,用于對可見光圖像和紅外圖像的檢測結果進行融合,并將融合后的檢測結果作為對應的融合圖像中目標的檢測結果,從而實現(xiàn)對融合圖像的準確檢測。通過實驗驗證,將本文算法和其他算法的檢測結果進行對比,本文算法可以檢測到更多的目標并且減少誤檢,進而提高目標檢測的準確性。

1 檢測網(wǎng)絡與融合方式

1.1 YOLOv3檢測算法

YOLOv3網(wǎng)絡通過主體網(wǎng)絡Darknet-53進行特征提取,并使用檢測網(wǎng)絡進行多尺度預測。其中,Darknet-53在全卷積的基礎上添加了殘差(Residual)結構[12],殘差層的結構如圖1所示,帶加號的圈表示相加的操作,表示如下:

R(x)=x+F(x)

(1)

式中:x和F(x)分別是殘差層的輸入,F(xiàn)(x)是x經(jīng)過2次卷積之后得到的結果。

圖1 殘差層結構圖

在Darknet-53之后使用特征交互層,在每個特征圖上預測3個錨點框(Anchor Boxes),進而實現(xiàn)目標位置的預測。在輸出預測結果之前,先進行特征融合,使用步長為2的卷積操作進行下采樣,然后對得到的特征圖進行拼接,使特征獲得更加豐富的語義信息。

在特征圖中,每個像素點網(wǎng)格預測3個邊界框,如圖2[9]所示。其中,cx和cy分別是網(wǎng)格的坐標偏移量,bx和by分別是邊界框中心點的橫坐標和縱坐標,bw和bh分別是邊界框的寬和高,pw和ph分別是預設的錨點框映射到特征圖中的寬和高,σ是sigmoid函數(shù),tx和ty分別是網(wǎng)絡預測的目標中心點的橫坐標和縱坐標,tw和th分別是網(wǎng)絡預測的目標的寬和高。

圖2 邊界框預測

最后,使用非極大值抑制(Non Maximum Suppression, NMS)算法[13]對邊界框進行篩選,獲得最終的目標邊界框。

1.2 圖像融合方式

圖像融合是通過對多個原圖像的信息進行相加得到融合圖像,然后對融合圖像進行分析處理的過程。根據(jù)融合處理的特點和抽象程度,將圖像融合方式[14-15]分為3類:像素級圖像融合、特征級圖像融合和決策級圖像融合。

像素級圖像融合是指選取融合策略對嚴格配準的源圖像的像素點進行處理,從而得到融合圖像的過程,例如使用基于金字塔變換[16]和小波變化[17]這類算法。這種融合方式的準確性較高,但是對像素之間的關系考慮不夠全面,處理時的計算量較大,容易產(chǎn)生大量的冗余信息。

特征級圖像融合是指提取源圖像中感興趣區(qū)域的目標特征,并對這些特征信息進行融合,最后得到融合圖像的過程,例如使用文獻[12,18]這類算法。在特征提取過程中,只保留重要的信息,對于不重要的信息和冗余的信息通常借助降維等方式去除。這種融合方式壓縮了源圖像的信息,計算速度有明顯提升,但是會丟失一些細節(jié)信息。

決策級圖像融合是一種基于認知模型的融合方式,以特征提取為基礎,對圖像的特征信息進行識別和判斷,并根據(jù)實際需要,選擇合適的決策方式對圖像進行全局最優(yōu)處理的過程,例如使用文獻[19-20]這類算法。這種融合方式的算法復雜度不高,具有一定的靈活性,針對特殊場景更加容易實現(xiàn),容錯能力強。本文使用了決策級融合方式對可見光圖像和紅外圖像的檢測結果進行融合。

2 基于決策級融合的檢測算法

本文提出的基于決策級融合的目標檢測算法主要包括3個部分:建立實驗數(shù)據(jù)集;使用YOLOv3作為基礎網(wǎng)絡對可見光圖像和紅外圖像分別進行檢測;設計決策級融合方式對檢測結果進行融合。

2.1 數(shù)據(jù)集的構建

2.1.1 數(shù)據(jù)集的分類

實驗使用的圖像均來源于李成龍團隊建立的RGBT210數(shù)據(jù)集[21],從該數(shù)據(jù)集中選取了5 105幅可見光圖像和相應的5 105幅紅外圖像,并確定了10類目標,分別為“kite”“dog”“car”“toy”“ball”“plant”“person”“bicycle”“umbrella”和“motorcycle”。表1為實驗數(shù)據(jù)集中10類目標的占比情況。

表1 數(shù)據(jù)集目標占比情況

2.1.2 數(shù)據(jù)集的處理

本文使用標注工具LabelImg進行圖像標注,以不同顏色和尺寸的矩形框確定目標的類別和位置。為了提高實驗數(shù)據(jù)的數(shù)量,通過加噪、改變圖像對比度和直方圖均衡化等圖像增強方式對原始圖像進行處理,共獲得了15 315幅可見光圖像和相應的15 315幅紅外圖像,并從中隨機選取了對應的12 000 幅圖像作為訓練集圖像,3 315幅圖像作為測試集圖像。

2.1.3 標注結果樣例

圖3為實驗數(shù)據(jù)集中4組圖像的標注結果圖,從圖中可以看出,對圖像中不同位置和不同尺寸的目標“car”和“person”進行了標注。其中,第1行是可見光圖像的標注結果圖,第2行是與可見光圖像分別對應的紅外圖像的標注結果圖。

圖3 數(shù)據(jù)集標注結果樣例

2.2 網(wǎng)絡訓練與融合前檢測

由于紅外圖像和可見光圖像攜帶不同的信息,存在一定的差異性,而且YOLOv3網(wǎng)絡的預訓練模型是通過對可見光圖像進行訓練得到的,不適用于對紅外圖像進行檢測。因此,為了保證檢測結果的準確性,本文使用可見光圖像數(shù)據(jù)集和紅外圖像數(shù)據(jù)集中的訓練集分別對YOLOv3網(wǎng)絡進行訓練。

在進行網(wǎng)絡訓練之前,修改目標類別為10,初學習率為0.000 01,批尺寸(BatchSize)為64,迭代次數(shù)為500 000次。然后,進行代碼編譯,編譯通過后開始訓練,并對訓練過程中生成的模型進行保存。最后,使用訓練完成的網(wǎng)絡模型對相應的可見光圖像測試集和紅外圖像測試集進行目標檢測。

2.3 決策級融合

為了更好地表達本文提出的決策級融合的設計思路,下面以可見光圖像中某一目標A的實際檢測結果為例進行詳細說明。

2.3.1 判定目標A是否在可見光圖像中被準確檢測

如果目標A的檢測框的置信度小于閾值α,說明檢測結果不準確,則舍棄該結果;如果檢測框的置信度大于或等于設定的閾值α,說明檢測結果準確,并保留該結果。

Dbv≥α,IoU(bv,br)<β

(2)

式中:Dbv是bv的置信度;bv和br分別是目標A的檢測框和相應的紅外圖像中與目標A同類別的檢測框;IoU(bv,br)是bv和br的交并比;α和β均為閾值。

這種方法同樣適用于判定紅外圖像中某一目標的實際檢測結果是否準確的情況。其中,閾值α(0≤α≤1,步長為0.1)的選擇見表2。

表2 選擇閾值α

從表2可以看出,當α≥0.5時,算法的平均準確度較高并呈現(xiàn)遞增趨勢,因此,當目標A的檢測框的置信度大于或等于0.5時,表明目標A的檢測結果是準確的。

2.3.2 判定目標A是否在紅外圖像中被準確檢測

結合式(2),在確保目標A在可見光圖像中的檢測結果是準確的前提下,從相應的紅外圖像中選擇與目標A的檢測框類別相同的檢測框,并計算這些檢測框與目標A的檢測框的交并比IoU。如果IoU<β,說明紅外圖像中的這些檢測框檢測的不是目標A,即目標A只在可見光圖像中被準確檢測到,并將該結果作為融合圖像中對應目標的檢測結果;如果IoU≥β,說明紅外圖像的這些檢測框中存在目標A的檢測框,進而從中選擇與目標A的檢測框的中心點距離最小且置信度大于或等于閾值α的檢測框,則該檢測框為目標A在紅外圖像中的檢測框,即目標A在可見光圖像和紅外圖像中被同時準確檢測到。這種方法同樣適用于判定在紅外圖像中被準確檢測到的某一目標是否在相應的可見光圖像中被準確檢測。其中,閾值β(0≤β≤1,步長為0.1)的選擇如表3所示。

Dbv≥α,Dbr1≥α,IoU(bv,br)≥β

(3)

式中:Dbr1是br1的置信度;br1是與bv的中心點距離最小且置信度大于或等于閾值α的檢測框;α=0.5,β=0.6。

從表3可以看出,當β≥0.6時,算法的平均準確度較高并呈現(xiàn)遞增趨勢。

表3 選擇閾值β

2.3.3 加權融合目標A的檢測結果

本文通過加權融合的方式對可見光圖像和紅外圖像中同時準確檢測到的目標A的檢測框位置進行融合,從而得到融合圖像中對應目標的準確檢測框位置。其中,加權融合的計算表示為:

Rf=θvRv+θrRr

(4)

式中:Rv和Rr分別是可見光圖像和紅外圖像中目標A的準確檢測框位置;θv和θr分別是Rv和Rr對應的權值;Rf是目標A在融合圖像中對應目標的檢測框位置。

加權融合的過程如表4所示。本文以不同權值組合下得到的檢測結果對應的平均準確度作為判斷依據(jù),選擇最高的平均準確度對應的權值組合,表中粗體數(shù)據(jù)為最優(yōu)的平均準確度。

表4 不同權值組合下的平均準確度對比

從表4可以看出,當θv=0.7,θr=0.3時,可見光圖像和紅外圖像中同一目標的檢測結果的平均準確度最高。因此,本文選擇θv=0.7,θr=0.3作為最終的權值組合,通過式(5)對目標準確檢測結果進行合并:

U=U1+U2

(5)

式中:U1是只在可見光圖像或只在紅外圖像中檢測到的所有目標的準確結果;U2是在可見光圖像和紅外圖像中同時檢測到的所有目標的準確結果;U是可見光圖像和紅外圖像的融合圖像中所有對應目標的準確檢測結果。

綜上可知,本文使用的決策級融合方式,不僅對目標檢測結果的準確性進行判斷,而且對準確的檢測結果進行了處理,最終獲得了融合圖像中目標的準確檢測結果。

2.4 算法整體框架

本文算法的具體步驟見表5,檢測過程見圖4。

表5 一種基于決策級融合的目標檢測算法

圖4 本文算法框架

3 實驗結果與分析

為了驗證本文算法的有效性,在Ubuntu 18.04,64位操作系統(tǒng)和NVIDIA GeForce GTX 1080Ti的處理器下搭建Darknet-53框架和MATLAB環(huán)境進行實驗。使用平均準確度(mean Average Precision,mAP)、召回率(Recall)、F1分數(shù)和檢測速度(Frame Per Second,F(xiàn)PS)作為評價指標,從定性和定量2個方面對算法的檢測性能進行分析。

3.1 定性分析

為了驗證決策級融合算法在目標檢測過程中的有效性,將本文算法的檢測結果與使用YOLOv3網(wǎng)絡分別檢測可見光圖像和紅外圖像的結果進行比較,如圖5所示。從圖5可以看出,YOLOv3網(wǎng)絡檢測可見光圖像時漏檢了遠處的“person”,網(wǎng)絡檢測紅外圖像漏檢了“car”,本文算法在對應的融合圖像中同時檢測到了漏檢的“person”和“car”。YOLOv3網(wǎng)絡檢測可見光圖像漏檢了左下方的“person”,檢測紅外圖像時漏檢了與可見光圖像不同的另一個“person”,而且出現(xiàn)了誤檢“car”的情況,本文算法在對應的融合圖像中不僅同時檢測到了2個漏檢的“person”,而且修正了誤檢目標的情況。

為了進一步驗證本文算法的檢測優(yōu)勢,將本文算法與其他算法的檢測結果進行對比,由于目前沒有通用的決策級融合目標檢測算法,因此,將本文算法的檢測結果與3種基于特征級圖像融合的檢測算法的結果進行比較,如圖6所示。

圖5 實驗結果對比

圖6 本文算法與3種基于特征級圖像融合的檢測算法的實驗結果對比

圖6中,基于特征級圖像融合的檢測算法分別為先使用VSM-and-WLS算法[22]進行圖像融合,再使用YOLOv3網(wǎng)絡對融合圖像進行檢測(VSM-and-WLS+YOLOv3);先使用LatLRR算法[23]進行圖像融合,再使用YOLOv3網(wǎng)絡對融合圖像進行檢測(LatLRR+YOLOv3);先使用DenseFuse算法[24]進行圖像融合,再使用YOLOv3網(wǎng)絡對融合圖像進行檢測(DenseFuse+YOLOv3)。

從圖6可以看出,VSM-and-WLS、LatLRR和DenseFuse算法在對融合圖像進行檢測時,均出現(xiàn)了漏檢目標的情況,或檢測不夠準確。本文算法檢測到了圖像中的所有目標,降低了目標的漏檢率。本文算法不僅檢測到了所有漏檢的目標,而且提高了檢測的準確性。

從以上圖例的檢測結果可以看出,決策級融合檢測算法與單獨檢測可見光圖像和紅外圖像的算法相比,減少了漏檢和誤檢目標的情況;與基于特征級圖像融合的檢測算法相比,檢測性能也均有提升,說明本文算法具有一定的優(yōu)勢。

3.2 定量分析

通過比較本文算法和5種算法在相同測試集下的檢測結果,進一步分析驗證了本文算法的檢測性能,結果見表6。粗體為最優(yōu)的目標檢測結果。

表6 本文算法與5種算法的檢測性能對比

從表6可以看出,與單獨檢測可見光圖像和紅外圖像的算法相比,本文算法的檢測精度分別提升了2.44%和21.89%,召回率分別提升了1.12%和17.21%;與3種基于特征級融合檢測的算法相比,算法的檢測精度分別提升了4.5%、1.74%和3.42%,召回率分別提升了0.48%、0.39%和0.58%;同時,F(xiàn)1分數(shù)和速度均有較好的表現(xiàn)。通過實驗比較可以證明,本文提出的基于決策級融合的目標檢測算法可以對融合圖像進行準確的目標檢測。

4 結語

本文對可見光圖像和紅外圖像的融合檢測問題進行了研究,提出了一種基于決策級融合的目標檢測算法。算法在使用YOLOv3網(wǎng)絡對可見光圖像和紅外圖像分別進行訓練的基礎上,借助基于決策級融合的方式對目標檢測結果進行處理,進而獲得了融合圖像的準確檢測結果。相較于其他算法,本文算法的檢測性能均有不同程度的提升,實現(xiàn)了對融合圖像的準確檢測。在融合過程中,本文使用的手工選擇閾值和權重的方式存在一定的局限性,在接下來的工作中,我們將對融合策略進行改進,考慮加入自適應學習過程,并且使用更多的數(shù)據(jù)集進行實驗,在保證算法魯棒性的基礎上,進一步提高目標檢測的性能。

猜你喜歡
融合檢測
一次函數(shù)“四融合”
村企黨建聯(lián)建融合共贏
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
融合菜
從創(chuàng)新出發(fā),與高考數(shù)列相遇、融合
“幾何圖形”檢測題
“角”檢測題
寬窄融合便攜箱IPFS500
主站蜘蛛池模板: 波多野结衣久久精品| 日韩高清一区 | 久久中文电影| 538精品在线观看| www.99精品视频在线播放| 欧美自拍另类欧美综合图区| 国产成人亚洲日韩欧美电影| 亚洲永久免费网站| 欧美午夜性视频| 日本久久网站| 欧美激情成人网| 国产免费福利网站| 免费亚洲成人| 亚洲欧洲天堂色AV| 亚洲成A人V欧美综合天堂| 国产成人一区| 亚洲大学生视频在线播放| 国产激情影院| 东京热高清无码精品| 国产精欧美一区二区三区| 亚洲欧洲国产成人综合不卡| 日韩精品欧美国产在线| 直接黄91麻豆网站| a毛片在线播放| 亚洲三级电影在线播放| 色噜噜综合网| 国产小视频网站| 欧美翘臀一区二区三区| 日韩 欧美 小说 综合网 另类| 91人妻日韩人妻无码专区精品| 日韩精品毛片人妻AV不卡| 97精品国产高清久久久久蜜芽| 亚洲欧美国产视频| 亚洲天堂精品视频| 久草网视频在线| 亚洲国产成人麻豆精品| 国产成人精品高清在线| 91视频免费观看网站| 中文字幕啪啪| 久久亚洲国产一区二区| 日韩欧美91| 毛片一区二区在线看| 99re这里只有国产中文精品国产精品| 日本免费福利视频| 亚洲丝袜第一页| 日韩无码黄色| 2021国产精品自产拍在线观看| 在线永久免费观看的毛片| 色吊丝av中文字幕| 国产精品一区在线观看你懂的| 国产成人高清亚洲一区久久| 亚洲欧美成aⅴ人在线观看| 欧美一区日韩一区中文字幕页| 国产日产欧美精品| 亚洲男人的天堂视频| 51国产偷自视频区视频手机观看| 这里只有精品在线播放| 亚洲欧美不卡| 97视频免费在线观看| 无码日韩视频| 91精品啪在线观看国产91| 自拍中文字幕| 久久99国产乱子伦精品免| 国内精品视频| 午夜成人在线视频| 国产尤物在线播放| 欧洲成人在线观看| 国产午夜人做人免费视频中文| 天天色天天综合网| 天天摸夜夜操| 国产一级在线播放| 真人高潮娇喘嗯啊在线观看| 国产精品久久久久鬼色| 99伊人精品| 亚洲,国产,日韩,综合一区 | 露脸一二三区国语对白| 免费在线色| 亚洲一区二区成人| 青青草国产一区二区三区| 麻豆国产精品| 少妇高潮惨叫久久久久久| 国产99在线|