999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于CNN與CRF的橋梁裂縫檢測算法

2021-01-20 07:57:22吳向東趙健康劉傳奇
計算機工程與設計 2021年1期
關鍵詞:特征提取分類區域

吳向東,趙健康,劉傳奇

(上海交通大學 電子信息與電氣工程學院,上海 200240)

0 引 言

橋梁作為我國交通系統的主要組成部分之一,對其進行定期檢測是一項極其重要的工作。橋梁裂縫的相關指標計算是橋梁檢測的重要指標之一,通過圖像處理對橋梁裂縫進行檢測一直受國內外學者廣泛關注。

瞿中等[1]提出了一種紋理特征融合與顯著性檢測相結合的路面裂縫提取算法,可達到較高的準確度和召回率。張晶晶等[2]提出了一種基于多尺度輸入圖像滲透模型的裂縫檢測算法,可有效提高裂縫檢測的精確度和穩定性。李鵬等[3]提出了一種基于雙樹復小波變換的方法,在保證準確率的同時,提高了抗干擾能力。在一些場景中,傳統的圖像處理手段雖然可有效提取出裂縫,但由于橋梁環境的特殊性,橋底光照條件差,橋梁表面的噪聲干擾嚴重,使用此種方法的魯棒性難以保證。

近年來,隨著人工智能技術的興起,國內外學者開始嘗試使用深度學習的方法對圖像中的裂縫進行提取。文獻[4-6]中介紹了一種基于滑窗掃描式的裂縫檢測方法,但此方法速度較慢。Ross Girshick等[7]提出了Faster-RCNN算法,極大提高了目標檢測任務的速度和精度。文獻[8,9] 將Faster-RCNN引入到裂縫檢測任務中,在保證速度的情況下,有效檢測出裂縫,但此方法未考慮裂縫細長、連續的特點,因此存在漏檢和誤檢的情況。

鑒于上述情況,本文提出了一種基于卷積神經網絡與條件隨機場的裂縫檢測算法。該算法首先通過特征提取網絡與區域推薦網絡對整張圖片中可能存在裂縫的部分進行初步預測,通過后續的分類回歸網絡與條件隨機場相結合,對裂縫的空間特性進行建模,綜合判定該區域是否屬于裂縫。此方法精度高,漏檢率低,抗干擾性強,可較好完成裂縫檢測的任務。

1 橋梁裂縫檢測系統框架

本文設計的橋梁裂縫檢測算法框架如圖1所示。整個系統總共由3部分組成:第一部分是由一系列卷積層、池化層以及非線性激活函數等構成的特征提取網絡,其作用是對原始的RGB彩色圖像進行特征提取,生成適合裂縫檢測的高層特征,用于后續的區域推薦網絡及分類回歸網絡。第二部分為區域推薦網絡RPN(region proposal network),其作用是生成一系列可能包含裂縫部位的候選區域。第三部分是由卷積神經網絡(convolutional neural network,CNN)及條件隨機場(conditional random field,CRF)構成分類和回歸網絡,其作用是考慮RPN提取到的各個候選區域與其空間鄰域之間的相關性,對裂縫的連續性以及走向等空間特性進行建模,據此對前一步產生的候選區域進行進一步的類別判定并對裂縫位置的預測值回歸修正。

圖1 橋梁裂縫檢測系統框架

1.1 特征提取網絡

特征提取網絡的主要作用是作為一種特征提取器,當網絡經過充分訓練之后,便可通過一系列的卷積與池化操作從原始的RGB彩色圖提取出有利于后續裂縫分類及定位的高層特征。本文采用基于Vgg16[10]的特征提取網絡,其主要架構如圖2所示。

圖2 特征提取網絡結構

由圖2可知,整體的特征提取網絡共分為5組,每組均由卷積層、非線性激活函數relu層,以及池化層構成。由于這樣的全卷積結構,整個網絡可以接受任意大小的圖像作為輸入。卷積過程中,每個卷積核的大小均為3×3,這樣做的優勢在于,多個小尺寸的卷積核進行組合可在減少計算量的同時,達到與5×5、7×7這種大的卷積相同的感受野。所有卷積操作的步長均為1,邊界填充的大小也為1,這樣圖像每次經過卷積后其寬度和高度均不會發生改變。每個池化層均采用最大池化,池化層大小均為2×2,步長也為2,這樣圖像每經過一次池化,其寬度和高度均縮減至原來的一半。因此,經過特征提取網絡后,原始尺寸為 (h,w,3) 的RGB彩色圖像將變為尺寸為 (h/16,w/16,512) 大小的特征圖。

1.2 RPN網絡

RPN網絡是用于生成可能包含裂縫部位的區域推薦網絡。其輸入是由特征提取網絡得到的特征圖,RPN網絡首先在特征圖上的每個點預設一系列不同尺度和寬高比的矩形框,將這些預設的矩形框記為anchors。本文在特征圖的每個點上設置了9種不同的anchors。9種anchors對應于3種面積與3種寬高比的組合。RPN網絡通過卷積及softmax操作對這些預設的anchors進行初步的分類及回歸,包含前景的anchors被分類為1,只有背景的anchors被分類為0,同時對這些anchors的位置進行回歸修正,使其盡可能多的包含待檢測物體。使用RPN的好處在于其較滑窗法或一些傳統的候選框生成算法如selective search,速度得到了極大的提高。RPN的架構如圖3所示。

圖3 RPN架構

通過其架構圖可看出,特征圖首先通過512個3×3,步長及邊界填充為1的卷積后,分為兩路。第一路通過18個1×1卷積及softmax操作。1×1卷積的目的在于改變特征圖的維度,即特征圖的通道數變為了18,對應于特征圖每個點上預設的9個anchors分別屬于前景及背景的概率(Pfg,Pbg)。 第二路通過36個1×1卷積操作,特征圖的通道數變為36,對應于9個anchors的4個位置坐標修正值 (tx,ty,tw,th), 設原始預設anchor的坐標及寬高為 (px,py,pw,ph), 則通過第二路輸出修正后的anchor的位置如式(1)所示

(1)

其中,gx,gy,gw,gh為修正后的anchor的中心坐標及寬、高。ProposalCreator層為一系列操作的集合,其作用在于將上述兩路卷積得到的結果進行結合。該層首先將超出原圖尺寸的anchors進行尺寸截斷,以保證所有的anchors都在原圖內,再將一些尺寸過小以及寬高比過大的anchors進行剔除,后利用第一路的輸出從高到低對這些anchors進行排序,保留前K個anchors,最后通過非極大值抑制[11]算法進行篩選,保留M個候選區域,即為RPN最終的輸出結果。

1.3 候選區域分類與回歸

經過RPN生成M個候選區域后,將通過roi-pooling[7]將這M個候選區域進行大小統一。首先根據候選區域在原圖上的位置坐標映射到特征圖上,再將映射后的區域進行相同的劃分,如都劃分為7×7的小區域,在每個小區域內做最大池化,則可將原來大小不一的候選區域都統一為 7×7 的尺寸。Faster-RCNN便將這些候選區域單獨送入后續的由CNN構成的分類回歸網絡進行進一步的分類與位置修正,得到最終的檢測結果。如果直接采用這種做法雖然也能得到相對不錯的結果,但此方法沒有考慮到裂縫的特性:一條裂縫往往是細長的,裂縫的周圍很可能存在這條裂縫的延伸,背景的附近大概率也是背景。因此,這種做法可能會造成漏檢和誤檢:一些由于拍攝條件而比較模糊的裂縫會被漏檢,一些與裂縫灰度和形狀相似的干擾如劃痕、水漬等會被誤檢為裂縫。因此,對RPN產生的候選區域進行后續分類時應綜合考慮各個候選區域的空間鄰域的像素分布情況。本文采用CRF來達到這一目的。

CRF[12]是一種概率無向圖模型,在詞性標注、序列分析、語義分割中有著廣泛的應用。設有條件概率分布模型P(Y|X), 表示給定一組輸入隨機變量X的條件下,另一組輸出隨機變量Y的條件概率分布。將此概率分布采用無向圖表示,圖中的節點表示隨機變量,圖中的邊表示隨機變量之間的依賴關系。若在給定X的條件下,輸出變量Y構成了一個馬爾可夫隨機場,即圖中表示Y的節點之間滿足成對、局部和全局馬爾可夫性,則條件概率分布P(Y|X) 為條件隨機場。根據Hammersley-Clifford定理,概率無向圖的聯合概率分布可以在其最大團上進行因子分解,其聯合概率分布可表示為如下所示

(2)

(3)

ψu(Yi)=-ln(P(Yi=1))

(4)

(5)

其中,u(Yi,Yj) 為標簽兼容函數,當Yi=Yj時,u(Yi,Yj)=1, 否則u(Yi,Yj)=0。 這表明,當給兩圖像塊Xi,Xj分配相同標簽時,其像素內容應盡可能相似,即鄰近相似的圖像塊被鼓勵分配相同的標簽。wi,j為權重系數,用以衡量圖像塊i、j之間相關性的強弱。總體的由CNN與CRF構成的分類與回歸網絡結構如圖4所示。

圖4 分類與回歸網絡

分類與回歸網絡將RPN產生的每個候選區域作為輸入,需要對其進行是否為裂縫的類別判定以及候選區域位置坐標的回歸修正。因此與RPN網絡相似,分類與回歸網絡同樣會分為兩路,第一路是由CNN與CRF構成的分類部分,分類過程中,首先取每個候選區域及周圍與該區域相同大小的圖像塊,將這9個圖像塊作為輸入,首先通過CNN進行特征提取,得到9個特征向量X, 再將這9個特征向量作為輸入送入CRF中,計算各個圖像塊標簽Y的條件概率,從而對候選區域的類別進行判定。第二路與RPN網絡類似,由CNN直接得到每個候選區域的位置坐標修正值,其計算方法與式(1)相同。

對條件隨機場模型而言,直接對目標變量的條件概率分布進行推斷無法在多項式時間內完成,精確推斷需要較大的計算開銷。因此實際應用過程中,常用近似推斷的方法。近似推斷方法可分為兩大類:采樣技術和變分推斷[14],本文采用后者進行求解。

(6)

通過最小化KL散度可得出Qi的迭代更新公式如下

(7)

其中,Zi為歸一化因子,L為Y可能取值的標簽集合,L={0,1}。 初始化時

(8)

通過若干次迭代后,則可得到Y的近似條件分布,進而對候選區域進行分類。

2 實驗與分析

2.1 實驗數據準備

在深度學習算法的搭建中,數據集的準備屬于至關重要的一環。數據量的大小、數據的多樣性、數據類別的分布等都對算法最后的性能有極大的影響。目前為止,全球尚未有公開的、帶標簽的、可直接使用的橋梁裂縫數據集。本文使用的數據由第三方合作單位提供以及實驗室無人機室外拍攝得到。原始的圖片數量共計300張。由于圖片的來源不一,其拍攝環境各不相同。不同距離、不同光照、不同類型的裂縫均有涉及,因此,數據具有一定的代表性。為提升模型的檢測效果,增強模型的泛化能力,需要在原始數據的基礎上再進行數據增強,本文對其通過隨機翻轉、加入隨機噪聲、隨機旋轉、對比度調整、隨機平移等方法對原始數據集進行了擴充,數據增強后的結果如圖5所示。

圖5 數據增強效果

通過數據增強后得到的數據共計1200張,其中900張用于訓練集,200張用于交叉驗證集,100張用于測試集。由于原圖的尺寸大小不一,為方便后續處理,首先將其尺寸由原始的 (h,w) 進行等比例縮放至 (h×scale,w×scale), 其中縮放因子scale=600/min(h,w), 即將原圖中較短的邊縮放至600像素大小,同時另一個邊乘以相同的縮放比例。最后,對訓練集中的圖片進行像素值均值統計,求出所有訓練集樣本中的R、G、B三通道均值,對每個樣本像素進行去均值處理,并歸一化,使像素值的范圍為[-1,1]。

2.2 實驗環境及設置

本文實驗所使用的硬件環境為:CPU型號為Intel Core i7-7700k,內存為16 G,顯卡型號為NVIDIA GeForce GTX-1080 TI,8 G顯存。實驗算法程序基于Pytorch框架進行編寫。整體網絡參數的初始化方法:特征提取網絡使用torchvision提供的VGG16預訓練模型進行初始化。RPN及后續CNN分類網絡均采用Xavier初始化。網絡使用帶動量的SGD方法進行參數更新,動量大小為0.9。網絡的學習率初始設置為0.001,采用指數衰減的方式進行學習率衰減,衰減系數為0.1。網絡一共訓練70個epochs,訓練批次的大小設置為batchsize=8。

2.3 評價指標

本文采用查準率P,查全率R,F1度量,P-R曲線及精度均值AP(average precision)作為評價模型好壞的標準。

在裂縫檢測任務中,記裂縫部位被正確預測為TP(true positive),裂縫部位被誤檢測為背景為FP(false posi-tive),背景部分被誤檢測為裂縫為FN(false negative)。則查準率P、查全率R的計算公式如下

(9)

(10)

其中查準率反映了模型的誤檢率,即查準率P越高,誤檢率則越低。查全率反映了模型的漏檢率,即查全率R越高,模型的漏檢率越低。一般來說,查準率和查全率是一對相互矛盾的度量,只將最有把握的樣本預測為正例,則可得到很高的查準率,然而此時查全率很低;將所有的樣本均預測為正例,則此時查全率為1,然而查準率卻很低。為綜合評價模型的性能,常采用P和R的調和平均值F1度量,其定義如下

(11)

通過改變模型的閾值,模型的P、R值會相應發生變化。以查準率P為縱軸,查全率R為橫軸,這些變化的P、R值便能形成相應的P-R曲線。如前所述,P、R值往往此消彼長,一個性能好的模型應該有如下的特性:在R增長的同時,P值應該不能下降的太快,即好的模型不應犧牲太多的查準率來提高查全率。因此P-R曲線的面積即AP值可反應模型的性能好壞。mAP(mean average precision)是目標檢測中常用的指標,它是多個類別AP的平均值,在本文中由于只有裂縫一個待檢測的類別,因此,裂縫的AP值即為模型的mAP指標。

2.4 實驗結果對比分析

為評估本文方法的性能,本文采用目前裂縫檢測任務中最常用的Faster-RCNN方法以及滑窗掃描法進行實驗結果的對比。在圖片背景中存在劃痕、水漬、孔洞等復雜干擾的情況下,3種方法的檢測結果如圖6所示。其中圖6(a)與圖6(b)為滑窗法得到的檢測結果,圖6(c)與圖6(d)為Faster-RCNN算法得到的檢測結果,圖6(e)與圖6(f)為本文提出的方法得到的檢測結果。

圖6 檢測效果對比

通過3組圖的對比可看出,滑窗法雖然能有效檢測出裂縫部位,但由于圖片中存在一些與裂縫形態和顏色比較相似的污漬和干擾,在只有滑窗內的局部信息時,這些部位很容易被誤檢為裂縫,因此此種算法的誤檢率較高。且滑窗法由于窗口的數目太多、滑窗的之間存在重疊、冗余計算較多,因此其速度往往較慢。Faster-RCNN算法雖然能夠較快準確識別出裂縫,但該算法對一些由于拍照模糊或光照不均勻造成的裂縫特征不明顯的部位,或裂縫部位周圍存在諸多干擾時,容易將裂縫判別為背景,因此該算法在圖片的干擾嚴重、光照條件不佳時,漏檢率較高。本文提出的算法則能夠以較低的漏檢率和誤檢率很好完成裂縫檢測的任務,魯棒性較好。圖7為3種算法的P-R曲線對比。

圖7 P-R曲線

圖7中pr1為本文方法的P-R曲線,pr2為Faster-RCNN 方法得到的P-R曲線,pr3為滑窗掃描法得到的P-R曲線。由圖7可看出,pr1曲線基本都能完全包住pr2和pr3,即pr1代表的查全率和查準率都要高于pr2和pr3。通過求出P-R曲線下的面積值則可得到各個模型對于裂縫對象檢測的AP指標。滑窗法的AP值約為0.693,Faster-RCNN的AP值約為0.777,本文提出的方法其AP值約為0.868,相較于前兩種方法AP分別提高了0.175和0.091。因此,本文提出的方法對于裂縫檢測任務更加準確,漏檢率和誤檢率都更低。

表1展示了3種方法在測試集上的查準率、查全率和F1度量的數值比較結果。

表1 不同方法之間的性能比較

由表1可知,在查準率上,本文提出的方法比滑窗掃描法提高了9.31%,比Faster-RCNN提高了9.01%。在查全率上,本文提出的方法比滑窗法提高了10.45%,比Faster-RCNN提高了7.72%。綜上所述,本文提出的算法對于橋梁裂縫檢測任務具有更好的效果。

3 結束語

本文提出了一種基于CNN和CRF的橋梁裂縫檢測算法。整個算法由特征提取網絡、區域推薦網絡和分類回歸網絡構成。通過引入卷積神經網絡結構以及條件隨機場CRF,結合裂縫細長連續的特點,對裂縫的空間特性進行建模,有效降低了裂縫檢測的漏檢率和誤檢率。實驗結果表明,本文提出的算法相比于目前最常用的滑窗掃描法和Faster-RCNN算法,在查準率上分別提高了9.31%和9.01%,在查全率上分別提高了10.45%和7.72%,平均準確度分別提高了0.175和0.091,取得了較好的檢測效果。

猜你喜歡
特征提取分類區域
分類算一算
基于Gazebo仿真環境的ORB特征提取與比對的研究
電子制作(2019年15期)2019-08-27 01:12:00
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
一種基于LBP 特征提取和稀疏表示的肝病識別算法
關于四色猜想
分區域
基于嚴重區域的多PCC點暫降頻次估計
電測與儀表(2015年5期)2015-04-09 11:30:52
基于MED和循環域解調的多故障特征提取
主站蜘蛛池模板: 天天综合色网| P尤物久久99国产综合精品| 免费中文字幕在在线不卡 | 亚洲第一区在线| 亚洲国产成人在线| 5388国产亚洲欧美在线观看| 秋霞国产在线| 国产成人啪视频一区二区三区 | 婷婷六月天激情| 亚州AV秘 一区二区三区| 亚洲视频在线观看免费视频| 欧美劲爆第一页| 国产精品视频3p| 久久精品国产精品一区二区| 青青操国产视频| 久久精品这里只有国产中文精品| 国产女人18水真多毛片18精品| 中文字幕无码中文字幕有码在线 | 国产欧美日韩精品综合在线| 98超碰在线观看| 亚洲婷婷在线视频| 无码人中文字幕| 久久综合亚洲色一区二区三区| 成年女人a毛片免费视频| 国产成人免费高清AⅤ| 97人妻精品专区久久久久| 国产亚洲欧美在线视频| jizz国产视频| 欧美视频在线不卡| 国产美女一级毛片| 亚洲人成成无码网WWW| 九九热这里只有国产精品| 国产亚卅精品无码| 免费看一级毛片波多结衣| 久久久91人妻无码精品蜜桃HD| 国产亚洲精品自在久久不卡| 欧美中文字幕一区| 国产真实二区一区在线亚洲| 欧美激情视频一区二区三区免费| 亚洲欧美色中文字幕| 2020亚洲精品无码| 欧美精品成人一区二区视频一| 欧美色综合网站| 国产久操视频| 亚洲欧美日韩中文字幕在线一区| 国产一在线| 国产精品自拍露脸视频| 搞黄网站免费观看| 熟女视频91| 成人无码一区二区三区视频在线观看 | 国产一级在线观看www色| 亚洲综合第一页| 久久毛片基地| 久久综合亚洲鲁鲁九月天| 国产在线观看精品| 91精品啪在线观看国产60岁| 香蕉久久国产超碰青草| 啪啪永久免费av| 日韩国产一区二区三区无码| 久久国产精品77777| 欧美午夜小视频| 亚洲高清中文字幕| 亚洲av无码人妻| 久久天天躁狠狠躁夜夜躁| 日本黄色不卡视频| 亚洲精品视频免费看| 一级福利视频| 亚洲制服丝袜第一页| 91系列在线观看| 大乳丰满人妻中文字幕日本| 亚洲乱码视频| 亚洲成a人在线观看| 国产91精品久久| 中文字幕日韩视频欧美一区| 免费观看无遮挡www的小视频| 精品久久久久久成人AV| 日韩av无码精品专区| 国产亚洲精品自在线| 亚洲欧美日韩高清综合678| www成人国产在线观看网站| 最新加勒比隔壁人妻| 久久国产精品影院|