楊紫艷 馬龍博 鄧 凌 史有玉
(東北林業(yè)大學(xué)土木工程學(xué)院,黑龍江 哈爾濱 150040)
橋梁在役期間受環(huán)境等因素的影響,其自身各部分結(jié)構(gòu)會(huì)產(chǎn)生不同程度的損傷和劣化。常見(jiàn)的橋體結(jié)構(gòu)病害特征有裂縫、剝蝕、鋼筋銹蝕、混凝土碳化等,而橋梁裂縫作為一種主要的橋體結(jié)構(gòu)病害特征,對(duì)橋梁健康狀態(tài)綜合評(píng)定結(jié)果有重要影響[1]。
傳統(tǒng)的人工檢測(cè)方法,在檢測(cè)效率、檢測(cè)精度上、勞動(dòng)強(qiáng)度、成本等方面存在很多不足[2]。近年來(lái),無(wú)人機(jī)被廣泛地應(yīng)用在施工和工程質(zhì)量檢測(cè)工作中,大量學(xué)者研究基于無(wú)人機(jī)的橋梁裂縫自動(dòng)化檢測(cè)技術(shù):基于無(wú)人機(jī)采集圖像和相關(guān)數(shù)據(jù),利用圖傳技術(shù)收集橋梁外觀信息,研究圖像識(shí)別算法,實(shí)現(xiàn)橋梁裂縫的自動(dòng)化檢測(cè)識(shí)別,其技術(shù)的核心問(wèn)題和研究重點(diǎn)是圖像識(shí)別算法。傳統(tǒng)的圖像處理算法在裂縫識(shí)別效果上無(wú)法滿足橋梁檢測(cè)工作的要求。卷積神經(jīng)網(wǎng)絡(luò)的出現(xiàn),很大程度上提升了圖像識(shí)別的準(zhǔn)確率[3-5],應(yīng)用該算法實(shí)現(xiàn)圖像識(shí)別的效果已經(jīng)得到大量學(xué)者的驗(yàn)證。
本文以卷積神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),提出一種基于無(wú)人機(jī)的橋梁裂縫識(shí)別的技術(shù),該技術(shù)為實(shí)現(xiàn)橋梁自動(dòng)化檢測(cè)提供一定幫助。
卷積神經(jīng)網(wǎng)絡(luò)的研究最早開(kāi)始于20世紀(jì)80年代,一些學(xué)者開(kāi)展了卷積神經(jīng)網(wǎng)絡(luò)(CNN)的相關(guān)科研工作,并在手寫(xiě)數(shù)字識(shí)別中取得了良好的圖像自動(dòng)化識(shí)別效果[6]。然而受計(jì)算機(jī)性能等因素限制,此時(shí)卷積神經(jīng)網(wǎng)絡(luò)無(wú)法很好地對(duì)大規(guī)模的數(shù)據(jù)進(jìn)行識(shí)別分析。2012年AlexNet網(wǎng)絡(luò)的出現(xiàn)說(shuō)明卷積神經(jīng)網(wǎng)絡(luò)在大數(shù)據(jù)分析上存在更多的可能性。此后,更多更深的卷積神經(jīng)網(wǎng)絡(luò)模型被提出。如今,輕量型的卷積神經(jīng)網(wǎng)受到更多人的認(rèn)可。縱觀卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展史,卷積神經(jīng)網(wǎng)絡(luò)模型經(jīng)歷了從簡(jiǎn)到繁再到簡(jiǎn)的過(guò)程。
近年來(lái),國(guó)外對(duì)基于卷積神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別技術(shù)的應(yīng)用進(jìn)行了深入研究。基于CNN的圖像識(shí)別技術(shù)不僅被應(yīng)用在工程建設(shè)領(lǐng)域,在醫(yī)學(xué)上也可用于實(shí)現(xiàn)醫(yī)學(xué)影像的識(shí)別分析。國(guó)內(nèi)學(xué)者對(duì)卷積神經(jīng)網(wǎng)絡(luò)的研究也取得了一定的進(jìn)展,如溫作林等[7]設(shè)計(jì)了一種名為CrackNet的深度卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)用于提取圖像特征,較好地實(shí)現(xiàn)了橋梁裂縫的檢測(cè)識(shí)別與定位,通過(guò)模型訓(xùn)練結(jié)果分析,該模型表現(xiàn)出較強(qiáng)的魯棒性和高效性。
卷積神經(jīng)網(wǎng)絡(luò),在訓(xùn)練速度上優(yōu)于其他機(jī)器學(xué)習(xí)算法,其可通過(guò)局部感知、權(quán)值共享和池化等方法大大減少層間的連接和所需要的參數(shù),加快神經(jīng)網(wǎng)絡(luò)訓(xùn)練的速度。卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)一般由以下五層構(gòu)成:輸入層、卷積層、池化層、激活層、全連接層。
輸入層用于數(shù)據(jù)預(yù)處理,可通過(guò)數(shù)據(jù)標(biāo)準(zhǔn)化、歸一化、去均值等方式處理用作訓(xùn)練的數(shù)據(jù)。卷積層主要用于圖像特征的提取,卷積核以一定的步長(zhǎng)以滑動(dòng)窗口的形式與圖像矩陣做數(shù)乘法后求和。池化可聚合卷積操作提取的特征,降維減少運(yùn)算量。卷積后的特征圖有相當(dāng)多的冗余信息,池化的目的就是去除冗余信息,同時(shí)保留圖片最重要的信息,常見(jiàn)的池化方式有平均池化、最大池化、求和池化。模型采用最大池化方式進(jìn)行特征的聚合。激活層利用激活函數(shù)解決了部分圖像數(shù)據(jù)非線性可分的問(wèn)題,可提高深層神經(jīng)網(wǎng)絡(luò)的表達(dá)能力。全連接層則整合局部信息,同時(shí)將輸出的值送給分類器。
選擇合適的橋梁作為調(diào)查對(duì)象,利用無(wú)人機(jī)搭載攝像頭近距離提取橋梁外觀影像數(shù)據(jù)。處理實(shí)地調(diào)研收集到的圖片數(shù)據(jù)和從網(wǎng)絡(luò)資源中搜集到的橋梁部位圖片作為原始樣本集。鑒于數(shù)據(jù)集的大小對(duì)算法的準(zhǔn)確率會(huì)產(chǎn)生一定的影響,可通過(guò)擴(kuò)大數(shù)據(jù)集的方式解決模型的過(guò)擬合問(wèn)題。將處理好的原始圖片通過(guò)原始裁剪、平移變換、旋轉(zhuǎn)變換等增加訓(xùn)練數(shù)據(jù)。然后,將處理好的每一副圖片進(jìn)行編號(hào),將其標(biāo)記為裂縫或非裂縫,用于模型的訓(xùn)練、測(cè)試和驗(yàn)證。取樣本集中的部分圖片預(yù)覽如圖1所示。

邊緣檢測(cè)是圖像預(yù)處理中常用的處理原始圖像樣本的方法。邊緣檢測(cè)主要檢測(cè)的是圖片顏色變化比較明顯的地方。原始樣本圖片的邊緣檢測(cè)預(yù)處理對(duì)于卷積神經(jīng)網(wǎng)絡(luò)特征的提取具有重要的意義,在一定程度上能提高模型訓(xùn)練的準(zhǔn)確率。本文采用Roberts算子進(jìn)行邊緣檢測(cè),該算子對(duì)于低噪聲的圖像具有良好的處理效果。經(jīng)過(guò)Roberts算子邊緣檢測(cè)處理后的效果如圖2,圖3所示。


由于拍攝環(huán)境的不同,圖片的灰度、曝光度存在差異,對(duì)模型權(quán)值更新將產(chǎn)生一定影響。對(duì)訓(xùn)練集圖片數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理可在一定程度上增強(qiáng)模型的泛化能力,模型采用z-score數(shù)據(jù)標(biāo)準(zhǔn)化方式,具體公式為:
其中,μ為原始圖像數(shù)據(jù)的均值;x為圖像矩陣;σ為原始數(shù)據(jù)的標(biāo)準(zhǔn)方差。
該模型以兩組卷積核和池化層為基礎(chǔ),通過(guò)兩層全連接層連接特征,采用Softmax分類器輸出在每個(gè)可能的類標(biāo)簽上的概率分布,然后分析類標(biāo)簽上的概率分布對(duì)圖像進(jìn)行分類。卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)如表1所示。

表1 卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)
激活函數(shù)又稱激勵(lì)函數(shù),sigmoid,tanh,Relu,ELU,Maxout等是常見(jiàn)的幾種激活函數(shù)。通常激活函數(shù)具有以下部分特性:非線性、連續(xù)可微、單調(diào)性、范圍最好不飽和、在原點(diǎn)近似線性。需要注意的是,目前沒(méi)有一種激活函數(shù)能滿足以上全部性質(zhì)。本文采用非飽和激活函數(shù)Relu:
f(x)=max(0,x)。
Relu函數(shù)圖像如圖4所示,由圖4可知,相較于其他激活函數(shù),Relu函數(shù)只需要判斷輸入是否大于0,因此在訓(xùn)練速度上Relu函數(shù)要快很多。

無(wú)人機(jī)拍攝的橋梁外觀圖片存在亮度不均的問(wèn)題,為了削弱圖片不同亮度對(duì)橋梁裂縫檢測(cè)的影響,添加局部響應(yīng)歸一化層用于構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)的局部側(cè)抑制機(jī)制。局部響應(yīng)歸一化(LRN)可將不同卷積核Relu后的特征歸一化,提高深度學(xué)習(xí)準(zhǔn)確度、增強(qiáng)模型的響應(yīng)能力。批量歸一化(BN)同樣可增強(qiáng)模型的泛化能力,與局部響應(yīng)歸一化(LRN)側(cè)抑制機(jī)理不同,批量歸一化(BN)則通過(guò)減少內(nèi)部協(xié)變量轉(zhuǎn)移實(shí)現(xiàn)數(shù)據(jù)的歸一化處理。
LRN首次由Alexnet提出:

卷積層在提取圖像局部特征的過(guò)程中,圖像隨著卷積操作的進(jìn)行逐漸變小,容易導(dǎo)致圖像邊界信息的丟失,但邊界信息對(duì)特征的提取同樣發(fā)揮著一定的作用。為減少邊界信息特征的損失,模型對(duì)圖像進(jìn)行邊界填充處理。
利用經(jīng)過(guò)數(shù)據(jù)預(yù)處理的訓(xùn)練集訓(xùn)練搭建好的卷積神經(jīng)網(wǎng)絡(luò)模型,并利用優(yōu)化器不斷更新和計(jì)算網(wǎng)絡(luò)參數(shù)值,使損失函數(shù)最小化(或最大化)。在神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練中,常見(jiàn)的優(yōu)化器有SGDM,Adam,Adagrad等,模型采用自適應(yīng)估計(jì)Adam作為優(yōu)化器,對(duì)權(quán)重、偏置項(xiàng)和學(xué)習(xí)率進(jìn)行修正,設(shè)置基礎(chǔ)學(xué)習(xí)率為0.000 1,訓(xùn)練步數(shù)為6 000。
模型經(jīng)過(guò)訓(xùn)練后可得出多個(gè)不同的模型,之后,用驗(yàn)證集驗(yàn)證各個(gè)模型的性能和分類能力。此時(shí),同一參數(shù)的不同取值可擬合出不同的分類器。
模型經(jīng)過(guò)訓(xùn)練集和測(cè)試集訓(xùn)練后各項(xiàng)參數(shù)達(dá)到較優(yōu)值。最后,利用測(cè)試集預(yù)測(cè)模型的正確率、損失率等各項(xiàng)指標(biāo)。同時(shí),檢驗(yàn)?zāi)P妥R(shí)別裂縫圖片的準(zhǔn)確率,實(shí)驗(yàn)結(jié)果顯示該模型具有良好的識(shí)別效果。
1)本文證實(shí)了無(wú)人機(jī)在橋梁外觀檢測(cè)工作中的應(yīng)用價(jià)值:利用無(wú)人機(jī)代替人工巡檢,通過(guò)記錄航空攝影采集橋梁結(jié)構(gòu)圖片數(shù)據(jù),并進(jìn)行高精度定位,同時(shí)可對(duì)橋梁外觀易損結(jié)構(gòu)進(jìn)行重點(diǎn)檢測(cè),有利于提高橋梁養(yǎng)護(hù)工作效率,消除人工檢測(cè)的弊端,推進(jìn)土木工程領(lǐng)域的智能化水平。
2)本文將無(wú)人機(jī)和基于卷積神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別技術(shù)結(jié)合在一起,實(shí)現(xiàn)了橋梁裂縫的自動(dòng)化檢測(cè):整理無(wú)人機(jī)獲取的橋梁外觀圖片,并對(duì)其進(jìn)行預(yù)處理。搭建卷積神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練處理好的橋梁樣本數(shù)據(jù)集,利用訓(xùn)練好的模型識(shí)別橋梁裂縫圖片和完好圖片,實(shí)驗(yàn)結(jié)果表明該方法在識(shí)別效果上優(yōu)于傳統(tǒng)的圖像處理技術(shù)。通過(guò)該例子可證明基于卷積神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別技術(shù)在橋梁裂縫識(shí)別中的實(shí)用性和可行性。該技術(shù)還可用于道路、房屋建筑等裂縫的識(shí)別,能有效減少建筑物安全巡檢的人力、物力,在道路橋梁等建筑物的養(yǎng)護(hù)上具有廣泛的用途。