王竹筠,楊理踐,高松巍,劉 斌
(沈陽工業大學 信息科學與工程學院,沈陽 110870)
管道漏磁(magnetic flux leakage,MFL)檢測技術在長輸油氣管道中發揮著重要作用.管道漏磁信號的智能化識別一直是當今研究的重點,其中,對管道漏磁信號成像后的圖像進行特征提取是當今研究的熱點.由于管道漏磁信號比較復雜,因此漏磁圖像的特征類型也較多,結構也比較復雜.為了更好地對漏磁圖像進行識別,提取特征的有效性可提高分類網絡準確率.
陳超[1]利用最大類間方差模糊約束法獲取隸屬度函數計算目標輪廓特征;桑海峰等[2]將通過相鄰層的特征連接增強信息流動性;姜慧明等[3]將梯度圖多尺度融合至U-Net編碼器;鄭婷月等[4]利用殘差塊學習細節紋理特征;文獻[5-7]直接將圖像輸入到卷積神經網絡中,其算法能夠自動學習圖像特征,減少人工特征提取過程;文獻[8-9]利用變形卷積網絡有效針對圖像目標特征進行提取;張軍陽等[10]通過混洗操作改變矩陣卷積方式;文獻[11-12]將低分辨率圖像特征映射成高分辨率特征,實現圖像的高精度化;Bayar等[13]通過約束卷積層增強圖像特征.在卷積神經網絡中,卷積核的特征提取能力才是決定網絡分類準確度的關鍵.上述文獻主要是從卷積層的結構和計算方式進行改進,沒有針對卷積核的優化方法進行深入研究.
本文建立一種稀疏自編碼網絡,對卷積核進行優化訓練,去除冗余的卷積核并提高卷積核對漏磁圖像特征的提取能力,通過加入信息熵相似度約束規則進一步提升卷積核對目標和背景信息的區分能力.
卷積神經網絡(CNN)通過卷積層中的卷積核可自動學習特征并直接提取圖像特征.
管道漏磁內檢測技術是通過漏磁檢測器檢測到的漏磁通來判斷管道是否有缺陷存在[14],經過圖像處理可得到完整的漏磁偽彩色圖像,如圖1所示.

圖1 管道漏磁偽彩色圖像
從圖1可看出,管道漏磁信號大致有環焊縫、螺旋焊縫、缺陷等類型.由于管道漏磁信號特征較多,因此同一類型之間的特征也會有區別,為卷積核的特征提取帶來一定困難.
在卷積神經網絡中,一個卷積層可以包含很多卷積面.卷積面又稱為卷積特征圖,每個卷積面都是根據輸入、卷積核和激活函數來計算的.卷積面的輸入通常是一幅或者多幅圖像.卷積核是一個矩陣,又稱為卷積濾波器,用來提取卷積神經網絡中輸入圖像特征.如果輸入是一幅大小為M×N的圖像,用矩陣X表示,卷積核是大小為m×n的矩陣w,偏置為b,則卷積核的計算過程如圖2所示.

圖2 卷積核工作原理
卷積層通過卷積核得到輸入圖像從低級到高級的特征.卷積核是一個權值矩陣,一般通過隨機產生一些接近于0的小數作為初始值.卷積核通過與圖像的卷積運算來提取圖像中的不同特征.
卷積層由多張特征圖組成,每個特征圖中的神經元通過卷積核與上一層特征圖的局部區域相連.特征圖計算表達式為
(1)

卷積神經網絡分類能力的高低主要取決于網絡對圖像的學習能力,即卷積核對圖像的特征提取能力.卷積核的好壞由其內部的權值決定,因此,權值的選取十分重要.
卷積核的權值影響網絡的特征提取能力,通過信息熵相似度約束規則優化卷積核的權值.
信息熵是一種特征的統計形式,反映圖像攜帶平均信息量的多少,即表示圖像中灰度分布的目標特征所包含的信息量,其表達式為
(2)
式中,Pij為圖像中顏色值為i像素所占的比例.
在得到圖像信息熵后,利用L1-norm距離進行圖像間的相似性度量,圖像間的距離描述為
DL1-norm(p,q)=|H(p)-H(q)|
(3)
式中:p、q為任意兩幅圖像;H(p)、H(q)為圖像對應的信息熵.
兩幅圖像空間聯合信息熵間的距離為
D(p,q)=w1|μp-μq|+w2|σp-σq|
(4)
式中:w1、w2為[0,1]區間權重,且二者和為1;μ、σ為距離參數.
卷積核整體能夠包含的特征信息是恒定的,因此在預訓練過程中會出現卷積核之間包含信息不均衡的情況,導致網絡的分類準確率低.而信息熵能有效地反映卷積核包含的圖像結構信息,卷積核的信息熵越大,包含結構信息越豐富;反之則結構信息越少.卷積核中存在部分卷積核權值相同或相似的情況,說明此類卷積核都在學習相同的特征,導致卷積核的區分表達能力降低,出現冗余信息.
為防止卷積核出現冗余情況,在卷積核訓練網絡中加入信息熵相似度約束限制.約束規則防止了過擬合的同時又提高了卷積核的區分性表達能力.通過計算E的大小來判斷卷積核權值的相似程度,E越大表明相似度越低,反之相似度越高,其計算表達式為
(5)
式中,Ki,j和K′i,j分別為任意兩個卷積卷積核對應的權值.
信息相似度約束規則可篩選出網絡的最優卷積核.計算卷積神經網絡中卷積核的信息熵,通過相似度判定條件對卷積核進行約束,對不符合條件的卷積核進行更新,最終得到符合約束條件的新卷積核.卷積核信息熵約束規則流程如圖3所示.

圖3 卷積核信息熵相似度約束流程圖
定義單幅圖像中的背景信息熵與目標信息熵的比值為φ,通過φ值判斷卷積核提取的目標信息與背景信息的差異性,其計算表達式為
(6)
式中:A、B分別為背景像素和目標像素的數量;ga(i,j)和gb(i,j)分別為背景和目標的像素;Ra、Rb分別為背景和目標信息的區域.
特征圖通過輸入圖像和卷積核相乘得到一個M×N的矩陣,其中每行表示一個輸出圖像,共有M個輸出圖像.輸入圖像矩陣在網絡中變換為
F=((Ih+2ph-kh)/th+1)·
((Is+2ps-ks)/ts+1)
(7)
式中:I為輸入圖像尺寸;p為擴充量;k為減少量;t為步長;下標h和s分別為高度和寬度.
從漏磁信號圖像中隨機采集像素大小為5×5的小圖像色塊作為訓練樣本輸入網絡中進行訓練.網絡訓練過程如下:
1)對每個樣本色塊進行前向傳播計算.當輸入樣本為xi時,隱含層的輸入和輸出計算表達式為
(8)


(9)
式中:α為學習速率;δi為殘差.
在訓練過程中不斷計算殘差的數值,當殘差值小于設定的閾值0.8時則判定參數收斂,得到更新后新卷積核K′i,j.
本實驗選擇Caffe環境作為實驗平臺,處理器為Inter(R)Core(TM)i7-7700k CPU@4.20 GHz,GPU采用的是NVIDIA GTX 1070,RAM空間大小為16.0 GB,開發工具為Visual2013和Matlab.
實驗數據集包括600張管道漏磁偽彩色圖像,每張圖像大小為140×320,樣本圖像如圖4所示.將600張管道漏磁圖像Ii,j的樣本庫直接輸入到改進后的網絡模型中,其中450張作為訓練集,150張作為測試集.設置單次處理批數為40,步長為2,學習率為0.000 1,迭代次數為5 000次.將優化后得到的卷積核賦予給CNN網絡,卷積核按照從左到右,從上到下原則進行遍歷.

圖4 實驗樣本圖像
將200張小色塊圖像作為樣本分別輸入到有信息熵約束和無信息熵約束的網絡中進行實驗,設置迭代次數為1 200,卷積核數目為40,卷積核大小為5×5.卷積核優化前后信息熵對比結果如圖5所示.

圖5 卷積核優化前后信息熵對比
從圖5中可看出,優化后卷積核信息熵差值越來越小,控制了網絡的過擬合,而優化前的卷積核信息熵則幾乎保持不變,保持在約35%,說明此時各卷積核攜帶的圖像特征信息變得更加均衡.多次實驗統計結果表明,當卷積核信息熵之間差距為15%時,卷積核提取到的目標像素和背景像素的平均比值相差最大,且卷積核會提取到較為完整的目標特征.
為進一步確認卷積核的優化情況,需通過相似度判定來確定卷積核是否有冗余現象.本實驗在預訓練網絡中加入相似度約束條件,根據卷積核提取到的特征信息量來設定相似性判斷的閾值ε,統計分析表明,當卷積核之間的相似性參數小于0.5時,它們提取的圖像特征幾乎相同,因此本實驗設置ε=0.5.計算圖4中卷積核兩兩之間的相似度參數E,以前4個卷積核(K1~K4)為例,結果如表1所示.

表1 卷積核優化前后權值相似度對比
由表1可以看出,優化前K1,4、K3,4之間的相似度參數小于設定閾值,說明K1、K3、K4差異性小,三個卷積核的權值相近,存在冗余現象.故將K3、K4卷積核進行初始化,通過迭代更新權值,再次計算K1、K4、K5卷積核之間的相似度參數E.
將圖4中的6幅圖像輸入到卷積神經網絡中進行驗證,計算目標與背景的像素值,從而得到圖6所示的優化前后目標與背景像素的對比度.
從圖6a中可看出,未經預訓練的卷積核在提取圖4e的目標特征時,特征圖中目標像素和背景像素的對比度最大值為2.01;在圖6b中,利用預訓練卷積核對圖4e進行特征提取后生成的特征圖像素對比度可達2.62,大于未經預訓練的卷積核,說明優化網絡提高了卷積核對圖像目標特征的學習能力,可以有效區分目標與背景.
為了驗證優化后卷積核的有效性,將優化卷積核應用到卷積神經網絡中,并與原始卷積神經網絡分類結果進行對比,對比結果如表2所示.
從表2中可看出,卷積核數量為40,大小為5×5時網絡分類效果最優、工作效率最高.實驗結果表明,優化卷積核后的網絡相較于原始網絡,其提取特征能力更佳,網絡分類準確率更高,分類效果更好.
將圖4d、f進行可視化,優化卷積核提取特征效果如圖7所示.由圖7可知,優化后的卷積核能較好地提取出管道漏磁圖像的焊縫、缺陷等特征,特征的邊緣信息完整,為之后網絡的分類提供重要依據.

圖6 優化前后目標與背景像素對比度

表2 卷積核優化前后網絡分類準確率對比

圖7 優化卷積核特征提取效果圖
本文提出了一種通過信息熵相似度約束規則對卷積核優化算法,實現了對管道漏磁偽彩色圖像特征的提取.通過實驗對比分析可知:利用相似度判定法則對各卷積核進行信息熵相似度約束判定,通過判定結果剔除相同或者相似的卷積核,更新卷積核權值,從而優化網絡中的卷積核,減少冗余信息的存在,提高了卷積核對特征的區分表達能力,同時防止網絡過擬合.