999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種基于數據增強增廣和神經網絡的輸電導線及其缺陷檢測方法

2022-11-01 10:39:30周仿榮張輝者梅林文剛潘浩蘭志才張正德
南方電網技術 2022年9期
關鍵詞:背景檢測模型

周仿榮,張輝,者梅林,文剛,潘浩,蘭志才,張正德

(1. 電力遙感技術聯合實驗室,云南電網有限責任公司電力科學研究院,昆明 650217;2. 云南電網有限責任公司,昆明 650051;3. 云南電網有限責任公司輸電分公司,昆明 650051;4. 上海西虹橋導航技術有限公司,上海 201702;5. 上海交通大學電子信息與電氣工程學院, 上海 200240)

0 引言

輸電導線是電力系統中的重要組成部分,由于地理分布位置特殊,除了承受電力負荷和機械載荷的內部壓力外,還長期經受風吹日曬、雨雪風沙、電閃雷擊等惡劣環境的侵害,極易出現如斷股、散股等缺陷,如果不及時處理常常會引發惡性電力事故。

輸電導線故障巡檢分為人工巡檢和無人機巡檢。人工巡檢檢測效率低、工作強度大、檢測速度慢;無人機巡檢可以有效減少人力、物力的投入,而且能夠排除人為因素的干擾,評估導線狀況,但其性能依賴于算法。輸電導線故障檢測算法是關鍵技術。

在這一領域已經進行了一些研究。例如,2006年吳功平等人[1]使用小波分析方法,用紅外和電磁傳感器對鋁絞線和鋼芯的斷股故障進行了檢測。2015年王萬國等人[2]使用水平和垂直方向的梯度算子,對線結構進行感知,實現了基于無人機圖像的輸電導線斷股及異物缺陷檢測。2017年齊國順等人[3]使用圖像處理技術和圖像識別技術,采用設定好的交叉點結構匹配模板,對導線斷股進行了檢測。2020年黃新波等人[4]提出一種基于加權色差法的分割方法實現對不同背景條件下輸電導線的分割提取,同時,結合紋理特征和神經網絡實現兩類導線缺陷的檢測與定位。陳嘉琛[5]等人改進了YOLOv3算法并應用于輸電線路缺陷識別,整體性能提升25%。李新海[6]等人研究了小樣本條件下絕緣子外套裂紋的圖像識別方法。孫日高等人[7]為了降低輸電導線故障檢測中的冗余計算量,使用了水平校正、圖像區域分割等技術實現了斷股故障和異物懸掛故障的區域定位。2021年李飛偉等人[8]使用全卷積神經網絡(fully convolutional network, FCN)實現了圖像分割及輸電導線目標分割,而后采用滑動窗口的思想對分割結果進行特征提取,實現了斷股檢測。此外,他們還實現了基于UDP(user datagram protocol)協議的WIFI圖像傳輸,形成了輸電導線斷股缺陷檢測系統。2022年李鵬吳[9]等人采用CenterNet算法對耐張線夾壓接的X攝像圖像進行了自動質量檢測。每種算法均針對特定的一張或幾張圖片進行檢測,在輸入分布完全不同時,難以有效檢測。

隨著交叉熵損失、卷積神經網絡、遞歸神經網絡等技術的突破,人工智能目標檢測算法如R-CNN[10]、Fast R-CNN[11]、Faster R-CNN[12]、Mask R-CNN[13]、SSD[14]、YOLO系列[15 - 17]、HRNet[18 - 19]如雨后春筍般出現,深度學習算法已成為當前最為主流的目標檢測、缺陷檢測算法。使用深度學習對輸電導線及其缺陷檢測有巨大的優勢,例如:無論輸電導線在圖像的什么位置,無論導線走向、尺度大小和正光逆光,都可以實現自動導線提取、自動特征提取和缺陷所在位置及類型檢測,在不同復雜背景下依然有效。

當前神經網絡算法是數據驅動的,龐大的、標注良好的數據集是影響模型性能的直接因素。目前沒有看到關于輸電導線及其缺陷檢測的公開的良好的數據集,而收集、整理、精細標注大量數據是一項繁瑣、枯燥的工作。本文希望通過設計算法,實現低分辨、小樣本數據集上的魯棒檢測。

本文首先在云南電網呼馬山試驗基地采集了輸電導線圖像,并提取了文獻[2 - 4,7 - 8]內的圖像,形成了如圖1所示的原始輸電導線樣本。分析發現,圖像存在背景動態范圍大,背景復雜,環境光復雜,圖像分辨率低,輸電導線不清晰等問題。

圖1 輸電導線及其缺陷原始圖像Fig.1 Raw images of transmission line and its defects

為了解決圖像動態范圍大、背景復雜、環境光復雜的問題,本文提出使用基于YOLO(you look only once)[17]的改進目標檢測算法來提高魯棒性;為了解決分辨率低的問題,提出使用基于RDN(residual dense network)[20]的超分辨率算法來提升圖像質量;為了解決小樣本問題,提出基于動態背景的隨機數量、隨機位置、隨機縮放和隨機角度方法來生成數據集。最終,獲得了復雜背景、復雜環境光、任意導線尺度及走向的輸電導線、散股和斷股的魯棒檢測方法,檢測綜合分數達到94.7%。

1 圖像質量提升算法

1.1 超分辨率算法

超分辨率(super resolution, SR)算法是輸入一張低分率(low resolution, LR)圖像,輸出一張高分辨率(high resolution, HR)圖像的算法。算法能提升圖像的分辨率,從而提升品質。

本文使用的超分辨率算法基于殘差密集網絡RDN[20],網絡結構如圖2所示。整體架構主要分為4個模塊:特征提取網絡(feature extraction network, FENet)、殘差密集塊(residual dense block, RDB)、密集特征融合網絡(dense feature fusion network, DFFNet)和采樣網絡(upsampling network, UPNet)。

圖2 超分辨率網絡Fig.2 Super resolution network

特征提取網絡FENet的主要作用是通過兩個卷積對輸入的低分辨率圖像提取特征;殘差密集塊RDB是將經典的殘差塊(residual block)和密集塊(dense block)進行整合形成的,額外的殘差和密集通道能同時利用前面多個層的特征,有助于提升模型的表達性能,同時能增加網絡深度而不會導致梯度消失;密集特征融合網絡DFFNet使用Concat、卷積、加權、批歸一化將全局特征和全局殘差特征進行融合;上采樣網絡UPNet使用上采樣和卷積使圖像分辨率翻倍。

密集殘差塊RDB是一種連續記憶機制,串聯的RDB實現了前面所有層到當前層的特征傳輸。第c個卷積層和第d個RDB層的輸出Fd,c可以表示為:

Fd,c=σ(Wd,c[Fd-1,0,Fd,1,…,Fd,c-1])

(1)

式中:σ為ReLU激活函數;Wd,c為第c個卷積層的權重,所有偏置均被忽略。前面的RDB層和后面每個層直接連接到后續層,這樣不僅保留了天然的前饋過程,同時提取了局部的密集特征。

1.2 高反差保留算法

高斯模糊(Gaussian blur)是一種圖像模糊濾波器,即用正態分布計算圖像中每個像素的變換,圖像高斯模糊的變換方程為:

(2)

式中:μ、ν分別為以模糊中心為原點模糊區域的橫、縱坐標;r為模糊半徑,r2=μ2+ν2;σ為標準差。該方程生成曲面的等高線是從中心開始呈正態分布的同心圓,每個像素的值都是周圍相鄰像素值的加權平均。高斯模糊能減少圖像噪聲和降低細節層析。

高反差保留是指保留圖像中反差較大的部分,高反差保留與高斯模糊的關系為:

J(x)=I(x)-G(x)

(3)

式中:J(x)為高反差保留部分;I(x)為原始圖像;G(x)為高斯模糊圖像。對于原始圖像,本文進行高反差保留,得到輸電導線每股線的邊緣信息,然后使用柔光與原始圖像混合,這樣就能體現更多的邊緣信息,每股線的邊緣細節越明顯,圖像就越清晰。

1.3 參數設置

原始圖像尺寸不一,最小分辨率為(730, 534)共39×104像素,最大分辨率為(1 518, 810)共122×104像素,平均為(1 065, 744)共79×104像素。本文采用Zhang Yulun[20]等人訓練好的psnr-larger模型來進行超分辨,模型權重大小為66.1 Mb。對每張圖像視情況進行1~3次增強,每增強1次,分辨率翻倍,增強后平均分辨率為(4 597, 3 132)共1 440×104像素。高反差保留中高斯模糊半徑為5像素。

2 小樣本數據增廣算法

小樣本數據增廣算法是指將小樣本數據離線增廣為大數據集的方法。方法概括為:獲取輸電線路圖像,并標注數據,多尺度背景提取,樣本均衡、隨機數量、隨機位置、隨機縮放、隨機角度、目標補全生成數據集。目前無良好的公開的輸電導線及其缺陷檢測數據集,本文采用上述方法,使用13張小樣本數據,生成了7 000張良好的數據集。

2.1 數據標注和定義

在進行數據增強之前,需要對數據進行標注和分析。本文使用Labelme對提升質量后的13張小樣本圖像進行了標注,采用多邊形(polygon)標注方式,而非邊界框(bounding box, Bbox),這樣能避免增廣變換過程中Bbox標注包含無用的背景像素,導致的標簽歧義問題。

如圖3所示,本文定義和標注了3種目標:輸電導線(transmission line)(紅色)、斷股(broken strand)(綠色)和散股(loose strand)(黃色)。

圖3 輸電導線、斷股和散股目標Fig.3 Transmission lines, broken strands, and loose strands targets

3種目標定義如下。

輸電導線:包圍圖像中連續輸電導線的最小多邊形,用紅色多邊形標注。不連續的輸電導線視為兩根導線,如圖3(a)中的導線,被夾扣分開,則視為兩個輸電導線目標。

斷股:組成輸電導線的股線斷裂形成的斷口區域,用綠色多邊形標注。斷口所占像素太小,單獨提取斷口不易判斷是否為斷股,因此,本文把斷股標注區域擴展為包含與斷口區域平行的輸電導線區域。如圖3(b)和(c),斷口僅為垂下的股線和翹起的股線,標注中將與垂下的股線平行的輸電導線和與翹起的股線平行的輸電導線也包含進來,形成斷股的標注多邊形。

散股:組成輸電導線的股線散開但未斷裂的區域,用黃色多邊形標注。如圖3(d)所示,判斷散股的方式主要為股線的紋理走向。類似的,散股標注中,也包含了與之平行輸電導線。

需要注意的是,3種目標并非完全獨立存在,有關聯關系。例如,所標注的1根輸電導線目標,可能會包含散股、斷股目標,后續數據增強中需要考慮。

經過標注,本文在13張圖像上標注的輸電導線、散股和斷股目標分別為:22個、6個和11個。

2.2 背景圖像生成

由于神經網絡利用卷積進行特征自動提取,采用單一背景會導致網絡收斂到局部最小,而無法尋找到全局最優,從而導致性能不足。因此需要動態生成背景。

2.2.1 背景生成思想

第1種思想是簡單地采用純黑、純白或純灰色(不同灰度)的圖像作為背景,經過測試,在類似背景的測試集上有較好的性能,但在彩色背景的測試集上性能大幅下降。第2種思想是采用完全隨機的“噪聲背景”,即確定背景圖像的寬和高后,對它3個通道分別隨機地賦值0~255,每個像素點生成隨機的RGB值。

噪聲背景上添加輸電導線目標的3個合成圖樣例如圖4所示。雖然理論上每個像素點的RGB值是隨機的,神經網絡能學習到不同背景信息下的目標。但4.2節的實驗結果表明,噪聲背景數據集訓練的模型,在只有噪聲背景的圖像才有良好的檢測效果,當檢測“真實背景”的圖像時,性能會大幅度降低。主要原因是“噪聲背景”圖像和“真實背景”圖像的分布不同。因此,第2種思想使用RGB色彩完全隨機“噪聲背景”不能得到良好的數據集。

圖4 噪聲背景合成圖的3個樣例Fig.4 Three examples of noise background synthetic images

基于上面的分析和實驗,本文采用第3種即基于“真實背景”的動態背景方法。首先,在網絡上尋找合適的背景圖像,如無人機巡檢中拍攝到的桿塔、工地、樹林、草地等圖像,它的分布是真實的,去除其中本文關注的目標,即輸電導線、散股、斷股等。而后,本文采用基于動態步長和隨機尺度的滑動窗口方法,把圖像切割成不同尺度的背景圖。最后,把基于隨機步長和尺度的動態背景與目標合并生成數據集,標簽進行相應變換。

本文采用動態背景方法,應用到一張原始圖像上,生成的背景圖如圖5所示。圖5(a)是一張(3 500, 6 912, 3)(3為采集圖像通道數量)的原始圖像,圖5(b)—(f)為7個不同尺度下的子背景圖,7個尺度由起始尺寸800、公比為1.25的等比數列生成,分別是:800、1 000、1 250、1 562、1 953、2 441、3 051。圖5中每個小的正方形格子形成一張該尺度下的子背景圖。

圖5 基于滑動窗口生成的多尺度動態背景Fig.5 Multi-scale dynamic background based on sliding window generator

2.2.2 動態背景算法

本文設計的基于第3種思想的動態背景生成算法詳細描述如下。

樸素的思路是采用滑動窗口方法:設定窗口尺寸為(a,b),正方形窗口a和b均為640,從像素坐標(0,0)開始,分別沿著x軸和y軸以步長s=640移動,取坐標的窗口圖像作為背景。樸素方法存在的問題是:1)相鄰窗口被完全隔斷為不同的背景圖,以相鄰窗口交接處為主體的背景圖實際上是有益的,但被丟棄;2)如果原始圖像的寬和高不是窗口尺寸的整數倍,原始圖像中右側和下方的有益背景也會被丟棄;3)固定的窗口尺寸導致尺度單一,不能利用多尺度信息。本文希望盡可能利用所有有益像素,設計了動態步長和窗口尺寸方法的來構建更多符合真實分布的背景圖。算法如下。

1)設置初始步長s為窗口尺寸的3/4,即s=640×3/4=480,以利用相鄰窗口交接處的有益像素。

2)根據原始圖像寬w和高h修正步長,以充分利用右側和下方圖像信息。

設窗口尺寸為(a,b), 初始步長s,在x軸和y軸方向上可取的窗口數量n分別為nx和ny,則有關系式:

(4)

式中:w、h分別為圖像寬和高;sx、sy分別為x軸和y軸的初始步長;round(·)為四舍五入函數;n必須為整數,四舍五入對n取整。計算新的步長s′為:

(5)

式中s′x、s′y分別為自適應后的x軸和y軸步長。

3)設置等比數列滑動窗口尺寸因子,實現多尺度信息提取。

(6)

式中:初始窗口尺寸為(a0,b0),公比q為1.25。n=1,2,3,4…,直到窗口尺寸(an,bn)大于原始圖像尺寸無法取到子圖為止。

使用動態背景算法,本文從圖5所示的1張原始背景圖中生成了尺度640×1.250~640×1.256在不同步長下的子背景圖像共計147張。應用到16張原始背景圖像上,共生成1 271張子背景圖。

2.3 數據集

本文使用上兩節所述的方法標注數據、生成動態背景后,即可進行圖像合成,生成輸電導線及其缺陷檢測數據集。

數據集生成流程如圖6所示。基本思路是:1)標注原始圖像獲取小樣本;2)隨機選擇獲取樣本庫;3)動態背景方法生成背景庫;4)合成為圖像,圖像劃分為訓練集和測試集。

圖6 數據集生成流程圖Fig.6 Dataset generation flowchart

首先,采用數據標注方法對13張原始圖像進行標注,獲得了小樣本目標,輸電導線、散股和斷股目標分別為22個、6個和11個,共計39個。根據最終生成的合成圖像數量為7 000張,平均每張圖約1.7個目標(該均值根據原始圖像的標注得到),計算總共所需的樣本數量約為12 000個。計算中每張圖樣本數量采用隨機正態分布生成。考慮2.1節所述,目標樣本之間存在關聯關系,即一個輸電導線標注區域,可能會包含散股、斷股區域等,程序中采用樣本均衡系數為8:1:1,最終生成的約12 000個樣本中,3類目標的比例約為5:3:2。

另一方面,采用如2.2節所述的動態背景算法,對16張高清背景大圖進行多尺度動態背景處理,共生成1 271張額外的背景圖像,加原始圖像的13張,背景庫共計1 284張。這樣做確保了背景庫的圖像是真實分布。

最后,本文采用多項隨機方法將樣本庫和目標庫進行合成,生成了7 000張數據集,劃分為6 000張訓練集和1 000張測試集。

生成合成圖時,為了使得目標姿態、角度、尺寸等更加豐富,采用了隨機位置、隨機尺寸、隨機旋轉和目標補全等算法。算法如下。

1)變量定義。把多邊形polygon標注轉換為蒙版Mask,Mask的寬高與背景圖像相同(均為640),通道數為n,n為該張合成圖包含的目標數量,每個通道代表一個目標。每個通道的Mask均是二值化的,即只能取值0和1,0代表非目標像素點,1代表目標。相應地定義另一個列表變量Classes,長度為n,存儲與Mask的通道對應的目標的類別信息。

2)隨機縮放和旋轉。尺寸因子采用期望為1.3,標準差為0.2的正態分布隨機獲得,并clip到 [0.5, 2]的范圍。旋轉因子使用[0, 180 °]隨機均勻分布獲得,旋轉中心為目標重心。采用OpenCV的旋轉縮放變換,輸入隨機尺寸因子和隨機旋轉因子獲得縮放和旋轉矩陣,對蒙版和圖像分別執行該變換。

3)隨機位置是在尺寸和旋轉變換后,根據目標邊界框Bbox的寬和高,采用隨機均勻分布計算出Bbox的隨機位置,使得目標不超出圖像的邊界范圍。對蒙版和圖像分別執行平移變換。

4)處理目標重疊問題。由于每張合成圖可能有多個目標,而輸電導線目標是“細長”的,隨機縮放、旋轉和平移后,新目標可能會與已經存在的目標重疊。本文的處理方案是計算新目標與已存在目標的交集百分比2(intersection of percent 2, IOP2),即新目標和老目標的像素交集與老目標的像素的比值,不斷隨機取隨機因子,直到IOP2為0時,執行該變換。

5)目標補全是指多目標的標注進行補全。當1從樣本庫隨機選擇的目標是輸電導線時,Mask只有1通道,即只有1個目標,由于輸電導線標注的區域可能會包含散股和斷股區域,需要對所包含的散股、斷股目標也進行上述縮放、旋轉和平移變換變換,將其補全到Mask新的通道上,同時變量Classes進行添加相應元素。

3 輸電導線及其缺陷檢測算法

3.1 神經網絡結構

本文將輸電導線、散股和斷股均視為目標,采用基于YOLOv5[17]的目標檢測算法,并采用通道注意力機制對網絡進行了改進得到SE-YOLOv5目標檢測網絡。輸電導線及其缺陷檢測網絡如圖7所示。

圖7 輸電導線及其缺陷檢測網絡Fig.7 Transmission line and it’s defects detection network

檢測網絡的強大特征提取能力主要來源于Backbone內部使用的SE-CSP、Focus、CONV、SPP等科技包。Backbone使用空間注意力機制Focus使神經網絡對圖像的感知范圍(感受野)變為原來的4倍;使用包含卷積、批歸一化和激活函數的卷積塊(Conv2d+BatchNorm+ReLU, CONV)代替池化,作為不同層之間的中間鏈接;使用空間金字塔池化(spatial pyramid pooling, SPP)[21]自適應不同尺寸的子圖像;使用基于DenseNet的思想CSP(cross stage partial network)網絡[22],復制基礎層的特征映射圖,通過Dense Block 發送副本到下一個階段,從而將基礎層的特征映射圖分離出來,解決了其他大型卷積神經網絡框架中網絡優化的梯度信息重復問題。將梯度的變化從頭到尾地集成到特征圖中,可以有效緩解梯度消失問題(通過非常深的網絡很難去反推丟失信號),支持特征傳播,鼓勵網絡重用特征,因此能減少模型參數量和FLOPS數值。在CSP內部,使用Bottleneck殘差網絡結構,用于增加網絡的深度,使得網絡有更強大的特征提取能力。

網絡的Neck層主要進行特征的增強和提取不同尺度對象的特征。Neck采用了路徑聚合網絡(Path aggregation network, PANet)[23],PANet的特征提取器采用了一種新的自下向上增強路徑的特征金字塔網絡(feature pyramid network, FPN),改善了底層的特征傳播。自上向下的特征傳播采用上采樣Upsample,自下向上的特征傳播采用卷積塊CONV來代替池化Pooling。通過橫向連接和堆垛方式,把上一階段的特征添加到特征圖中,這些特征又為下一階段的特征提供信息,每個階段都有3種不同尺度的特征,從而實現不同大小和尺度的同一物體的檢測。

網絡的Head層實現目標的檢測,用Conv2d代替全連接,以較少參數,提高速度。

改進主要將Backbone中的CSP改進為SE-CSP (squeeze-and-excitation cross stage partial network)。本文將SE模塊[24]引入到Bottleneck中形成SE-Bottleneck進而形成SE-CSP,它在原始殘差塊的基礎上增加另一條路線,使用全局池化來獲得初始信道權重,然后使用兩個完整的連接層和sigmoid激活函數來更新每個通道的權重,最后使用原始通道乘以每個通道的權重。這樣,在網絡訓練過程中,通過梯度下降學習每個通道的權值,提高檢測精度。

在網絡中,特征的寬、高、通道數、批大小分別為(w,h,c,bs),隨著卷積的進行,通道數c由最初的3變化,最大可達到2 048,最終檢測頭的通道數是(4+1+3),其中4是Bbox,1是置信度,3是分類類別(輸電導線、散股和斷股)。原生YOLOv5中默認所有通道的權重的相同,而后使用Concat合并特征,而實際上不同通道上的特征的重要程度應不同,本文引入SE注意力機制的基本原理是能自動地學習這些通道的重要程度并應用。

3.2 參數設置

本文采用的基準模型是YOLOv5m,原生模型有263層2.15×107個參數,引入SE模塊后,SE-YOLOv5m有311層2.16×107個參數。主要參數設置如下:初始學習率為0.01,梯度下降動量為0.937,GIoU損失增益為0.05,分類損失增益為0.5,目標BCE損失權重為1.0,IoU閾值為0.5,多錨閾值為4.0,訓練代數為300代,批大小為32,輸入網絡的尺寸為(640, 640)。YOLO系列及基于YOLO的檢測算法預定義的錨框對收斂速度和最終精度均有較大影響,本文使用k-means聚類方法分析了數據集并計算了合適的錨框,P3、P4和P5對應的錨框分別是:[(10, 13), (16, 30), (33, 23)], [(30, 61), (62, 45), (59, 119)和[(116, 90), (156, 198), (373, 326)]。

3.3 評價指標

本文采用目標檢測領域常用的基于混淆矩陣[25]的指標進行模型性能評價,具體是:查準率P、查全率R、IoU閾值取0.5~0.95間隔0.05時的平均檢測精度mAP@.5:.95和F1分數。采用綜合考慮查準率和查全率的F1分數作為主要指標。

4 實驗結果和分析

4.1 圖像質量提升算法消融實驗

本節分析所提出的質量提升算法的效果。

4.1.1 定性分析

應用第1節所述的圖像提升質量算法,結果如圖8所示,圖中顯示了4張不同背景下的輸電導線圖像,每張圖左側是原始的未做任何操作的低分辨率圖像,右側是應用超分辨率算法和高反差保留算法后的最終結果。處理后的圖像不僅分辨率更高,而且在輸電導線細節表現上更加清晰。

圖8 提升圖像質量前后對比Fig.8 Comparison before and after image quality improvement

處理后的圖像分辨率更高的原因是:每次應用超分辨率算法,圖像的分辨率增加為原來的2倍,應用n次后,分辨率增加為原來的2n倍。

輸電導線細節更加清晰的原因是:在設置合理的高斯半徑下,高反差保留相當于進行了去高斯模糊,保留了更多的邊緣細節,對于輸電導線這種由多根股線組成的圖像,每根股線的邊緣更加清晰。

4.1.2 定量分析

本文分別使用未經質量提升的原始圖像和經過質量提升的圖像,均進行數據增廣后,分別生成低質量數據集(low quality set,LQSet)和高質量數據集(high quality set,HQSet)。均在所改進的SE-YOLOv5網絡上訓練,分別得低質量數據集模型(low quality model,LQM)和高質量數據模型(high quality model,HQM)。測試評估結果如表1所示。

表1 低質量數據集模型和高質量數據集模型性能對比Tab.1 Performance comparison between LQM and HQM

結果表明:LQM在LQSet測試集上的F1分數為92.8%,具有良好的效果,但其HQSet測試集上,F1分數僅達為68.2%。分析原因,這與訓練數據集中圖像模式(Pattern)與測試集差異較大有關。在公平測試下,即兩個模型分別在對應的測試集上測試。結果表明LQM的F1分數為92.6%,而HQM達到94.7%,說明本文提出的圖像質量增強算法,不僅在直觀上更加清晰地展示了圖像細節,而且對模型性能有2.1個點的提升。

4.2 噪聲背景消融實驗

本節分析動態背景算法的效果。

4.2.1 定性分析

噪聲背景是隨機背景的一種。本文采用0~255完全隨機生成RGA圖像得到“隨機”的背景圖來生成數據集,生成的圖像如圖4(a)所示。由于效果檢測效果不理想,本文開發了2.2節所述的動態背景算法,生成圖像如圖4(b)—(c)所示。

為了對比噪聲背景和動態背景算法的差異,本文分別生成了噪聲背景數據集NB(noise background)Set和動態背景數據集DB(dynamic background)Set,并分別訓練了噪聲模型(NBM)和動態模型(DBM)。原始圖像均采用提升分辨率后的圖像,網絡均采用改進的SE-YOLOv5。

檢測效果直觀對比如圖9所示。與左側的真值標注相比,NBM在NBSet上成功地檢測出輸電導線、散股和斷股,但在DBSet上只檢測出散股,輸電導線和斷股均漏檢;DBM在DBSet上能成功檢測出輸電導線、散股和斷股。

圖9 噪聲背景模型和動態背景模型對比Fig.9 Comparison between NBM and DBM

4.2.2 定量分析

NBM和DBM的測試評估結果如表2所示。結果表明:與圖9的結果一致,NBM在NBSet上的F1分數達94.0%,說明在噪聲背景訓練集上訓練的模型,對于噪聲背景的目標有很好的檢測性能。但是,NBM在DBSet上的檢測精度大幅度降低,F1分數僅為27.5%,分析表明這是由于噪聲背景和真實背景在分布上的差異,顯著地影響了模型的性能而DBM在DBSet上的F1分數達到了優秀的94.7%。

表2 噪聲背景模型和動態背景模型性能對比Tab.2 Performance comparison between NBM and DBM

在實際應用中,待檢測圖像均為真實背景的,所以完全隨機噪聲背景生成數據集訓練的模型是極不魯棒的。因此,本文提出的動態背景算法,能產生真實的數據的背景多樣性,是模型取得高性能的重要原因。

4.3 SE模塊消融實驗

本節分析引入SE注意力機制改進網絡的效果。本文使用DBSet,在其他參數相同的情況下,分別對原生的YOLOv5網絡和改進的SE-YOLOv5網絡進行了模型和性能測試,結果如表3所示。

表3 原生YOLOv5和改進SE-YOLOv5性能對比Tab.3 Performance comparison between origin YOLOv5 and improved SE-YOLOv5

結果表明:原生的YOLOv5模型能達到93.7%的F1分數,引入SE模塊后,模型在測試集上的查準率、查全率和F1分數均有所上升,F1分數提升了1個百分點,mAP@.5:.95有所下降,檢測速度略微降低。性能提升的主要原因是SE注意力機制能學習各個通道的重要程度,自動給予重要通道的特征更多的權重,速度略微下降的原因是額外的路線增了模型的層數和參數數量。

4.4 模型性能測試

利用本文所提出的圖像質量提升算法來獲得高質量的原始圖像,而后采用所提出的數據增廣算法來生成動態背景數據集,在改進的SE-YOLOv5模型上訓練模型,訓練好的模型在測試集上的測試結果如下。

隨機抽取一個Batch的16張圖檢測效果如圖10所示,結果顯示不論輸電導線在圖像的什么位置,導線走向如何,尺度大小如何,正光還是逆光,本文提出的算法均能準確地檢測出輸電導線、散股和斷股,本文提出的輸電導線及其缺陷目標檢測算法有較強的泛化能力和魯棒性。

圖10 模型檢測效果Fig.10 Detection effect of the model

詳細的不同類別的檢測性能如表4所示。共檢測1 000張圖像,輸電導線、散股和斷股目標數量分別為847、493和364,共計1 704個,3個類別的檢測F1分數均大于90%,平均檢測F1分數達到94.7%。

表4 最終模型檢測結果Tab.4 Final detection performance of final model

速度方面,在RTX3080 GPU上,輸入尺寸為640時,單張圖檢測的推斷和非極大值抑制的總時間約16.1 ms,即62.1 FPS。實際離線處理過程中,可多張圖合并成1個batch進行檢測,批尺寸為16時平均單圖檢測時間為4.3 ms,約233 FPS。

最終,本文的模型的檢測速度為62.1FPS(單圖),F1分數為94.7%。

4.5 模型的紋理魯棒性實驗和處理方法

需要注意的是,訓練好的模型雖然能實現隨機位置、隨機角度、隨機尺寸和隨機背景的魯棒檢測,但當出現被檢測目標具有不同紋理時(如圖11中的輸電導線、散股和斷股不同于原標注的13張圖像),性能會大大折扣,即該模型對不同的位置、角度、尺寸、背景具有魯棒性,但紋理魯棒性不強。

圖11 Hybrid-M在額外圖像上的檢測效果Fig.11 The detection effect of Hybrid-M on additional images

為了進行紋理魯棒性實驗和改進,本文額外采集了64張全新的輸電導線和缺陷圖像,進行了相關測試,結果表5所示。

表5 噪聲模型(NBM)和混合模型(Hybrid-M)性能對比Tab.5 Performance comparison between NBM and Hybrid-M

紋理魯棒性實驗結果表5的第1行所示,直接用上文的動態背景模型DBM(13張原始圖像增廣后的數據集訓練的)對額外圖像進行檢測的結果。結果表明,模型雖然有84.3%的查準率,查全率僅60.9%,綜合F1分數為68.5%。這表明模型有一定性能(高于完全隨機基準),但魯棒性不足。

解決模型紋路魯棒性的有效途徑是使用遷移學習特性進行模型性能的改進。具體方法為:對額外采集的64張圖像采取上文所述相同的流程,先用Labelme標注,然后用圖像質量提升算法、數據增廣算法生成數據集7 000張(增廣是必要的,否則會造成樣本不均衡),并與原來7 000張DBSet合并形成混合數據集Hybrid-Set;而后采用遷移學習的方法,用Hybrid-Set訓練集對DBM模型進行遷移訓練,得到混合模型Hybrid-M。

對遷移學習詳細描述如下:1)加載與原模型完全相同的網絡結構,即SE-YOLOv5;2)加載原來訓練好的權重文件,即.pt文件,加載過程中讀取訓練好的每一個卷積層、全連接層等的權重并進行自動設置;3)將混合數據集作為輸入,對模型進行訓練,訓練結束后保存最優性能模型。由于原模型已經具有一定檢測能力,將其性能“遷移”到新數據集上,因此稱為“遷移學習”。由于新增了數據集,有時也被稱為“增量學習”。由于通常會對新的訓練過程設置較小的學習率和較小的訓練代數,有時也被稱為“模型微調”。

遷移學習后的性能如表5第2行所示,Hybrid-M在Hybrid-Set測試集(測試集與訓練集數據無交叉)上的綜合F1分數達到了94.9%,具有很好的魯棒性。遷移后的模型僅對這77種紋理和接近的紋理具有魯棒性,對于全新的紋理,可以繼續使用本文提出的方法進行遷移學習。本文提出的數據增廣方法有價值的前提是紋理多樣性遠小于數據多樣性。由于數據多樣性包含:紋理多樣性、位置多樣性、角度多樣性、尺寸多樣性和背景多樣性等,這顯然是成立的。

為了證明混合模型對原DBSet也有良好的效果,本文也進行了測試,結果如表5第3行所示。綜合分數為94.8%,比DBM的94.7%提升了0.1%,說明采集更多數據并再次進行標注、增強、增廣,進行遷移訓練是解決紋理多樣性問題的有效途徑。更多的數據會帶來模型好的通用性。

混合數據訓練的模型Hybrid-M在額外圖像上的檢測效果直觀地展示在圖11中,由于被測圖像不包含在訓練數據集中,模型表現出的良好性能是通過學習得到的。

5 結論

為了在低分辨率、小樣本下實現動態范圍大、環境光多樣等復雜背景下的輸電導線及其缺陷的實時和魯棒檢測。本文從云南呼馬山試驗基地和相關文獻的13張原始輸電導線圖像出發,進行了如下研究工作。

1)實現了超分辨率算法,解決了原始圖像分辨率低的問題;

2)實現了高反差保留算法,解決了原始圖像細節不清晰的問題;

3)提出和實現了動態背景算法,生成了多尺度、真實的背景圖像;

4)采用樣本均衡、隨機樣本數量、隨機位置、隨機縮放、隨機旋轉、目標補全等方法生成了7 000張高質量輸電導線數據集;

5)引入通道注意力機制,改進網絡形成了SE-YOLOv5目標檢測算法,經過訓練,實現實時、魯棒的輸電導線、散股和斷股3類目標檢測,檢測F1分數達到94.7%。

本文提出的數據集生成方法,可以廣泛應用在各種領域的目標檢測任務中,提供了一種通用的應對低分辨率圖像、小樣本數據集的方法;生成的輸電導線數據集,能推動基于深度學習的人工智能算法在該領域的應用;訓練好的輸電導線及其缺陷檢測模型,能應用到無人機輸電導線巡檢領域,提高電路系統運行穩定性和安全性;此外,提出的算法是可以不斷遷移學習進行演進的,提供更豐富的紋理,能持續提升模型的通用性。

本文算法存在的不足是相比于分割的算法,本算法無法給出圖像哪些像素是目標信息;相比與電磁等缺陷檢測方法,本文算法無法檢測輸電導線內部的缺陷。

猜你喜歡
背景檢測模型
一半模型
“新四化”背景下汽車NVH的發展趨勢
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
《論持久戰》的寫作背景
當代陜西(2020年14期)2021-01-08 09:30:42
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
晚清外語翻譯人才培養的背景
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产簧片免费在线播放| 欧美在线伊人| 欧美精品成人| 国产成人1024精品下载| 国产日韩欧美成人| 亚洲大尺度在线| 在线日韩日本国产亚洲| 欧美日韩精品在线播放| 国产成人精品18| 成人综合在线观看| 亚洲九九视频| 婷婷六月在线| 中国毛片网| 一本大道香蕉久中文在线播放| 狠狠色狠狠色综合久久第一次| 免费一级毛片完整版在线看| 色哟哟国产精品一区二区| 99免费视频观看| 国产男人的天堂| 国产18页| 老色鬼久久亚洲AV综合| 曰AV在线无码| 蜜臀AV在线播放| 国产一区成人| 国产69囗曝护士吞精在线视频| 亚洲无码高清一区二区| 国产白丝av| 欧美中文字幕在线视频| 欧美激情第一区| 香蕉精品在线| 婷婷综合色| 久996视频精品免费观看| 四虎影视国产精品| 久久国产精品娇妻素人| 午夜不卡视频| 欧美在线伊人| 五月婷婷丁香综合| 青青草原国产免费av观看| www.youjizz.com久久| 久久久久国产精品嫩草影院| 99草精品视频| 久久国产精品电影| 亚洲国产av无码综合原创国产| 国产精品亚洲精品爽爽| 美女毛片在线| 亚洲日本中文综合在线| 欧美一区二区三区香蕉视| 亚洲最大看欧美片网站地址| 国产毛片高清一级国语| 欧美综合区自拍亚洲综合天堂| 91精品国产自产在线老师啪l| 999福利激情视频| 亚州AV秘 一区二区三区| 99久久国产综合精品2023 | 激情综合网激情综合| 五月婷婷欧美| 最新日韩AV网址在线观看| 色视频久久| 欧美日韩中文字幕在线| 亚洲人成网7777777国产| 国产精品内射视频| 国产亚洲精品97在线观看| 91久久偷偷做嫩草影院| 国产a v无码专区亚洲av| 91精品啪在线观看国产60岁| 国产亚洲精久久久久久无码AV| 亚洲成人免费在线| 3p叠罗汉国产精品久久| 国精品91人妻无码一区二区三区| 国产香蕉国产精品偷在线观看| 亚洲AV电影不卡在线观看| 精品久久久久成人码免费动漫| 97精品伊人久久大香线蕉| 久久网综合| 国产精品伦视频观看免费| A级全黄试看30分钟小视频| 亚洲A∨无码精品午夜在线观看| 国产玖玖视频| 老司机午夜精品网站在线观看| 在线欧美日韩| 亚洲精品高清视频| 午夜福利网址|