999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于混合注意力網(wǎng)絡的安全工器具檢測

2022-06-29 12:33:00凌永標楊嵐嵐邱興衛(wèi)張志銳
計算機技術與發(fā)展 2022年6期
關鍵詞:特征檢測方法

凌永標,毛 峰,楊嵐嵐,邱興衛(wèi),張志銳,張 杰

(1.國網(wǎng)黃山供電公司,安徽 黃山 245000;2.安徽大學 計算機科學與技術學院,安徽 合肥 230601)

0 引 言

隨著經(jīng)濟不斷發(fā)展,人們對電力的需求越來越大,輸電部署和電網(wǎng)安全檢查任務艱巨。由于受到輸電系統(tǒng)的內(nèi)外環(huán)境影響,電力系統(tǒng)故障時有發(fā)生。電網(wǎng)部署和安全檢查需要電力工作人員花更多的時間在施工現(xiàn)場,這無疑增大了電力工作人員的危險。目前,越來越多的行業(yè)都引入了人工智能技術來做一些重復或者危險的事[1]。電網(wǎng)部署和安全檢測中引入人工智能更是未來的趨勢。

安全工器具是指在觸電、灼傷、墜落、摔跌等事故中,保障電力工作人員人身安全的各種專用的安全工器具。常用的有個體防護裝備、絕緣安全工器具、登高工器具、警示標識等四大類。它的好壞直接影響到電力工作人員的人身安全,所以必須重視對安全工器具的日常檢查。然而,存在有少部分電力工作人員安全防范意識薄弱,對安全工器具的日常檢查流于形式,給電網(wǎng)安全檢查帶來危險。電網(wǎng)安全檢查的監(jiān)管急需對檢查全過程中安全工器具進行自動化檢測和報警的解決方案,以保障電力工作人員的人身安全,防患于未然,提高電網(wǎng)運營的安全性。

該文重點關注絕緣手套、絕緣鞋、安全帶、安全繩、掛鉤這幾類安全工器具在電網(wǎng)安全檢查中是否正常或出現(xiàn)破損情況的自動化檢測與識別任務。提出一種基于混合注意力網(wǎng)絡的安全工器具檢測方法。混合注意力網(wǎng)絡以經(jīng)典的Faster R-CNN[2]為主干網(wǎng)絡,混合注意力模塊包含全局通道注意力和局部空間注意力兩個子模塊,引入多種混疊的數(shù)據(jù)增強方法,采用了基于多尺度特征金字塔的多層預測方法。此外,為了驗證所提方法的有效性,還從電網(wǎng)安全檢查現(xiàn)場采集了一批真實圖片,整理并標注對應的安全工器具,構建了一個安全工器具數(shù)據(jù)集。

1 相關工作

傳統(tǒng)的目標檢測算法主要依賴于手工設計的特征,對于多樣性的變化沒有很好的魯棒性。而且由于采用滑動窗口的方式選取侯選框,沒有針對性,時間復雜度高,窗口冗余問題嚴重,難以取得滿意的結果。最近幾年,隨著深度學習領域的快速發(fā)展,深度卷積神經(jīng)網(wǎng)絡越來越多地應用于計算機視覺領域,如檢測、分割、跟蹤等,并取得重大進展。基于深度卷積神經(jīng)網(wǎng)絡的目標檢測算法在目標檢測領域取得了最好的效果。深度學習技術引用到檢測領域,主要使目標檢測精度大幅提升,使得單一模型能夠檢測的目標類別數(shù)目增加。

基于神經(jīng)網(wǎng)絡的目標檢測算法分為兩階段檢測算法和單階段檢測算法兩種。R-CNN[3](Region with CNN feature)是卷積神經(jīng)網(wǎng)絡應用于目標檢測問題的一個里程碑的飛躍,其使用Selective Search[4]算法生成候選區(qū)域,然后將候選區(qū)域變換為統(tǒng)一大小,送進CNN提取特征,輸出的特征向量由SVM分類器進行分類,R-CNN的進階版Fast R-CNN[5]在R-CNN的基礎上采納了SPP-Net[6]方法,對R-CNN作了改進,使得性能進一步提高。Fast R-CNN與R-CNN對比,主要有兩處不同:一是最后一個卷積層后加了一個ROI pooling層,二是損失函數(shù)使用了多任務損失函數(shù)(multi-task loss),將邊界框回歸直接加入到CNN網(wǎng)絡中訓練。Faster R-CNN采用Region Proposal Network(RPN)來替代Selective-Search提取候選區(qū)域,anchor就是位置和大小固定的框,可以理解成事先設置好的固定的候選區(qū)域。

YOLO[7]不同于上述兩階段目標檢測方法,它將物體檢測當成一個回歸問題。做法是基于一個單獨的端到端網(wǎng)絡,來完成從原始圖像的輸入到物體位置和類別的輸出任務。SSD[8]也是單階段目標檢測方法,是Faster RCNN和YOLO的結合,同時采用了Faster RCNN中基于候選框的概念和YOLO中基于回歸的處理方法,在一個端到端網(wǎng)絡中直接回歸出目標物體的類別和位置。FCOS是一個基于全卷積的單階段檢測網(wǎng)絡,類似于語義分割,針對每個像素進行預測。SSD、YOLOv3[9]、Faster R-CNN都依賴于預定義的候選框。而CornerNet、CenterNet、FCOS[10-12]是不需要預定義候選框的,從而減少大量的計算以及內(nèi)存占用。

結合數(shù)據(jù)增強和注意力機制等優(yōu)點,該文提出一種基于混合注意力網(wǎng)絡的安全工器具檢測方法,主要是在Faster R-CNN網(wǎng)絡結構上添加了混合注意力模塊,引入了多種混疊的數(shù)據(jù)增強方法,采用了基于多尺度特征金字塔的多層預測方法,以解決數(shù)據(jù)集中小目標檢測不準確的問題。

2 基于混合注意力網(wǎng)絡的安全工器具檢測

2.1 多種混疊的數(shù)據(jù)增強

通過大量的實驗發(fā)現(xiàn),許多效果較好的神經(jīng)網(wǎng)絡都有大量的參數(shù),要想很好地訓練這些參數(shù),以使網(wǎng)絡擬合,則需要大量的訓練數(shù)據(jù)。因為AI技術非常強地依賴于高質(zhì)量數(shù)據(jù)[13]。但是在實際制作數(shù)據(jù)集時,無論是采集數(shù)據(jù),還是對數(shù)據(jù)進行標注都需要大量的人力,物力,而且這非常耗時。因此該文采用數(shù)據(jù)增強技術來緩解數(shù)據(jù)量不足的問題。目前數(shù)據(jù)增強技術主要是通過對圖片進行翻轉(zhuǎn),平移或者是旋轉(zhuǎn)等操作,有時也會采用在數(shù)據(jù)上增加噪聲的操作,以此可以在已有的少量數(shù)據(jù)上得到更多的訓練數(shù)據(jù),使得網(wǎng)絡達到更好的效果[14]。綜上,為了提高網(wǎng)絡的精度與泛化能力,該文采用數(shù)據(jù)增強技術來獲得更多的訓練數(shù)據(jù)。

數(shù)據(jù)增強主要分為:離線增強和在線增強。離線增強:顧名思義是在數(shù)據(jù)輸入神經(jīng)網(wǎng)絡前對數(shù)據(jù)進行離線增強,通過離線增強的數(shù)據(jù)集在數(shù)據(jù)上會變成原數(shù)據(jù)集數(shù)目的N倍(是增強因子)。在線增強:這種數(shù)據(jù)增強的方法是在神經(jīng)網(wǎng)絡中對數(shù)據(jù)進行增強,主要做法是在得到batch數(shù)據(jù)后,對獲得的這些batch數(shù)據(jù)進行batch塊的旋轉(zhuǎn),平移或者翻轉(zhuǎn)等操作。由于在線操作很受硬件條件限制,這種增強方法一般適合較大的數(shù)據(jù)集。目前,隨著技術的不斷發(fā)展,很多機器學習框架已經(jīng)支持了這種在線數(shù)據(jù)增強方式,并且可以使用GPU來自動實現(xiàn)優(yōu)化計算。因為以后的數(shù)據(jù)量較少,故該文采用的是多種混疊的離線數(shù)據(jù)增強的方式。多種混疊的數(shù)據(jù)增強示例如圖1所示。

圖1 多種混疊的數(shù)據(jù)增強 (翻轉(zhuǎn)、旋轉(zhuǎn)、剪裁、mixup)示例

數(shù)據(jù)翻轉(zhuǎn)是數(shù)據(jù)增強中比較常用的一種方法,主要做法是將圖片做類似于鏡面的翻轉(zhuǎn),而不是將圖片旋轉(zhuǎn)180度,如圖1第一列分別是原圖的左右翻轉(zhuǎn)。該文的增強因子是2(即:指數(shù)量擴大2倍)。旋轉(zhuǎn)就是順時針或者逆時針的旋轉(zhuǎn),通常增強因子設為2~4。如圖1第二列第二行所示,增強因子也設為2。裁剪這種數(shù)據(jù)增強方法的做法是先在原有圖片上隨機選擇其中的一部分區(qū)域,然后將選擇后的這部分區(qū)域裁剪,最后將裁剪得到的圖片塊resize成與原圖片一樣的大小,如圖1第二列第一行所示。該方法的增強因子任意,文中裁剪的增強因子也是設為2。mixup[15]是一種最近新出來運用在計算機視覺上的數(shù)據(jù)增強方法,它的做法是將不同類別的圖像進行混合,如圖1第三列所示。綜上,該文在數(shù)據(jù)增強上主要采用了以上幾種方法來擴充數(shù)據(jù)集。

2.2 基于Faster R-CNN的混合注意力網(wǎng)絡

所提的混合注意力網(wǎng)絡以經(jīng)典的Faster R-CNN為主干網(wǎng)絡。Faster R-CNN主要包括四個模塊,分別是:特征提取、RPN、RoI Pooling和RCNN。因為多階段信息可以增強網(wǎng)絡的能力,提高算法的精度[16],在文獻[17]通過引入多尺度的特征融合模塊,設計了一個針對目標檢測任務的輕量化特征提取網(wǎng)絡TinyNet,進而提高了輕量化特征提取網(wǎng)絡對不同尺度目標的適應性。因此,為了解決數(shù)據(jù)集中部分目標較小的問題,該文加入了FPN[18](特征金字塔網(wǎng)絡)。此外每一個通道的特征通常都表示某特定類別的目標,在文獻[19]基于語義的增強混合特征選擇方法在文本分類時既提高了分類效率又能保證分類精度,在文獻[20]利用注意力機制對信息進行增強融合語義信息與問題關鍵信息的多階段注意力答案選取模型也極大地提升了算法的性能。基于以上啟發(fā),并且為了解決不同通道重要性不同的問題,該文提出了混合注意力機制。網(wǎng)絡結構如圖2所示。

圖2 基于Faster RCNN的混合注意力網(wǎng)絡結構

在以往的工作中使用Faster R-CNN進行目標檢測,不論是在RPN還是在Fast R-CNN中,RoI都作用在Fc的前一層,這樣做在對大目標物體進行檢測時效果是很好的,但是對于小目標物體的檢測效果就不行了。主要原因是對于一個RoI,映射到某個特征圖的做法是將底層的坐標直接去除以步長,對于小目標物體,當進行多層卷積和池化后,映射過去后就很小甚至是沒有了。所以為了解決數(shù)據(jù)集中部分目標較小而檢測不好的問題,該文引入了特征金字塔網(wǎng)絡,特征金字塔可以自然地利用卷積神經(jīng)網(wǎng)絡層級特征的金字塔形式,在生成所有的尺度上都含有強語義的信息特征。特征金字塔網(wǎng)絡的結構采用自頂向下(the top-down pathway)結構和橫向連接(lateral connections)的方式,以達到融合含有高分辨率的底層特征和含有豐富的語義信息的高層特征。這樣做到了從單尺度的一張輸入圖片,快速地構建在所有尺度上都具有強的語義信息的特征金字塔網(wǎng)絡,與此同時并沒有產(chǎn)生明顯的計算代價。

圖3 基于多尺度特征金字塔的預測流程

采用自上而下的路徑去融合低層特征圖,這些低層特征圖一般擁有較高的分辨率。特征金字塔具體做法如圖3所示,首先圖最左側一列是通過卷積得到每一層的特征圖,一般經(jīng)過多層卷積得到的特征圖分辨率會越來越低,但是會含有更多的語義信息,接著中間一列的作用是將左側得到的最高層的特征圖逐層做上采樣操作,因為每一層的橫向連接操作需要將要連接的兩層特征的大小調(diào)整成相同的尺寸。這里使用橫向連接的作用是利用低層特征圖的定位細節(jié)信息。如圖3所示,首先將高層特征圖做一個2倍上采樣操作,然后將與其對應的前一層特征圖做一個橫向連接結合,結合方式就是做像素間的加法。重復迭代該過程,直至生成最精細的特征圖。迭代開始階段,在卷積5層后面加了一個1*1的卷積核來產(chǎn)生最粗略的特征圖。最后,用3*3的卷積核去處理已經(jīng)融合的特征圖,以生成最后需要的特征圖。為了后面的應用能夠在所有層級共享分類層,這里固定了3*3卷積后的輸出通道為d,這里d設為256。因此所有額外的卷積層具有256通道輸出。這些層沒有用非線性激活函數(shù)。卷積2,3,4,5層對應的融合特征層為P2,3,4,5,對應的層空間尺寸均相同。

通常在神經(jīng)網(wǎng)絡中是同等地對待每一個卷積層,但是其實每一個通道的特征通常都表示某特定類別的目標。參考文獻[21-23],該文設計了一種全新的混合注意力模塊(通道空間注意力模塊CSA),分別包括全局通道注意力和局部空間注意力兩個子模塊。全局通道注意力是為了解決每個通道在卷積神經(jīng)網(wǎng)絡中貢獻不同的問題,局部空間注意力是為了關注圖片中的局部細節(jié)信息而加入的。

圖4 混合注意力模塊(包含全局通道注意力和局部空間注意力兩個子模塊)

如圖4所示,該通道注意力首先對輸入的特征進行一個全局平均池化操作和全局最大池化操作。假如輸入的是一個h*w*c的特征圖,由兩個全局池化(池化大小為h*w)的操作可以得到兩個1*1*c的特征圖,然后將這兩個特征圖進行一個相加操作,相加后得到一個1*1*c的特征圖,這個1*1*c的特征圖與輸入的特征圖h*w*c相乘便得到全局通道注意力之后的特征圖。將全局通道注意力特征圖作為輸入,送入到局部空間注意力模塊中,輸入到局部空間注意力的特征經(jīng)過一個局部最大池化和局部平均池化后分別得到兩個特征圖,特征圖的大小是(h/s)*(w/s)*c(s是池化的步長),然后將經(jīng)過局部最大池化和局部平均池化得到的特征圖進行一個相加操作。這樣經(jīng)過全局通道注意力和局部空間注意力之后便得到重要的通道,同時也關注到局部信息。

損失函數(shù)與Faster R-CNN是一樣的,定義成以下式子:

(1)

Lreg(ti,Ti)=L1(ti-Ti)

(2)

其中,i是一個小批量中anchor的索引;pi是預測的該anchor是目標的概率;Pi是真值標簽,如果anchor是正樣本,真值標簽的值為1,否則為0;ti是預測的邊界框的四個參數(shù)化坐標向量;Ti是真值框的四個參數(shù)化坐標向量;Lcls是分類損失,判斷預測框是目標還是背景;Lreg是回歸損失;L1是平滑損失。PiLreg意味著只對正樣本錨框進行回歸,因為當是負樣本錨框時Pi的值為0。

3 實 驗

3.1 實驗環(huán)境和數(shù)據(jù)集

實驗是在NVIDIA GeForce GTX TITAN XP GPU平臺上進行的,網(wǎng)絡訓練運行內(nèi)存為12 GB,代碼基于PyTorch深度框架。

該文使用的數(shù)據(jù)來源于真實施工場景。從電力工作人員必備的安全防護工具的角度考慮,收集了絕緣手套、絕緣鞋、安全帶、安全繩以及掛鉤的相關圖片數(shù)據(jù),從而更好地進行施工現(xiàn)場安全性檢測。共實地收集了2 541張圖片,其中劃分80%作為訓練集,其余圖片作為驗證集。表1列舉了制作的數(shù)據(jù)集的具體檢測對象分布情況。注意到該數(shù)據(jù)集中的類別個數(shù)相差較大,是因為部分類別的場景分布較單一,比如絕緣手套破損和絕緣鞋,只出現(xiàn)在很少的場景下。

表1 電網(wǎng)施工現(xiàn)場安全工器具數(shù)據(jù)集的類別分布

3.2 評價指標

目標檢測的效果取決于預測框的位置和類別是否準確,主流的評級指標有:平均精度值(Average Precision,AP)和平均精度均值(mean Average Precision,mAP)[24]。AP是一種可以用來度量模型預測框類別和位置是否準確的指標,AP通過計算每個類別預測框和真實框的IoU來判斷預測框是否準確預測到了位置信息,同時引用精確度和召回率指標評價預測框的類別是否準確。mAP是對多個驗證集個體求平均AP值得到的。

3.3 模型訓練細節(jié)

文中方法是兩階段的檢測方法。深度學習方法中,數(shù)據(jù)是其基石,模型的訓練離不開大量的數(shù)據(jù)。因此,為了提高模型的泛化能力和魯棒性,采用了多種混合的數(shù)據(jù)增強方法,對研究所收集到的數(shù)據(jù)進行增強,從而使得神經(jīng)網(wǎng)絡具有更好的泛化效果。表2列舉了不同的數(shù)據(jù)增強方式所帶來的模型增益。其中AP0.5表示在訓練和測試中使用的閾值,即當預測結果中的檢測框與數(shù)據(jù)標注的真值框的交并比大于0.5時,認為其檢測到了目標的平均精度。由于網(wǎng)絡中使用了全連接層,在訓練時還為圖片輸入設定了固定值,為600*600像素。實驗中,學習率設置為0.001。

通過實驗證明,選取經(jīng)典的ResNet101作為骨干網(wǎng)絡。同時,為了加快模型訓練速度,使用官方提供的ImageNet數(shù)據(jù)集上的預訓練模型進行參數(shù)初始化,而不是令參數(shù)隨機初始化。

表2 不同數(shù)據(jù)增強方法的性能對比

3.4 各模塊有效性驗證的對比實驗

文中方法是在Faster R-CNN基礎上進行的改進和優(yōu)化。在原本網(wǎng)絡中增加了兩個模塊,進一步提升了原有網(wǎng)絡的性能。為了證明所設計的模塊的有效性,進行了相關消融實驗,并將實驗的配置細節(jié)和評估結果放在表3中。

表3 各模塊的有效性驗證結果

特征金字塔FPN是針對小目標檢測不好的問題,增加了特征金字塔模塊來提升小目標檢測的能力。混合注意力CSA是針對不同通道在網(wǎng)絡中所作的貢獻不同,所以引入注意力機制來解決此問題。相對于baseline,網(wǎng)絡性能都能得到一定的提升,當兩個模塊都添加到網(wǎng)絡中時,網(wǎng)絡性能提升得最大。

3.5 與現(xiàn)有檢測方法的對比實驗

首先將提出的方法與其他經(jīng)典的目標檢測方法在電網(wǎng)施工現(xiàn)場安全工器具數(shù)據(jù)集上進行對比實驗。在Faster R-CNN[2]、SSD[9]、RFBNet[25]和YOLOv3[10]這4種經(jīng)典且有效的方法上的實驗結果展示在表4中。

表4 文中方法與現(xiàn)有方法在電網(wǎng)安全 工器具數(shù)據(jù)集上的對比實驗

可以發(fā)現(xiàn),文中方法在電網(wǎng)施工現(xiàn)場安全工器具數(shù)據(jù)集上的性能表現(xiàn)都是略優(yōu)于其他方法的,較其他算法分別提高了8.7%、8.1%、9.1%和4.8%。圖5直觀地展示出文中方法在電網(wǎng)施工現(xiàn)場安全工器具數(shù)據(jù)集上的實驗結果。其中左上角的圖片是檢測到掛鉤與安全繩斷股,右上角圖片是檢測到絕緣手套,第二行圖中檢測到安全帶破損與掛鉤情況。

圖5 文中方法在電網(wǎng)安全工器具數(shù)據(jù)集 上的檢測結果示例

4 結束語

電網(wǎng)施工及安全檢查對于電力工作人員的安全性保護至關重要,因此對安全工器具的正確佩戴和安全工器具是否破損的檢測工作是非常必要的。該文提出一種基于混合注意力網(wǎng)絡的安全工器具檢測方法。混合注意力網(wǎng)絡以經(jīng)典的Faster R-CNN為主干網(wǎng)絡。為了側重比較重要的通道引入了混合注意力模塊,包含全局通道注意力和局部空間注意力兩個子模塊。為了解決部分目標較小的問題引入了特征金字塔模塊,采用了基于多尺度特征金字塔的多層預測方法。由于安全工器具的數(shù)據(jù)集數(shù)量較少,引入了多種混疊的數(shù)據(jù)增強方法,以此提高了檢測的準確性。然而,該算法也存在一些不足,對于檢測目前還不能滿足實時的要求,后面欲通過通道剪枝來去除不重要的通道,從而提高算法的運算速度。

猜你喜歡
特征檢測方法
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
小波變換在PCB缺陷檢測中的應用
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
主站蜘蛛池模板: 啦啦啦网站在线观看a毛片 | 爱色欧美亚洲综合图区| 国产在线精彩视频二区| 国产69囗曝护士吞精在线视频| 国产一级无码不卡视频| 无码内射中文字幕岛国片| 久草美女视频| 亚洲视频免费在线看| 夜夜操天天摸| 亚洲欧洲日产国产无码AV| 国产精品免费福利久久播放| 亚洲综合色婷婷| 亚洲综合亚洲国产尤物| 91在线高清视频| 国产香蕉在线视频| 国产一级α片| 在线观看免费黄色网址| 最新日本中文字幕| 亚洲精品国产综合99久久夜夜嗨| 亚洲第一天堂无码专区| 国产H片无码不卡在线视频| 欧洲av毛片| 日韩第一页在线| 亚洲综合极品香蕉久久网| 五月天综合婷婷| 91国内外精品自在线播放| 午夜a级毛片| 毛片手机在线看| 欧美高清视频一区二区三区| a级毛片免费网站| 国产特一级毛片| 中文无码影院| 国产肉感大码AV无码| 丰满人妻中出白浆| 黑人巨大精品欧美一区二区区| 国产xx在线观看| 国产亚洲高清在线精品99| 久久精品aⅴ无码中文字幕| 天天干天天色综合网| 在线精品视频成人网| 欧美在线观看不卡| 乱人伦中文视频在线观看免费| 亚洲人成日本在线观看| www.亚洲色图.com| 99精品国产电影| 亚洲福利片无码最新在线播放| 欧美性色综合网| 99热这里只有精品2| a免费毛片在线播放| 国产区成人精品视频| 欧美www在线观看| 日本免费a视频| 97免费在线观看视频| 国产一级毛片网站| 99re精彩视频| 无码aaa视频| 亚洲国产日韩一区| 久久久久久久久久国产精品| 免费三A级毛片视频| 婷婷综合亚洲| 91精品免费久久久| 久久这里只有精品66| 欧美日韩午夜| 亚洲一区二区成人| 久久久久免费看成人影片| 国产精品观看视频免费完整版| 无遮挡国产高潮视频免费观看 | 老司机精品一区在线视频| 国产成人凹凸视频在线| 老司机精品一区在线视频| 国产激爽爽爽大片在线观看| 国产精品污视频| 国产一级毛片yw| 五月丁香伊人啪啪手机免费观看| 一本大道无码高清| 午夜日b视频| 国产自在线拍| 国产精品太粉嫩高中在线观看| 国产视频只有无码精品| 国产97视频在线| 毛片免费在线视频| 成人va亚洲va欧美天堂|