國網思極位置服務有限公司 石 帥 鄭岳峰
隨著社會經濟的高速發展,國家電力事業取得了卓有成效的進步,電力基建項目逐年增加,為社會生產及人們生活帶來了極大的便利。但基于電力作業環境的復雜性與特殊性,施工人員的安全問題、施工現場管控也面臨著嚴峻的挑戰[1]。傳統電力基建施工現場管控多采用人工監督檢查的方式,需要耗費大量人力,且效率低、時效性差,容易出現疏忽,難以實現整體把控及實時監控。
隨著人工智能技術發展,應用圖像數據構建基建現場安全狀態評估成為可能,卷積神經網絡通過對低層特征的組合,能夠獲得抽象高層特征與屬性,檢測精度高、速度快,其中以YOLO 算法應用最為普遍,其識別效果優良,檢測速度快[2],v3可對網絡結構進行調整,是目標檢測領域取得的重要成果。研究在電力基建施工現場引入YOLO-v3算法,旨在為現場管控提供技術支持,其對于電力基建發展有著重要的意義。
作為一種單階段檢測器,YOLO 能夠將最終的檢測結果直接給出,省略了候選區域步驟,在保障檢測精度的基礎上,提升了檢測速度。檢測期間以整個圖像特征為依據,避免了背景所致的錯誤。從YOLO-v3結構看,其應用的是Darknet-53特征提取網絡,其包括53個卷積層,多個3×3、1×1卷積核,在設計層面,將快捷鏈路加入層與層之間,對小目標具有良好的檢測能力[3]。Darknet-53殘差卷積過程,首先行3×3(步長=2)卷積,保存卷積layer,然后分別進行1×1、3×3卷積,獲得的結果與layer 相加,為最終結果。殘差網絡方便優化,通過增加深度可促進準確率的提升,將跳躍連接應用于內部殘差塊,可以有效解決深度增加所致的梯度消失問題。
在卷積部分,應用DarknetConv 2D 結構,卷積時進行L2正則化處理,然后實施BN 標準化處理與Leaky Relu 處理,前者主要目的是加快收斂,同時防止梯度消失。Leaky Relu 則能夠解決函數進入負區間、神經元停止學習的問題,其表達式為:
其中,ai 表示的是在[1,+∞]的固定參數。
具體到電力基建施工現場管控工作中,該系統主要由監視設備、現場終端系統及數據傳輸網絡、視頻存儲服務器等組成,利用視頻監控能夠對施工現場的圖片數據信息進行采集,并向現場終端系統匯總。對于圖片數據,在現場便能夠進行實時處理,獲得結果,或通過數據傳輸網絡向遠程端傳輸,進行遠程管控[4]。
電力基建施工現場管控系統如圖1所示。該系統屬于實時目標檢測模型,其利用視頻監控設備采集圖片數據,應用人工智能算法提取目標特征,并進行模型訓練,完成目標檢測、文字識別等。施工現場管控系統不僅能夠實現對安全帽穿戴、抽煙、標識牌等的檢測,而且能夠明確安全隱患,提供預警信息,促進基建現場安全管控水平的提升。

圖1 電力基建施工現場管控系統
Darknet-53網絡是YOLO-v3的主體,其與Darknet 19相比,網絡結構深,以殘差結構防止深層網絡訓練的梯度消失問題。YOLO-v3網絡應用全卷積結構,以FPN 多尺度融合作為參考,經Darknet 主干特征提取3個分支,通過拼接,對特征圖向量的維度進行擴充。獲得的3個特征圖能夠完成對相應尺度錨邊界框的特征提取[5]。特征圖越大表明感受野越小。基于此在對精細目標進行檢測時,可以選擇小尺寸錨邊界框;較大目標可以應用較大尺寸錨邊界框。
通常,應用視頻監控設備能夠對工地上工作人員的情況進行實時獲取,以視頻流的方式完成對現場目標的定位與檢測。一般監控設備安裝在現場邊緣的高處地帶,高度為10m 左右,俯視角范圍為15°~30°,獲取的施工畫面為非正面成像,目標縱向尺寸經投影其長寬比會出現一定的改變,對錨邊界框初始值確定有直接的影響。針對電力基建現場5種管控目標,應用Kmeans 算法實施聚類分析,獲得對應預測值,不同分支網絡對應各尺寸的特征見表1。

表1 錨邊界框預測值
網絡輸出結果如下。
一是(tx,ty),其指的是預測邊界框特征圖、中心坐標偏移量,預測邊界框與錨邊界框的寬高比用(tw,th)表示。
二是(Pw,pH)是預設錨邊界框寬高尺寸。由此獲得預測邊界框中心坐標,可以采用(bx,by)表示,寬高表示為(bw,bh)。b0表示置信度,不同類別概率用bc表示,計算式為:
其中網格的左上角坐標為(Cx,Cy),σ(x)為sigmoid 函數,預測值可加速網絡收斂,區間為[0,1]。
電力基建現場工作環境特殊,對施工人員要求高,不僅需要對常規違規行為進行檢測,而且需要檢測抽煙、看手機等行為,該模型需要對同一目標多個類別情況進行識別,該過程需要對損失函數進行優化,總損失函數表達式為:
網絡優化應用損失函數,采用均方誤差損失函數對邊界框寬高(bw,bh)進行預測,中心點坐標(bx,by),b0為置信度,應用二值交叉熵損失函數對邊界框各個類別的概率bc進行預測,其能夠實現對目標多類別的有效識別,避免內存溢出。
以某電力公司電力基建現場安裝的移動監控攝像頭作為視頻采集工具,共獲得了1500h 視頻時長,從中截取57000張有效數據集,根據8∶1∶1的比例將所抽取的數據組成訓練集、驗證集與測試集,數據集涵蓋了攝像頭在不同時間段的數據,配置的環境參數及訓練時長見表2。

表2 環境配置參數
網絡參數包括學習率、動量常數、權值衰減系數,學習率在訓練模型的收斂中有著重要的意義,為使模型收斂,需要設計學習率為較小參數,若該值過大,會出現目標函數超出極小點的情況,若該值過小,會減慢收斂速度,因此設為0.001。收斂常數設置為0.7,能夠促進收斂速率的提升。權值衰減系數主要目的是對模型復雜度對損失函數影響的調節,該值過大會導致損失函數值過大,設置為0.0004能夠發揮較好的調節作用。
在模型訓練中網絡總損失函數Loss 值在初始的4000次迭代中有著較快的下降速度,直至32000次迭代后逐漸處于穩定狀態,保持為0.5左右,體現出良好的網絡收斂性能,參數實現了優化。
網絡預測需要經過的步驟包括:一是得分閾值為0.6,預測邊界框各個類別概率bc 為篩選,將每個類別概率過低邊界框去除。二是交并比閾值為0.5,針對某一類別對應的預測邊界框性nms 非極大值抑制,篩選符合條件的作為輸出結果。
將YOLO 神經網絡優化前及優化后獲得的目標圖像檢測結果進行比較,可以發現在設備錯誤識別率方面,優化后的模型錯誤識別率達到100%,而優化前的錯誤識別率為83.3%,設備錯誤識別率詳見表3。

表3 設備錯誤識別率
由此可見,應用電力基建施工管控技術能夠提升對錯誤的識別準確率。
對優化前后的性能進行比較分析,發現優化前出現施工人員漏檢、安全帶漏檢及電焊手套漏檢的情況;經過優化后安全帽、安全帶及人等均能夠被精準定位及有效檢測,未出現漏檢或錯檢,不僅如此,人在站立狀態下或下蹲狀態下均能夠被有效識別,魯棒性強,即便施工人員有重疊,經過優化網絡依然可以精準定位各個目標。優化前后性能的比較見表4,顯示優化后有著更好的精度,這是因為經過優化YOLO 可將俯視拍攝的畫面進行有效的處理,使得目標與檢測框重合度高,檢測效果好。

表4 優化前后性能比較
研究應用YOLO-v3算法建立了電力基建施工現場管控系統,其能夠實現對電力設備鋪設位置、類別的預測,提升對違規行為的檢測精度及檢測效率,具有良好的魯棒性,能夠滿足電力基建施工現場管控需求。在后續工作中,需要與施工實際結合,進一步探究YOLO-v3算法的應用優勢,為電力基建事業發展提供支持。