馬斌 徐海軍 陳嘉靖


摘 要:現有卷積神經網絡檢測方法不能滿足高檢測精度和速度的要求。針對此不足,利用卷積神經網絡選取目標檢測算法,以DarkNet53 網絡模型為基礎,結合黃河流域違采事件特點,對模型加入并行化設計,以檢測速度和檢測精度為評價指標,利用對比實驗驗證并行化后的HO-DarkNet 網絡模型的加速效果。結果表明:并行化前HO-DarkNet 模型的精確率約75%、召回率約96%、mAP@ 0.5 為98.58%、mAP@ 0.5 ∶ 0.95 為64.25%,與DarkNet53 模型相比,并行化前HO-DarkNet 模型的mAP@ 0.5、mAP@ 0.5 ∶ 0.95 值分別提升了7.98%、8.79%;與并行處理前HO-DarkNet 模型相比,并行處理后HO-DarkNet 模型的mAP 精度值未發生太大變化,但其加速比提高了2.32,對于視頻圖像的處理速度為21 fps/ s,達到視頻圖像處理速度標準。
關鍵詞:HO-DarkNet 模型;水利監管;違采事件檢測;并行化;黃河
中圖分類號:TV853;TV882.1 文獻標志碼:A doi:10.3969/ j.issn.1000-1379.2023.10.022
引用格式:馬斌,徐海軍,陳嘉靖.面向水利監管的違采事件檢測并行化方法研究[J].人民黃河,2023,45(10):122-125.
近年來,頻繁發生的黃河違規采砂事件對流域生態系統造成了嚴重破壞。為此,相關部門提出開展黃河河道采砂專項整治行動,通過強化法治管理,維護河道采砂秩序,促進黃河流域生態系統平穩發展[1] 。在眾多檢測技術中,目標檢測算法在水文檢測、水位信息智能識別、砂石檢測[2] 等方面發揮著重要作用,其中基于深度學習的目標檢測算法應用尤其廣泛[3] 。深度學習是在卷積神經網絡的基礎上,通過增加網絡深度提高計算機提取數據特征的能力[4] 。然而,增加網絡深度會加大運算量,影響檢測效率。采用數據并行、模型并行等方法對多模型進行優化,可以加速運算。數據并行是指在完整模型基礎上,通過把數據劃分為若干份,實現多批次數據同時訓練。此時并行設備數量會受到批數據大小的限制,當批數據過大時,達到相同收斂精度所需的迭代次數會大幅度增加。模型并行是指將模型按層或者其他方式分解為若干份來進行訓練,這種方法通常用于拆分大型模型,以加速訓練過程,但其擴展性較差。目前,PyTorch 和TensorFlow 等主流深度學習框架都采用數據并行方式。
本文以面向水利監管的違采事件為研究對象,首先改進檢測算法模型,減少梯度信息量,再采用并行運算提高模型訓練速度和檢測速度,最后基于違采事件監管數據集驗證模型并行后的加速效果,以期為快速、準確地檢測違采事件提供新技術。
1 理論方法
1.1 卷積神經網絡
卷積神經網絡(Convolutional Neural Networks,CNN)模型[5]結構分為卷積層、池化層和全連接層。卷積層從輸入特征圖像通道提取特征信息[6] ;池化層對提取的特征信息進行下采樣,減輕網絡模型的過擬合程度;全連接層連接提取的特征圖像,使用分類器得到最終分類結果。在卷積神經網絡模型中,通常會在若干個卷積層和池化層之后引入全連接層,池化層伴隨卷積層交替顯示。
1.2 目標檢測算法
one?stage 和two?stage 算法是基于深度學習的主要目標檢測算法[7-8] 。two?stage 算法先通過某種方式生成一些候選框,再通過卷積神經網絡對候選框進行分類。常見的two?stage 目標檢測算法有Faster-RC?NN[9] 、R-FCN[10] 算法,此類算法要進行多次檢測和分類,運行較慢。而one?stage 目標檢測算法只需將數據一次傳送進網絡,就可以預測出所有的邊界框。常見的one?stage 目標檢測算法有SSD 和YOLO v3 算法,此類算法沒有單獨的候選區域提取過程,不需要產生候選框,僅一個前饋CNN 網絡就可以完成目標的位置檢測和分類預測任務,因此one?stage 目標檢測算法簡便快捷、運行較快。one?stage 目標檢測算法中DarkNet53網絡模型作為基于殘差網絡結構的卷積神經網絡模型,被廣泛應用于目標檢測領域。本文基于DarkNet53 網絡模型展開違采事件檢測研究。
2 違采事件檢測模型構建與并行化分析
2.1 違采目標群選取
通過調查黃河流域違規采砂事件發現,違采人通常利用手推車、裝載車、挖掘機等進行采砂,再進行非法售賣。因此,本文主要選取違采人、采砂工具等作為特定的違采目標群來進行模型設計。2.2 違采事件檢測模型構建DarkNet53 網絡模型由卷積層和殘差層組成,使用大量殘差跳層連接,其包含的梯度信息數量多、重復率高。針對此問題,提出改進的HO-DarkNet 網絡模型來構建違采事件檢測模型。在HO-DarkNet 網絡模型中,把基礎層次的特征圖劃分成2 個部分,再使用跨階段的層次結構將它們合并,可以減少網絡模型中大量重復的梯度信息,提高網絡模型的處理速度。HODarkNet網絡模型單個模塊(HO_X)結構見圖1,圖中CBL 為Conv(卷積)、BN(批量歸一化)、Leaky_relu 激活函數三者結合的組件;Res unit 組件借鑒Resnet 網絡中的殘差結構,可以增加網絡深度;Concat 組件的作用是張量拼接,會擴大維度的張量。
3 數據獲取與預處理
數據獲取方式有實地拍攝和網上圖像爬取。本研究通過實地拍攝獲取5 000 張圖像,通過網絡爬蟲技術獲得35 000 張圖像,共獲取40 000 張圖像作為實驗數據集。由于采集的數據集會受到圖像尺寸、圖像清晰度、目標受遮擋程度等因素的影響,因此需要對采集圖像進行數據清洗、人工篩選。采用Labelimg 軟件對數據集進行標注,制作成VOC 格式的數據集,在An?notation 文件路徑下生成與標注圖像相對應的xml 文件。對采集的圖像進行處理后,得到違規采砂數據集分類數量如下:違采人圖像3 142 張,鏟車圖像2 812張,灰斗車圖像2 746 張,鏟子圖像2 600 張,挖掘機圖像3 068 張,汽車圖像2 750 張,拉砂車圖像3 352 張。
4 確定評價指標
采用精確率、召回率和平均精確度(mAP)對模型效果進行評估。精確率是指正確預測的正例個數占所有預測為正例的樣本個數的比率[11] 。召回率是指所有被正確識別的目標數量占所有被識別目標數量的比率[12] 。mAP 表示一個模型在多個類別上的檢測準確性,用mAP@ 0.5 表示IoU(Intersection over Union)閾值為0.5 時的平均精確度,用mAP@ 0.5 ∶ 0.95 表示IoU 閾值為0.5~0.95時的平均精確度。
衡量并行算法性能的指標有加速比和并行效率[13] 。加速比反映系統運行并行程序時發揮并行能力的程度,其與硬件、軟件都有關系。并行效率是衡量并行計算系統利用多個處理單元或計算資源時的有效性和性能提升程度的指標,反映實際執行時間與理論最佳執行時間之間的差異。
5 實驗結果分析
采用HO-DarkNet 網絡模型對違采事件進行實驗,使用獲取的違規采砂數據集進行訓練和測試,批處理大小設置為32,訓練次數為5 000 次,測試次數為1 000次,初始學習率設為0.001,在測試第2 000 次和第4 000 次后各設置學習率為0.000 1、0.000 01 進行實驗。實驗效果見圖3 和表1。
閾值為50 時可以實現精確率和召回率的平衡,此時HO-DarkNet 網絡模型的精確率在75%附近波動,召回率在96% 附近波動。與DarkNet53 模型相比,HO-DarkNet模型的mAP@ 0.5、mAP@ 0.5 ∶ 0.95 值分別提升了7.98%、8.79%,HO-DarkNet 網絡模型性能有所提高。
在處理速度方面,標準的視頻圖像處理速度為24~30 fps/ s。經過多次實驗發現,HO-DarkNet 網絡模型對于視頻圖像的處理速度為6 fps/ s,不能達到實際應用需求。因此,采用并行方法進一步對HO-DarkNet網絡模型進行改進,以提高處理速度。
為驗證并行化設計的有效性,本實驗繼續采用上述違規采砂數據集,設置數據集為20 000 張圖像,其中:16 000 張為訓練圖像,4 000 張為驗證圖像,參數設置保持不變。并行處理前HO-DarkNet 網絡模型的加速比為1.00,并行處理后HO-DarkNet 網絡模型的mAP @ 0. 5 值為90. 40%, mAP @ 0. 5 ∶ 0. 95 值為55.39%,加速比為3.32。并行處理后HO-DarkNet 網絡模型的mAP 精度值未發生太大變化,而檢測速度有了大幅度提升。同時經過多次檢測發現,并行處理后HO-DarkNet 網絡模型對于視頻圖像的處理速度為21 fps/ s,達到視頻圖像處理速度標準。
6 結論
本文圍繞黃河流域違規采砂事件,對面向水利監管的違采事件檢測方法進行并行化研究。通過分析DarkNet53 網絡模型基本結構,結合檢測背景、需求和目標等特點,對卷積計算過程進行并行化分析,構建并行化HO-DarkNet 網絡模型。相比于DarkNet53 網絡模型,并行化的HO-DarkNet 網絡模型可以顯著提高檢測速度。
參考文獻:
[1] 孫運鋒.踐行治水思路錨定“兩個確保” 深入推動河南水利高質量發展[J].河南水利與南水北調,2022,51(1):1-6.
[2] SIT M,DEMIRAY B Z,XIANG Z R,et al.A ComprehensiveReview of Deep Learning Applications in Hydrology andWater Resources[J].Water Science and Technology,2020,82(12):2635-2670.
[3] REN S Q,HE K M,GIRSHICK R,et al.Faster R?CNN:To?wards Real?Time Object Detection with Region Proposal Net?works[J].IEEE Transactions on Pattern Analysis & MachineIntelligence,2017,39(6):1137-1149.
[4] DONG S,WANG P,ABBAS K.A Survey on Deep Learningand Its Applications[J].Computer Science Review,2021,40(1):100379.
[5] BHATT D,PATEL C,TALSANIA H,et al.CNN Variants forComputer Vision:History,Architecture,Application,Challengesand Future Scope[J].Electronics,2021,10(20):2470.
[6] Wang Z J,TURKO R,SHAIKH O,et al.CNN Explainer:Learning Convolutional Neural Networks with Interactive Visu?alization[J].IEEE Transactions on Visualization and ComputerGraphics,2020,27(2):1396-1406.
[7] 張苗,李璞,楊漪,等.基于目標檢測卷積神經網絡的圖像型火災探測算法[J].消防科學與技術,2022,41(6):807-811.
[8] 張海濤,張夢.引入通道注意力機制的SSD 目標檢測算法[J].計算機工程,2020,46(8):264-270.
[9] MANSOUR R F,ESCORCIA?GUTIERREZ J,GAMARRA M,et al.Intelligent Video Anomaly Detection and ClassificationUsing Faster RCNN with Deep Reinforcement Learning Model[J].Image and Vision Computing,2021,112:104229.
[10] CEN H.Target Location Detection of Mobile Robots Basedon R?FCN Deep Convolutional Neural Network[J].Interna?tional Journal of System Assurance Engineering and Man?agement,2021:14(2):728-737.
[11] 田喬鑫,孔韋韋,滕金保,等.基于并行混合網絡與注意力機制的文本情感分析模型[J].計算機工程,2022,48(8):266-273.
[12] 劉萬軍,王鳳,曲海成.融合多尺度特征的目標檢測模型[J].激光與光電子學進展,2019,56(23):123-133.
[13] 王之元,楊學軍.并行計算系統度量指標綜述[J].計算機工程與科學,2010,32(10):44-48.
【責任編輯 栗 銘】