999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于改進YOLOv5s的無人機航拍小目標檢測算法研究

2024-09-26 00:00:00尹泉賀原素慧朱夢琳蘭潔
現代信息科技 2024年14期

摘 要:目前,無人機航拍目標檢測技術在軍事和民用領域得到廣泛的應用,但復雜場景中小目標密集,易出現誤檢和漏檢的情況。為此,文章提出一種基于改進YOLOv5s的無人機航拍小目標檢測算法,用分組卷積取代兩個普通卷積,用解耦檢測頭取代耦合檢測頭,去除了原始算法中的P5檢測頭,在PANet結構中增加一層新的P2檢測頭。仿真結果表明,改進算法具有較好的檢測效果,mAP50較原始算法提高了9.3%,同時能夠滿足無人機實時性檢測需求。

關鍵詞:無人機航拍;小目標檢測;空間池化金字塔;解耦檢測頭

中圖分類號:TP391.4;TP183 文獻標識碼:A 文章編號:2096-4706(2024)14-0037-07

Research on Small Target Detection Algorithm for UAV Aerial Photography

Based on Improved YOLOv5s

YIN Quanhe, YUAN Suhui, ZHU Menglin, LAN Jie

(College of Information Engineering, North China University of Water Resources and Electric Power, Zhengzhou 450046, China)

Abstract: At present, UAV aerial photography target detection technology has been widely applied in military and civilian fields, but in complex scenes, small targets are dense and prone to false positives and missed detections. For this purpose, this paper proposes a small target detection algorithm for drone aerial photography based on improved YOLOv5s, which replaces two ordinary convolutions with grouped convolutions and decoupled detection heads instead of coupled detection heads. The P5 detection head in the original algorithm is removed, and a new P2 detection head is added to the PANet structure. The simulation results show that the improved algorithm has good detection performance, with mAP50 increased by 9.3% compared to the original algorithm, and can meet the real-time detection requirements of UAV.

Keywords: UAV aerial photography; small target detection; spatial pooling pyramid; decoupled detection head

DOI:10.19850/j.cnki.2096-4706.2024.14.008

0 引 言

目標檢測是計算機視覺中的一個重要任務,旨在在圖像中識別感興趣的目標并確定其類別與位置。無人機作為一種成本低、易操作、較靈活的飛行器,在軍事、商用和民用領域得到廣泛的應用。近年來,將目標檢測技術應用于無人機成為學者研究的焦點[1]。基于深度學習的目標檢測算法分為兩大類[2]:單階段(One-Stage)和雙階段(Two-Stage)。單階段方法無須生成候選區域,直接提取圖像特征,簡單高效,但精度相對較低,代表方法包括OverFeat、SSD和YOLO系列。雙階段方法需要生成候選區域,具有高精度、強穩定性和強可擴展性,但速度較慢且較為復雜,代表方法有R-CNN、FastR-CNN和FasterR-CNN。總體而言,單階段方法速度快但精度偏低,而雙階段方法精度高但速度偏慢。

針對小目標檢測,潘曉英等[3]梳理了國內外研究現狀及成果,分析并歸納了小目標檢測所面臨的挑戰與難點。楊慧劍等[4]解決了因成像距離遠、高空拍攝圖像模糊以及目標信息占比小而導致目標檢測精度不高的問題,以YOLOv5為基礎模型,在FPN結構中添加了新的檢測頭P2,用以實現更細粒度的目標檢測。雖然降低了小目標漏檢誤檢情況發生的概率,但卻增加了訓練過程中的計算量。另外還把原始算法的空間池化金字塔層(SPP)更改為空洞空間池化金字塔(ASPP),通過不同的空洞率構建不同感受野的卷積核,獲取多尺度特征信息從而減輕池化操作對特征信息的影響。由于空洞卷積的特性,在擴大感受野和獲取不同尺度特征的同時,采樣并不密集,可能會丟失局部信息,所得到的卷積結果之間沒有相關性。劉濤等[5]解決了因小目標圖像分布密集和類別不均衡且特征不明顯而導致漏檢和誤檢的問題,以YOLOv5s為基礎模型,改進了錨框聚類算法,更加精確地鎖定檢測區域,有效提升了針對小目標的捕捉能力。魏養養等[6]解決了小目標分布密集和重疊的問題,以YOLOv5s為基礎模型,引入混合注意力模塊來提高卷積神經網絡對特征圖的提取能力,使小目標檢測效果有所提升,但提升幅度卻不夠大。

1 YOLOv5模型

YOLOv5是目標檢測領域廣泛部署的模型,具有結構簡單、模型小巧、易于使用和精度較高等優點。模型的大小由寬度和深度決定,而寬度和深度則由配置文件中的縮放系數確定。通過調整縮放系數,YOLOv5可提供不同大小的模型,如YOLOv5n、YOLOv5s、YOLOv5m、YOLOv5l和YOLOv5x,以適用于不同的任務。本文研究的主要目的是對YOLOv5s進行改進,該模型由以下4個部件組成。

1.1 輸入端(Input)

這個部分采用了Mosaic數據增強,通過對數據集縮放、剪切和排布的方式進行圖像拼接,增加數據集的數量,緩解模型過擬合并增強模型的泛化能力,對小目標的檢測效果有所提升。此外還采用了自適應錨框計算,每次訓練時自適應地計算不同訓練集中的最佳錨框數值。添加了自適應縮放圖片,緩解了因圖片尺寸不同縮放圖片而導致的圖像形變,更有利于提取圖片中的特征信息。

1.2 骨干端(Backone)

CSPDarknet53骨干網絡包括C3、Conv和SPPF(Spatial Pyramid Pooling-Fast)模塊。Conv模塊由Conv2d、BatchNorm2d和SiLU激活函數組成,用于特征提取、下采樣和通道數調整。C3網絡將輸入特征圖傳入兩個分支(一個分支由多個Conv和Bottleneck模塊組成,另一個分支僅有一個Conv模塊),然后將兩個分支的結果進行合并和融合。Bottleneck模塊是一種特殊的殘差結構,解決了深度網絡致使梯度消失的問題。主干網絡的最后一層是SPPF模塊——空間池化金字塔層,能夠處理任意大小的輸入,有效提取和保留不同尺度下最顯著的特征信息,減少冗余信息。

1.3 頸部端(Neck)

頸部端采用PANet [7]結構,將FPN [8](Feature Pyramid Networks)和PAN(Perceptual Adversarial Network)進行了有機結合。FPN是自底向上的特征金字塔,通過上采樣傳遞深層特征圖的明顯語義特征,對整個金字塔進行語義信息增強。PAN是自頂向下的金字塔,通過下采樣傳遞淺層特征圖的定位信息,對整個金字塔進行定位信息增強。這樣,頸部就實現了對特征圖的有效融合,得到同時具有語義信息和定位信息的特征圖。

1.4 輸出端(Detect)

特征圖通過耦合頭對目標的類別與位置信息進行預測,最后輸出目標類別與位置結果。YOLOv5的網絡結構及各模塊結構如圖1所示。

2 改進的YOLOv5模型

由于小目標在圖像中所占像素數的比重較小,分辨率相對較低,特征表達遜色于常規目標,所以小目標檢測長期以來一直是目標檢測研究的方向。而且當前的目標檢測算法對小目標并不友好,主要體現在以下幾個方面:

1)圖像中物體大小差異較大。難以融合局部和全局特征,特征圖的表達能力不夠。

2)目標檢測算法的設計問題。以YOLOv5為例,雖然對一般尺度目標的檢測效果不錯,但是對小尺度目標的檢測效果欠佳。由于YOLOv5的耦合檢測頭的分類任務和回歸任務是同時完成的,它們共享前一層的參數,這可能會導致一些信息的混淆,從而影響邊界框回歸的精度,忽視一些小目標的預測。

3)過大的感受野。在過大感受野特征圖的一個點中,小目標占據的特征會更少,而背景占據的特征會更多,網絡學習過多背景噪聲會產生過擬合,從而降低網絡的泛化能力。

本文以Ultralytics公司編寫的6.1版YOLOv5s算法為基礎模型進行改進,主要改進點有三個:

1)骨干端。為解決因圖像中物體大小差異較大而難以融合局部和全局特征,導致特征圖表達能力不夠的問題,將原有的空間金字塔池化(SPPF)改進為本文提出的分組空間金字塔池化(GSPPF),在減少參數量和擴大感受野的同時提升了網絡的特征信息提取能力和多尺度特征融合能力。

2)輸出端。為緩解分類任務與回歸任務沖突的問題,把原有的耦合檢測頭替換為解耦檢測頭,以此提升檢測精度。

3)頸部端。為解決感受野過大的問題,本文添加了新的小目標檢測層P2,縮小特征圖的感受野,減少背景與噪音的影響,提升對小目標的捕捉能力并刪除原有的檢測層P5,減少參數量和計算量,加速網絡訓練速度。

2.1 空間池化金字塔的改進

在分組卷積[9]、SPP和SPPF的啟發下,本文提出一種新模塊GSPPF,該模塊將原始算法SPPF模塊中的兩個普通卷積替換成分組卷積,并且將參數設為32。相較于普通卷積,分組卷積能夠減少運算量和參數量,同時還能發揮類似正則化的作用,能夠緩解過擬合的問題,增強網絡的泛化能力,提高了檢測精度。GSPPF模塊結構如圖2所示。

分組卷積將特征圖和卷積核分成組,進行組內卷積,每組生成一張特征圖,不改變特征映射的維度,但卻減少了運算量和參數量。例如,輸入特征圖通道12、輸出通道6,3×3卷積核,分組卷積參數設為3。普通卷積參數為12×3×3×6 = 648,分組卷積為4×3×3×6 = 216,分組卷積參數僅為普通卷積的1/3,顯著減少了運算量和參數量。普通卷積與分組卷積區別如圖3所示。

2.2 檢測頭的改進

檢測頭從特征圖中提取目標位置、置信度和類別信息。YOLOv5s中的檢測頭采用共享權重來處理分類和回歸任務,這簡化了設計但卻帶來參數、計算資源需求增大和容易出現過擬合的缺點,從而導致檢測精度明顯下降。

在目標檢測中,分類任務與回歸任務之間的沖突是一個眾所周知的問題。將原始算法的耦合檢測頭替換成解耦檢測頭可以有效緩解這一問題,通過將目標分類和目標位置信息提取出來,再通過不同分支處理不同的任務,最后分別輸出結果。Ge等[10]在耦合檢測頭與解耦檢測頭檢測效果的實驗中得出結論,耦合檢測頭可能會損害性能,而解耦檢測頭將分類任務與回歸任務分開,使用獨立的權重對特征圖進行學習,緩解了分類任務與回歸任務之間的沖突,使檢測精度得以提升,網絡擁有更好的泛化能力與魯棒性。耦合檢測頭與解耦檢測頭結構如圖4所示。

2.3 檢測層的改進

在原始YOLOv5s算法中,對640×640的輸入圖片進行8倍、16倍和32倍的下采樣,得到80×80、40×40、20×20大小的特征圖,用于檢測小、中、大尺度目標。然而,小尺度目標在無人機視角下的相對尺度和絕對尺度都很小,導致特征信息有限,加上大感受野背景噪音的干擾,網絡提取的有效特征十分有限。因此,選擇合適的感受野來控制背景噪聲等無用信息的影響,從而使輔助網絡學習到小尺度目標的特征信息,以此緩解網絡過擬合現象和提高網絡的泛化能力,進而提升對小尺度目標的檢測精度。添加160×160的小目標檢測層P2,讓感受野變小,保留更多小尺度目標的位置信息和細節信息,以在頸部端進行多尺度特征融合時提供更強的位置信息,使得進行預測的特征圖擁有更全的上下文信息,有利于網絡捕捉和學習小尺度目標的特征信息。考慮到無人機視角下的目標尺度普遍偏小,所以刪除了原始算法中負責大尺度目標檢測任務的檢測層P5,以減少不必要的參數量和計算量,提升網絡訓練速度。后經實驗證明,在新添加P2檢測層的基礎上,刪除P5檢測層后訓練時間節省了38.34分鐘。原始算法YOLOv5s的頸部端與改進YOLOv5s的頸部端如圖5所示。改進后的GDP2_YOLOv5s網絡結構如圖6所示。

3 實驗與結果分析

3.1 數據集、實驗環境與參數配置

本文訓練模型所使用的數據集是VisDrone2019_DET,該數據集包含十個類別,分別是0行人(pedestrian)、1人(people)、2自行車(bicycle)、3車(car)、4面包車(van)、5卡車(truck)、6三輪車(tricycle)、7遮陽棚-三輪車(awning-tricycle)、8巴士(bus)、9摩托車(motor),其中訓練集靜態圖片6 471張、驗證集靜態圖片548張、測試集靜態圖片1 610張,這些圖片都是由無人機攝像頭捕捉到的,小目標較多,具有分布密集的特點,因此是理想的小目標檢測算法數據集。

為了確保實驗的公平性,實驗環境與訓練時超參數配置情況如表1和表2所示,若沒有特殊說明,下列實驗均使用表中的實驗環境與超參數配置,未提及的超參數配置均使用默認值。

3.2 評價指標

本文采用的四個評價指標分別是:準確率(P),分出類是正類的準確概率;召回率(R)找出所有正類的概率;AP(Average Rrecision),是不同召回率R下的精確度P的積分,表示算法性能的優劣;mAP50(Mean Average Rrecision),是所有類別的AP平均檢測精度。四個評價指標如表3所示。

在表3式子中,TP表示樣本正類被判斷成正類,TN表示樣本負類被判斷成負類,FP表示樣本負類被判斷成正類,FN表示樣本正類被判斷成負類,而C則表示樣本的類別數。

3.3 對比實驗與消融實驗

3.3.1 檢測層數量對比實驗

為解決原始算法對小目標的漏檢和誤檢問題,本文添加了P2檢測層,但是在原始算法中P5檢測層是否保留的問題上,本文通過實驗的方式來驗證。實驗一,采用原始算法做對比(P3+P4+P5);實驗二,在原始算法頸部端添加P2檢測層(P2+P3+P4+P5);實驗三,在原始算法頸部端添加P2檢測層,刪除原有的P5檢測層(P2+P3+P4),這也是本文所使用的P2_WP5方法,實驗結果如表4所示。

從表4中可以看出,實驗二對比實驗一在評價指標P、R、mAP50和mAP50-95上都有較大的優勢,分別提升了3.6%、5%、5.5%和3.7%。證明添加P2檢測層后可捕捉到小目標的特征信息,能夠緩解原始算法對小目標的漏檢和誤檢問題。實驗三對比實驗二,雖然在召回率上有所下降,但在評價指標P、mAP50和mAP50-95上都有提升,分別提升了1.5%、0.6%和0.3%。證明了添加P2檢測層和刪除P5檢測層能夠讓網絡更加專注于小目標,從而提升了檢測精度。

3.3.2 消融實驗

為了驗證本文提出的每一個改進方法對原始算法YOLOv5s檢測能力的提升程度,現就不同改進方法對原始算法YOLOv5s的效果提升做消融實驗。實驗結果如表5所示。

由表5可知,每個改進的方法對小目標檢測的精度都有提升,證明了GSPPF可有效減少參數量與運算量,且提升了不同尺度特征的提取與融合能力,使得mAP50相比于Baseline上升了0.2%。檢測層的改進方法(P2_WP5)在各個評價指標上的提升程度最大,在P、R、mAP50和mAP50-95上分別提升了5.1%、4.4%、6.1%和4%。使得該改進方法成為提升占比最大的部分,證明了在針對小目標檢測的算法中,選擇合適的感受野是解決漏檢誤檢問題的重中之重。將耦合檢測頭替換為解耦檢測頭之后,使mAP50上升了1.3%,證明了解耦檢測頭能夠有效緩解回歸任務與分類任務的沖突,使檢測精度明顯上升。將GSPPF、P2_WP5和Decoupled Head等改進方法同時作用于Baseline,在P、R、mAP50和mAP50-95等評價指標上,分別提升了7.6%、7.4%、9.3%和6.4%。可以看出改進后YOLOv5s算法的檢測精度明顯優于改進之前,證明了本文方法可以有效提升小目標檢測能力。

YOLOv5s算法與GDP2_YOLOv5s算法檢測結果如圖7所示,其中圖7(a)為YOLOv5s檢測結果,而圖7(b)為GDP2_YOLOv5s檢測結果。在圖7(a)和圖7(b)中分別用虛線粗框和實線粗框圈出YOLOv5s檢測結果中漏檢和誤檢的地方,以及在GDP2_YOLOv5s檢測結果中緩解漏檢和誤檢的地方。

3.3.3 綜合對比實驗

為了驗證本文方法在小目標檢測方面的性能提升,對本文算法與YOLOv3、YOLOv5n、GDP2_YOLOv5s、YOLOv5m、YOLOv5l和YOLOv8等算法進行對比實驗。實驗結果如表6所示。

從表6可以看出,本文基于YOLOv5s算法改進的針對小目標檢測的GDP2_YOLOv5s算法在VisDrone2019_DET數據集上的mAP50值達到了43%,比其他的主流檢測算法YOLOv3、YOLOv5n、YOLOv5m、YOLOv5l和YOLOv8分別高出了3.7%、16.1%、4.7%、2.3%和11%,證明了本文算法在緩解小目標漏檢誤檢問題上的有效性,提升了模型對小目標的檢測精度。

4 結 論

本文提出一種改進的無人機小目標檢測算法GDP2_YOLOv5s,通過將原始算法中的SPPF替換為GSPPF,減少計算量和參數量,提高特征融合效率。采用解耦檢測頭替代原有的耦合檢測頭,緩解了分類與回歸任務的沖突,提高了檢測精度。在PANet結構中新增P2檢測頭,有效緩解了尺度方差的影響,對小目標更敏感和魯棒。刪除原算法中的P5檢測頭,減少計算量,更專注于小目標檢測,降低誤檢和漏檢。實驗證明,GDP2_YOLOv5s相比原算法提高了9.3%的mAP_0.5,FPS達到29幀/秒,同時滿足無人機實時檢測要求。

參考文獻:

[1] 冷佳旭,莫夢竟成,周應華,等.無人機視角下的目標檢測研究進展 [J].中國圖象圖形學報,2023,28(9):2563-2586.

[2] 郭慶梅,劉寧波,王中訓,等.基于深度學習的目標檢測算法綜述 [J].探測與控制學報,2023,45(6):10-20+26.

[3] 潘曉英,賈凝心,穆元震,等.小目標檢測研究綜述 [J].中國圖象圖形學報,2023,28(9):2587-2615.

[4] 楊慧劍,孟亮.基于改進的YOLOv5的航拍圖像中小目標檢測算法 [J].計算機工程與科學,2023,45(6):1063-1070.

[5] 劉濤,高一萌,柴蕊,等.改進YOLOv5s的無人機視角下小目標檢測算法 [J].計算機工程與應用,2024,60(1):110-121.

[6] 魏養養,李本銀,曹孟新.基于改進的YOLOv5s算法的水下小目標檢測 [J].安徽工程大學學報,2022,37(6):31-41.

[7] LIU S,QI L,QIN H F,et al. Path Aggregation Network for Instance Segmentation [C]//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition.Salt Lake City:IEEE,2018:8759-8768.

[8] LIN T Y,DOLLáR P,GIRSHICK R,et al. Feature Pyramid Networks for Object Detection [C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Honolulu:IEEE,2017:936-944.

[9] IOANNOU Y,ROBERTSON D,CIPOLLA R,et al. Deep Roots: Improving CNN Efficiency with Hierarchical Filter Groups [C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Honolulu:IEEE,2017:5977-5986.

[10] GE Z,LIU S T,WANG F,et al. YOLOX: Exceeding YOLO Series in 2021 [J/OL].arXiv:2107.08430v2[cs.CV].[2023-09-20].https://arxiv.org/abs/2107.08430.

作者簡介:尹泉賀(2000—),男,漢族,河南周口人,碩士研究生在讀,研究方向:圖像分類與識別;原素慧(2001—),女,漢族,河南安陽人,碩士研究生在讀,研究方向:圖像分類與識別;朱夢琳(1998—),女,漢族,河南洛陽人,碩士研究生在讀,研究方向:圖像分類與識別;蘭潔(1999—),男,漢族,河南三門峽人,碩士研究生在讀,研究方向:大數據技術分析與應用。

收稿日期:2023-12-04

主站蜘蛛池模板: 波多野结衣一级毛片| 亚洲丝袜中文字幕| 99精品这里只有精品高清视频| 国产成人区在线观看视频| 日韩无码视频专区| 欧美日韩国产在线播放| 狠狠色狠狠综合久久| 人妻一区二区三区无码精品一区| 国产美女91视频| 欧美在线免费| vvvv98国产成人综合青青| 精品国产自在在线在线观看| 真人免费一级毛片一区二区| 欧美午夜在线视频| 国产91丝袜在线观看| 欧美日韩高清在线| 国产精品无码翘臀在线看纯欲| 91丨九色丨首页在线播放| 人妻21p大胆| 手机成人午夜在线视频| 婷婷中文在线| 97久久精品人人做人人爽| 日韩天堂在线观看| 欧美精品一二三区| 色香蕉网站| 中文字幕天无码久久精品视频免费 | 天堂网亚洲综合在线| 亚洲日韩精品欧美中文字幕| 色亚洲成人| 国产一区二区在线视频观看| 91网在线| 97国产精品视频人人做人人爱| 成人伊人色一区二区三区| 国产亚卅精品无码| 22sihu国产精品视频影视资讯| 在线日韩一区二区| 亚洲成人一区二区三区| 不卡无码网| 国内自拍久第一页| 欧美色视频日本| 免费观看三级毛片| 日韩免费视频播播| 亚洲黄色激情网站| 亚洲欧美精品在线| 在线看片中文字幕| 日本道中文字幕久久一区| 97一区二区在线播放| 九色91在线视频| 日韩AV手机在线观看蜜芽| 手机精品福利在线观看| 亚洲成a人片| 极品私人尤物在线精品首页 | 国产www网站| 免费精品一区二区h| 婷婷伊人五月| 中文字幕天无码久久精品视频免费 | 97在线免费| 国产精品亚洲一区二区三区z | 尤物视频一区| 免费观看成人久久网免费观看| 国产精品丝袜视频| 成人免费视频一区| 亚洲国产成人久久精品软件| 亚洲经典在线中文字幕| 亚洲天堂网在线播放| 青青草原国产免费av观看| 91 九色视频丝袜| 国产精品亚洲综合久久小说| 91高清在线视频| 欧美成人免费一区在线播放| 中文字幕在线观看日本| 亚洲欧美自拍中文| 露脸一二三区国语对白| 亚洲动漫h| 老司机久久99久久精品播放| 91在线无码精品秘九色APP| 亚洲一区免费看| 国产精品午夜电影| 国产亚洲精品自在线| 中国一级特黄视频| 国产精品主播| 国产永久无码观看在线|