摘要:停泊飛機目標檢測對機場交通管控、重點軍事基地部署掌握、監控敵方實時軍事動態等軍民領域均具有重要意義。飛機目標檢測需要綜合考量檢測精度與檢測速度兩個方面,本文將YOLOv5骨干網絡中的C3模塊和部分卷積模塊替換成Ghost"Bottleneck,從而將Ghostnet引入YOLOv5s網絡中,取得很好的檢測效果。在檢測精度上,mAP0.5達到了95.34%,mAP0.5-0.95達到了61.6%,網絡的精度達到了96.89%,召回率達到了91.42%。在檢測速度上,網絡的FPS達到了66.67。
關鍵詞:光學飛機目標檢測;卷積神經網絡;YOLOv5;Ghostnet
中圖分類號:TB"文獻標識碼:Adoi:10.19311/j.cnki.16723198.2025.01.082
0"引言
信息主導權是影響現代戰爭局勢走向的重要因素。面對海量的成像偵察數據,自動化的目標識別將大大提升獲取信息的速度和質量。停泊飛機目標檢測對機場交通管控、重點軍事基地部署等軍民領域具有重要意義,因此,開展基于遙感圖像的飛機檢測方法研究意義深遠。
如何在復雜環境下快速、準確地檢測飛機目標點,是圖像檢測的熱點與難點。目前,主要存在以下問題:(1)光學遙感飛機數據集數量少且獲取難度大。(2)飛機目標大小不一,形態各異。(3)在分辨率較高的情況下,需要考慮的干擾因素較多。
本文利用YOLOv5網絡實現光學駐停飛機目標檢測,并能以優秀的精度和較快的推理速度完成檢測任務。將Ghostnet引入YOLOv5網絡并進行全新訓練,在保證模型精度的情況下大大提升了模型的檢測速度,最終能夠出色地完成光學駐停飛機目標檢測任務。
1"Ghost-YOLOv5
1.1"Ghostnet
Ghostnet是由華為諾亞方舟實驗室于2020年提出的輕量級CNN,其目的是便于在有限的硬件資源、移動設備上部署神經網絡。網絡的速度與精度是一對矛盾的性能指標,Ghostnet最突出的亮點就是換取模型輕量化的同時,犧牲的精度變得更少了,這種改變不會對原始輸出特征圖的尺寸造成任何影響,這使Ghostnet可以與任意卷積神經網絡相結合
1.2"將Ghostnet引入YOLOv5
Ghostnet是一種分類網絡,而YOLOv5是一種檢測網絡。分類網絡是檢測網絡的基礎,在檢測網絡中通常包含著一個分類網絡,該分類網絡就是Backbone,要將Ghostnet引入YOLOv5,就需要將原有的Backbone(CSPDarknet)替換掉。Ghostnet主要由一系列Ghost"Bottleneck堆疊而成,Ghost"Bottleneck的作用與YOLOv5中BottleneckCSP的作用一樣,結構類似,在新版的YOLOv5中,作者將BottleneckCSP模塊替換成了更先進的C3模塊。因此將YOLOv5中的部分C3模塊與卷積模塊替換成Ghost"Bottleneck即可將CSPDarkne替換為Ghostnet。將Ghostnet引入YOLOv5后,對應的網絡結構如圖1(a)所示。
在圖像輸入Ghost-YOLOv5后,經過圖像預處理、特征提取、預測框解碼與篩選等一系列流程后,最終得到預測結果,其算法流程圖如圖1(b)所示。將Ghostnet引入YOLOv5網絡后,在特征提取階段會變得更加簡單高效。
2"實驗與分析
2.1"數據集介紹
由于互聯網上現有光學飛機數據集數量太少,難以滿足神經網絡訓練的大樣本要求,所以本文整合了RSOD、NWPU"VHR-10中的飛機部分以及美俄飛機標注第一版,通過標簽文件批量格式轉換、信息批量修改等操作,構建出本文需要的光學飛機數據集。本文構建的數據集中,有446張圖片來自RSOD,80張圖片來自NWPU"VHR-10,2556張圖片來自美俄飛機標注第一版,共計3082張圖片,本文數據集基本情況如表1所示。
2.2"訓練Ghost-YOLOv5網絡
為保證單一變量,Ghost-YOLOv5"網絡的訓練超參數與"YOLOv5"保持一致,但是考慮到訓練"YOLOv5"時使用了預訓練權重,先將Ghost-YOLOv5網絡訓練"60個Epoch,觀察網絡是否收斂,若趨近收斂則停止訓練,否則繼續訓練"20"個"Epoch"再做觀察。
當網絡訓練到"60"個"Epoch"時,對應的訓練損失曲線如圖2所示。
由圖可知,網絡的訓練損失逐漸下降并趨于平穩,再來觀察網絡在驗證集上的損失變化,Ghost-YOLOv5"的驗證損失如圖3所示。
由圖可知,網絡的驗證損失也逐漸下降并趨于平穩,未出現過擬合現象,這說明Ghost-YOLOv5在從頭訓練的情況下依然能夠較快地趨于收斂,為了增強說服力,本文在Ghost-YOLOv5訓練至60代后不再繼續訓練。
接下來觀察Ghost-YOLOv5此時在驗證集上的性能表現,Ghost-YOLOv5的mAP0.5和mAP0.5-0.95變化曲線,精度(Precision)和(Recall)曲線如圖4所示。
最終網絡在驗證集上mAP0.5達到了95.34%,mAP0.5-0.95達到了61.6%,網絡的精度達到了96.89%,召回率達到了91.42%,與"YOLOv5"相比,Ghost-"YOLOv5模型大幅輕量化,精度指標只出現了輕微的下降。
2.3"使用Ghost-YOLOv5進行推理
同樣地,在訓練結束后,對訓練好的Ghost-YOLOv5進行推理,觀察其在陌生飛機圖片上的表現,Ghost-YOLOv5檢測相同文件夾下的圖片耗時情況如圖6所示。
由圖可知,Ghost-YOLOv5"每檢測一張圖片需要花費0.014s"左右的時間,相比于YOLOv5,Ghost-YOLOv5的檢測速度提高了3倍以上。
取檢測圖片中飛機數量最多的一張,觀察Ghost-YOLOv5"在飛機目標密集分布情況下實際檢測的表現,如圖7所示。從圖中可知,Ghost-YOLOv5具備優秀的多尺度檢測能力,而YOLOv5中出現的誤檢情況,Ghost-YOLOv5沒有出現。Ghost-YOLOv5模型在輕量化的改進上無疑是成功的。
2.4"與其他監測網絡的對比實驗
為了驗證"Ghost-YOLOv5"性能的優越性,本文在相同條件下對另一種單階段經典網絡"SSD(Single"Shot"MultiBox"Detector),目標監測的新秀SwinTransformer-YOLOv5以及"Convnext-YOLOv5進行訓練和推理,在本文中,上述的3種網絡均采用遷移學習,凍結訓練的策略。在訓練過程中,發現SSD網絡收斂較慢,訓練至80代趨于收斂,因此在該實驗中3種網絡均訓練至80代后停止,將本文使用到的所有網絡進行綜合對比,如表1所示。
通過對比不難看出,Ghost-YOLOv5相比于原始的YOLOv5以輕微的精度下降為代價,換取了顯著的輕量化效果,在改進前,YOLOv5s的參數量為7053910,模型計算量為"16.3"GFLOPs,引入Ghostnet后,網絡的參數量下降至5471170,降低了22.44%。模型計算量下降至8.2"GFLOPs,降低了49.7%,便于后續模型在嵌入式設備上的部署。而相對其他網絡,Ghost-YOLOv5s的精度更高,速度更快,在各方面的表現都很優秀。
3"結論
本文通過整理多個光學數據集中的飛機部分,構建出滿足實驗需求的數據集。將Ghostnet引入YOLOv5網絡,對新模型進行訓練測試,在模型評估方法上主要采用Precision、"Recall、mAP0.5、mAP0.5-0.95以及FPS來綜合評估模型性能,通過與不同模型的性能表現進行對比,Ghost-YOLOv5相比于YOLOv5,以輕微的精度下降為代價換取了推理速度3倍以上的提升,與其他網絡比較,其精度更高,速度更快,能夠出色地完成光學駐停飛機目標檢測任務。
參考文獻
[1]楊一丁.光學遙感圖像復雜機場背景下的飛機檢測算法研究[D].北京理工大學,2018.
[2]王文勝.寬幅光學遙感圖像艦船飛機目標檢測識別技術研究[D].中國科學院大學,2018.
[3]Uijlings"J"R,Van"De"Sande"K"E,Gevers"T,et"al.Selective"search"for"object"recognition[J].International"Journal"of"Computer"Vision,2013,104(2):154171.
[4]Ding"P,Zhang"Y,Deng"WJ,et"al.A"light"and"faster"regional"convolutional"neural"network"for"object"detection"in"optical"remote"sensing"images[J].ISPRS"Journal"of"Photogrammetry"and"Remote"Sensing,2018,141:208218.
[5]Redmon"J,Divvala"S,Girshick"R,et"al.You"only"look"once:Unified,realtime"object"detection[C].Proceedings"of"the"IEEE"Conference"on"Computer"Vision"and"Pattern"Recognition,2016:779788.
[6]Liu"W,Anguelov"D,Erhan"D,et"al.Ssd:Single"shot"multibox"detector[C].European"Conference"on"Computer"Vision.Springer,Cham,2016:21"37.
[7]李翰夫.光學遙感圖像停泊飛機目標檢測方法研究[D].哈爾濱工業大學,2021.
[8]Han"K,Wang"Y,Tian"Q,et"al.Ghostnet:More"features"from"cheap"operations[C].Proceedings"of"the"IEEE/CVF"conference"on"computer"vision"and"pattern"recognition,2020:15801589.