林正文,宋思瑜,范鈞瑋,趙 薇,劉廣臣
1.魯東大學 數學與統計科學學院,山東 煙臺 264025
2.魯東大學 信息與電氣工程學院,山東 煙臺 264025
電力行業是國民經濟的重要支柱,面對化石燃料發電引起的環境污染問題,黨的二十大報告指出要深入推進能源革命,盡快實現向低碳、清潔的能源結構轉變。“十四五”是我國推進“碳達峰、碳中和”戰略的關鍵時期,國家及各省份相繼發布支持光伏發電的政策,助力構建以新能源為主體的新型電力系統[1]。新能源發電已成為全球共識,光伏市場將迎來更加廣闊的發展前景[2]。
光伏組件能否健康高效運行將直接影響企業效益,熱斑是光伏組件發生的最為頻繁的故障之一。熱斑是指光伏組件由于外部灰塵、樹葉和鳥糞等異物遮擋或者出現裂紋、短路等內部器件損壞導致部分電池片功能異常,進而消耗正常運行電池片所產生的能量而持續發熱的現象[3]。熱斑狀態的持續會嚴重影響光伏電池的發電效率,甚至會引發火災;此外,光伏場站的選址通常在偏遠地區或者是大型建筑頂部,周邊環境較為復雜,利用人工檢測排查不僅耗時費力,而且存在一定的安全隱患。
目前,光伏組件熱斑檢測方法可分為基于電氣輸出特性的檢測方法和基于紅外圖像的檢測方法兩類。基于電氣輸出特性的檢測方法,通過測量和比較正常運行與故障狀態下光伏組件電壓、電流、功率等電氣特性的差異來判斷其是否存在熱斑故障[4-5]。這一類檢測方法可以對故障狀態進行有效的判斷,但是較難實現故障電池片的定位工作,且實施過程通常需要搭建外部電路、部署傳感器等,導致在大型光電場站實施復雜、檢測成本較高。
隨著無人機技術的普及和深度學習領域的迅速發展,基于紅外圖像分析的熱斑檢測方法受到了更多關注。車曦[6]通過分離紅外圖像中的亮度信息,將熱斑導致光伏電池溫度遞增的現象重新編碼,并基于脈沖神經網絡實現對光伏組件運行狀態的準確判斷;Pierdicca等人[7]通過對數據集紅外圖像進行翻轉、旋轉等操作實現數據擴充,增強了VGG-16 網絡模型的魯棒性;王奇等人[8]利用灰度化、去噪、柵線過濾等圖像處理方法,提升了紅外圖像下熱斑檢測的精度;郭夢浩等人[9]從調整預設錨框尺寸、降低特征提取網絡深度方面,調整Faster R-CNN網絡結構以提升檢測精度;賈帥康等人[10]在殘差網絡中插入注意力模塊,有效地增強了熱斑紅外圖像的特征提取效果;Di Tommaso 等人[11]基于YOLOv3 實現對光伏電池正常、升溫、熱斑、極端熱斑四個階段的有效檢測。依據紅外圖像熱斑區域的特征差異,結合目標檢測技術實現對故障電池塊的精確定位,在降低故障檢測難度、提升企業發電效益等方面具有重要意義。
紅外圖像可以實現對現存熱斑的有效檢測,但是對于電池表面的小型異物遮擋情況辨別效果不佳,難以避免電池因受到持續的遮擋而引發的熱斑故障。圖1 為光伏組件相同區域下的紅外圖像與可見光圖像,藍色方框內為熱斑和小型異物遮擋的存在區域。圖像顯示:紅外圖像根據其成像原理,熱斑故障電池片由于溫度較高呈現高亮區域,與正常狀態的電池片特征差異明顯;但是圖像中目標輪廓模糊、細節丟失、圖像質量較差,難以觀察小型異物遮擋情況。可見光圖像視角更廣,圖像分辨率更高,保留了更多的例如色彩、輪廓、形狀等細節特征,更加適用于光伏組件表面存在的遮擋物檢測。兩種圖像在分辨率、色彩、紋理等特征上表現出顯著差距,不宜放置于同一數據集中進行檢測任務。合理利用可見光圖像數據及時檢測并清理電池片表面存在的遮擋物體,可以有效避免后續因受到持續遮擋而引起的熱斑,進而延長光伏電池的使用壽命并提高發電效率。

圖1 紅外與可見光對比圖像Fig.1 Contrast image of infrared and visible light
綜上所述,本文利用無人機搭載高清攝像機對光伏組件進行第一次巡檢,基于可見光視頻數據,建立遮擋小目標檢測模型,指導光伏電池表面異物清理工作以防止后續熱斑產生。在此基礎上,使用無人機搭載紅外熱成像攝像機進行第二次巡檢,建立熱斑故障檢測模型,指導故障電池的維修以及更換,具體檢測流程如圖2所示。目前,多種無人機具備攜帶高清攝像機和紅外熱成像攝像機的能力,可以獲取可見光和紅外光場景下光伏板表面狀態,實現上述過程。通過無人機兩次巡檢過程,實現對光伏熱斑更加全面的識別和處理,助力光伏企業健康發展。

圖2 檢測流程圖Fig.2 Detection flow chart
目標檢測是計算機視覺的關鍵分支之一,主要處理圖像中物體的識別和定位工作。目前,目標檢測技術已廣泛地應用于工業、農業、醫療等諸多行業[12-14]。You only look once(YOLO)系列目標檢測算法[15-17]將檢測問題簡化為回歸過程,其核心思想是將圖像作為網絡的輸入,進行網格劃分并生成錨框,結合損失函數,網絡最終輸出檢測框的位置、所屬類別和置信度信息,完成檢測任務。YOLO系列算法有效地降低了計算量、檢測速度快且滿足實時性要求,方便部署在無人機等資源有限的移動設備,具有很強的實用性。
經過算法多次迭代和更新,該算法的第五代版本(YOLOv5)更加輕量化、推理速度更快。6.1 版本的YOLOv5源碼中共包含n、s、m、l、x五種不同檢測性能的P5 系列模型;同時,為了提升高分辨率圖像的檢測效果,也提供了相應的P6 系列網絡模型:n6、s6、m6、l6、x6。通常,P5系列模型在分辨率接近640×640的圖像上表現出較好的檢測效果;對于圖像分辨率為1 280×1 280或更高的數據,P6系列模型具有更高的檢測精度。
以2.1節中s型號模型為例,帶有紅色邊框標注的模塊為YOLOv5s6相較于YOLOv5s增加的結構。P6系列模型結構更深,在主干網絡部分進行6 次特征下采樣,因此對高分辨率圖像可以表現出更佳的特征處理效果;同時P6 系列模型在預測端新增了一個檢測模塊,可以應用在目標尺寸變化較大的檢測任務。
YOLO 系列算法的實現需要遍歷圖像中的預設像素框,保留最佳像素框并進行微調。上述預設像素框稱為錨框。
YOLOv5 使用K-means 算法結合歐式距離,基于COCO 數據集[18](common objects in context,COCO),給出了目標檢測任務通用的錨框。COCO數據集(https://cocodataset.org)是由微軟公司出資標注的主要用于目標檢測、圖像分割等計算機視覺任務的公開數據集,共包含33萬張圖片以及80個目標類別。光伏組件表面存在的異物遮擋和熱斑區域均與上述錨框的尺寸之間存在較大差距,直接使用預設錨框進行光伏組件故障檢測將會影響模型性能;此外,K-means 算法中聚類中心的選擇具有很強的隨機性,距離度量使用歐氏距離容易受到預測框尺寸的影響。
基于以上分析,本文利用K-means++算法[19]結合交并比指標(intersection over union,IoU)對可見光數據集Data1、紅外光數據集Data2(見4.1 節)分別進行錨框設定,以此來改善聚類中心選取過程的隨機性;使用IoU建立距離度量指標可以避免標注框尺寸的影響,相較于歐氏距離更加科學有效。
本文錨框設定方案的具體步驟:
(1)隨機選取一個標注框作為聚類中心Center1。
(2)計算其他標注框與當前所有聚類中心的最短距離D(i),根據最短距離結果,計算每一個標注框被選為下一個聚類中心的概率p(i),依據概率選取下一個聚類中心。迭代該過程,直到選取了x個聚類中心。
(3)聚類中心確定后,計算各標注框與每個聚類中心的距離Distance(i,j),并將其分別歸屬于距離最近的聚類中心,在此基礎上,計算各聚類中心包含的所有標注框在各維度上的均值,將其更新為新的聚類中心。迭代該過程,直至達到迭代次數或者聚類中心不再改變,輸出x個聚類中心屬性。
上述過程中,最短距離D(i)、距離Distance(i,j)、概率p(i)的計算公式如下:
式(1)~(3)中,i∈[1,N],其中i代表標注框,N為數據集中標注框總數;j為聚類中心,取值范圍為[1,x];IoU(i,j)表示標注框i與聚類中心j的交并比。
YOLO系列網絡模型憑借優秀的檢測性能,在諸多領域均有良好表現,但是模型追求檢測效率的同時犧牲了部分精度,導致在進行小型目標檢測任務中容易出現召回率較低的問題[20-21]。目前,對于檢測任務中小目標的定義還沒有形成統一標準,現階段最為通用的界定方法是將分辨率小于32×32像素的目標定義為小目標[22]。
如圖3所示,高清攝像機拍攝的光伏組件表面圖像通常分辨率較高,且遮擋目標尺寸較小符合小目標判斷標準,因此本文遮擋物檢測應屬于小目標檢測任務。

圖3 光伏組件表面可見光圖像Fig.3 Visible light image of photovoltaic module surface
綜合考慮檢測精度、待檢測目標尺寸等因素,選擇YOLOv5s6 作為本研究的基礎模型;在此基礎上,在模型的主干網絡中嵌入坐標注意力機制(coordinate attention,CA)[23]以提高網絡對小型異物遮擋的檢測能力,使其更好地應用于光伏組件表面遮擋小目標檢測。坐標注意力[23]是一種將位置信息嵌入到通道中的輕量級注意力機制,可以有效增強網絡提取特征的表達效果,本文將建立的可見光背景遮擋小目標檢測模型命名CA-YOLOv5s6。
YOLOv5s6 由Input、Backbone、Neck、Head 四部分組成,模型的整體結構如圖4所示。網絡的輸入端對輸入圖像進行尺寸調整和數據增強處理;主干網絡利用多個Conv 模塊、C3 模塊和SPPF 模塊的組合完成特征提取任務;頸部網絡采用特征金字塔網絡(feature pyramid networks,FPN)[24]結合路徑聚合網絡(path aggregation network,PAN)[25]的結構,實現了低維特征和高維特征的融合,極大地豐富了特征的表達能力;預測端對頸部網絡輸出的四個不同尺寸的特征圖分別劃分網格,然后結合錨框機制生成預測框,通過設定置信度閾值和非極大值抑制算法(non-maximum suppression,NMS)對冗余的預測框信息進行剔除,最終完成目標檢測任務。

圖4 YOLOv5s6網絡結構Fig.4 Structure of YOLOv5s6
在計算機視覺領域,注意力機制可以對特征圖的各個位置賦予相應的權重,使得網絡模型更關注有效特征,增強特征的表達能力,諸多研究顯示添加注意力模塊可以提升神經網絡模型對小目標的檢測效果[26-28]。
坐標注意力(CA)通過將位置信息嵌入到通道注意力中,為移動網絡帶來性能提升。CA 的具體計算過程如圖5所示:

圖5 坐標注意力機制計算過程Fig.5 Calculation process of coordinate attention
(1)如式(4)、(5)所示,對于輸入的特征圖X(尺寸為C×H×W,C、H和W對應通道數、高度和寬度),分別使用大小為H×1 和1×W的池化核遍歷二維特征圖的兩個坐標方向,依次獲得各個通道的坐標特征圖。這種特征聚合方式可以在保存位置信息的同時建立長程特征依賴關系,上述計算過程可表示為:
(2)將獲得的特征圖y1、y2進行拼接,并依次進行卷積(通道數壓縮以降低計算量)和非線性函數激活,得到包含兩個方向特征編碼信息的特征圖Z(維度:,r為通道數縮減比率)。
式中,α表示非線性激活函數,f1代表卷積操作,Concat表示拼接操作。
(3)結合split 函數,以特征圖的通道維度方向將Z切分為z1(維度分別進行卷積操作(將通道數調整至與輸入特征圖的通道數C相同)、Sigmoid激活函數處理,最終獲得坐標注意力權重v1(維度:C×H×1)、v2(維度:C×1×W)。上述計算過程可表示為:
(4)如式(9)所示,使用坐標注意力權重對輸入特征圖進行加權,得到輸出P。
本文在C3模塊的最上方支路,卷積過程后嵌入CA權重計算,并將模塊命名為C3s,其結構如圖6(a)所示。通過結合卷積進行通道數縮減,上述CA嵌入方法避免了給模型帶來復雜計算量;同時結合后續特征圖的融合與拼接過程,有效地提高了特征的表達能力。

圖6 模塊及網絡結構Fig.6 Module and network structure
C3s模塊對輸入的特征圖進行劃分,分別進行卷積提取特征(經卷積后通道數縮減至原來的1/2)。CA 對所在支路的輸入賦予注意力權重并實現特征融合,以增強特征的表達效果。將兩支路結果拼接并將通道數擴充至與輸入一致后,輸出至下一網絡模塊。上述計算過程可表示為:
式(10)~(13)中,x、z表示模塊的輸入與輸出;k、l、y代表各中間變量;用來表示結構圖中不同卷積模塊,如代表最下方支路右側卷積模塊代表最上方支路左側卷積模塊;CA代表使用坐標注意力對特征圖進行權重調整;Add、Concat分別表示特征圖的相加、拼接操作。
通過對比多次實驗的檢測結果,本文將C3s模塊嵌入至YOLOv5s6主干網絡中的相應位置,建立遮擋小目標檢測模型CA-YOLOv5s6,其主干網絡結構如圖6(b)所示。小目標檢測任務難點在于小型目標包含的像素點較少,難以提取目標區域有效特征。在模型的主干網絡添加坐標注意力機制,可以在特征提取階段減少背景區域的無效特征的提取,增強目標區域位置信息特征的重要性;其次利用主干網絡中多個坐標注意力機制的嵌入,提高特征圖的上下文關聯程度,進一步實現關鍵特征的有效表達,提升模型對小目標的檢測性能。
在紅外場景下,可以根據溫度特性發現熱斑故障。如圖7 所示,相較于遮擋小目標檢測任務,紅外圖像中熱斑故障區域尺寸較大,且與周圍正常運行狀態電池片的特征差異明顯,特征信息更加充分,有效地降低了檢測難度。鑒于紅外熱斑的上述易識別性,紅外圖像熱斑檢測任務可不需要復雜的網絡結構進行特征采樣。根據上述紅外圖像熱斑檢測任務特點,本文選取更加輕量化的網絡YOLOv5n作為熱斑故障檢測模型。

圖7 光伏組件表面紅外圖像Fig.7 Infrared image of photovoltaic module surface
在YOLOv5 的6.1 版本中,YOLOv5n 是所有P5 系列模型里面深度和寬度最小的網絡,具有體積小、計算量小、檢測速度快的優勢,更加方便部署于計算資源有限的移動設備(如無人機)。YOLOv5n整體網絡結構如圖8 所示,網絡同樣由Input、Backbone、Neck、Head 組成,各部分的功能與YOLOv5s6 相同。不同之處在于YOLOv5n只進行5次特征下采樣,網絡層輸出特征圖的通道數更少,因此整體結構更加精簡,同時網絡在寬度上更窄,大幅度減少了模型參數和計算量。

圖8 YOLOv5n網絡結構Fig.8 Structure of YOLOv5n
如圖9(a)、(b)所示,本文利用無人機巡檢所得的可見光視頻數據(分辨率為3 840×2 160),每30 幀抽取一張圖片,并對重復、目標模糊圖像進行剔除,最終保留有效圖像1 343張存放于可見光數據集Data1;對于紅外光視頻數據(分辨率為640×512)同樣進行上述處理,共保留有效圖像1 006張存放于紅外光數據集Data2。

圖9 數據處理Fig.9 Dataprocessing
在此基礎上,借助標注軟件LabelImg(Tzutalin,2015),對數據集Data1、Data2分別標注光伏組件表面存在的異物遮擋和由內部元器件損壞造成的熱斑。其中,可見光場景下共標記異物遮擋5 601個;紅外光數據集中共標記熱斑區域1 340個。數據標注工作完成后,將各數據集中的圖像與標注文件按照對應關系以9∶1的比例隨機劃分訓練集和測試集,實驗數據的具體情況如表1所示。

表1 實驗數據Table 1 Experimental data
本文實驗環境配置如表2所示,YOLO系列模型訓練過程中參數的設置情況如下:迭代次數設置為200 epoch,學習率大小設置為0.001,動量大小設置為0.937,平均精度均值的IoU 閾值設置為0.5,邊界框損失函數選擇CIoU Loss,優化器選擇AdamW。

表2 實驗環境配置Table 2 Experimental environment configuration
本文使用查準率(precision)、查全率(recall)、平均精度(average precision,AP)、平均精度均值(mean average precision,mAP)、每秒檢測幀數(frames per second,FPS)、參數量(Parameters)作為模型檢測性能的評價指標。其中,查準率(precision)、查全率(precision)計算公式如下:
式(14)和(15)中,TP表示真實熱斑或異物遮擋樣例中被正確檢測出的數量;FN表示真實熱斑或異物遮擋樣例中未被正確檢測出的數量;FP表示背景區域被誤檢為熱斑或異物的數量。因此,查準率可以表示檢測的正確率,查全率則表示所有熱斑故障或異物遮擋樣例中被正確檢測出來的比例。
理論上,查準率和查全率越高越好,但實際中這兩個指標相互矛盾,為了綜合考慮查準率與查全率以衡量模型檢測性能,故引入平均精度(AP)和平均精度均值(mAP)兩項評價指標。其中,平均精度用來計算單個待檢測類別的平均精度,平均精度均值用來計算所有待檢測類別平均精度的平均值。
平均精度(AP)、平均精度均值(mAP)的具體計算公式如下所示:
式(16)、式(17)中,p(r)為查準率相對查全率的變化函數,N表示目標檢測任務中待檢測目標的類別數量。
每秒檢測幀數(FPS)即每秒可以處理多少張圖片,用來衡量網絡模型的檢測速度。
參數量(Parameters),即模型共含多少參數,用來衡量模型的內存占用情況及響應速度,參數量越小越利于模型在移動端的部署。
結合本文錨框設定方案,對于圖像分辨率640×640和1 280×1 280的光伏數據集(Data1與Data2)分別設置3 組共9 個錨框(適用于P5 系列模型)、4 組共12 個錨框(適用于P6 系列模型)。本次實驗過程中,輸入數據為數據集Data1、Data2 相應訓練集中所有標注框(標注框數量分別為5 021、1 209),迭代次數設置為1 000。
錨框設定結果如表3 所示(COCO 數據集對應YOLOv5 算法的預設錨框)。表3 中每組數字分別表示該錨框尺寸的寬度和高度;較小尺寸的錨框應用在包含低級特征的淺層特征圖以進行小型目標檢測,大尺寸錨框部署在帶有更多語義信息的深層特征圖上檢測大型目標。
錨框設定結果顯示,由于光伏圖像數據集與COCO數據集存在圖像分辨率、目標尺寸等屬性差異,導致錨框尺寸顯著不同;其中,數據集Data1圖像中異物遮擋區域包含的像素點普遍較少,中、淺層特征圖對應的錨框尺寸均小于32×32 像素,符合小目標的判斷標準,印證本文遮擋物檢測屬于小目標檢測任務。
選取數據集Data2的訓練集中所有標注框(共1 209個)作為該部分實驗數據(數據詳情見4.1節),并將迭代次數、聚類中心個數分別設置為1 000 和9,對本文方案的有效性進行測試驗證。圖10為上述標注框設定結果的可視化情況,圖中橫、縱坐標分別表示標注框歸一化后的寬和高,紅色菱形代表各聚類中心,不同顏色代表各標注框歸屬的類別。實驗結果顯示,本文的錨框設定方法可以有效改善隨機選取聚類中心對最終錨框尺寸的影響。

圖10 錨框設定效果對比Fig.10 Anchor frame setting effect comparison
基于數據集Data1,實驗選取YOLOv5s、YOLOv5s6,測試錨框設定方案對模型性能的影響。具體實驗結果如表4、圖11 所示,表4 中,YOLOv5s+和YOLOv5s6+代表以本文方案對相應模型進行錨框設定,圖11 為上述模型對相同目標的實際檢測效果。結果顯示,更換錨框設定方案前后模型各項精度指標基本持平,但在實際檢測效果中,本文方案可以有效提高結果的置信度得分,證明了其科學性。后續實驗中YOLO 系列模型均采用本文方案設定的錨框尺寸。

表4 錨框方案實驗結果Table 4 Experimental results of anchor frame scheme 單位:%

圖11 實際檢測效果Fig.11 Actual detection effect
基于數據集Data1,以YOLOv5s 和YOLOv5s6 作為基礎模型,進行坐標注意力不同嵌入方案的對比實驗,測試本文遮擋小目標檢測模型的有效性。
本文嘗試了三種不同的CA 嵌入方案:嵌入主干網絡(記作CA1)、嵌入頸部網絡(記作CA2)、嵌入主干網絡及頸部網絡(記作CA3)。實驗過程中,YOLOv5s 與YOLOv5s6 的輸入圖像分辨率分別設置為640×640、1 280×1 280。
實驗結果如表5 所示,YOLOv5s6 擁有更深層次的網絡結構,可以更好利用高分辨率圖像中小型目標的像素信息,在數據集Data1 上檢測精度更高:查全率達到84.48%,減少了部分遮擋小目標的漏檢情況;平均精度均值達到80.81%,相比YOLOv5s提高3.84個百分點。

表5 CA嵌入方案實驗結果Table 5 Experimental results of CA embedding scheme 單位:%
不同的CA 嵌入方案作用在兩種模型上存在差異。就YOLOv5s 而言,僅有在主干網絡嵌入坐標注意力能夠改善YOLOv5s 檢測效果,在頸部網絡嵌入坐標注意力甚至會造成檢測精度的降低。造成這種現象的原因可能是數據集Data1 中圖像分辨率過高,YOLOv5s 以640×640的輸入分辨率導致目標區域像素較少,造成了特征提取相對困難,難以保證提取特征的正確性,在此基礎上,在頸部網絡嵌入CA,進一步造成了特征“失真”。
將YOLOv5s6作為基礎模型時,三種嵌入方案均能明顯提高檢測精度。其中,在主干網絡嵌入坐標注意力的效果最佳,查準率、查全率、平均精度均值分別達到85.81%、84.48%、83.78%,相較于基礎版YOLOv5s6 分別提高0.84、1.55、2.97 個百分點;表明在主干網絡部分嵌入CA,可以最大程度地改善檢測過程中由于遮擋物體較小導致的漏檢、錯檢情況。
基于以上結論,本文建立的遮擋小目標檢測模型(CA-YOLOv5s6)將坐標注意力機制嵌入至YOLOv5s6的主干網絡部分(見2.2節)。
CA-YOLOv5s6與基礎版YOLOv5s6在訓練過程中的查準率、查全率及平均精度均值的曲線變化情況如圖12 所示。對于光伏組件表面存在的異物遮擋情況,CA-YOLOv5s6模型經200次迭代后平均精度均值明顯高于YOLOv5s6;同時,在150次迭代后CA-YOLOv5s6各項曲線變化更加平穩、波動幅度更小、魯棒性更強,進一步驗證了CA-YOLOv5s6遮擋小目標檢測模型的有效性。

圖12 變化曲線對比圖Fig.12 Comparison of change curves
為進一步討論CA-YOLOv5s6 的有效性,將其與主流目標檢測模型Faster RCNN[29]、SSD[30]、YOLOv3、YOLOv5s、YOLOv5s6進行對比實驗。上述模型在數據集Data1 的性能結果如表6 所示。實驗結果顯示:對于光伏組件表面存在的小型異物遮擋,CA-YOLOv5s6 的檢測精度最高,mAP達到了83.78%,相較于YOLOv5s6、YOLOv5s 分別提高2.97 和6.81 個百分點,有效地提升了檢測精度。在單階段檢測算法中,SSD 的mAP 為50.89%,與YOLO 系列算法相比精度較低。YOLOv5s6(輸入分辨率1 280×1 280)比YOLOv5s(輸入分辨率640×640)的mAP 提升了3.84 個百分點,可見更高的分辨率將有效改善遮擋小目標的檢測效果。

表6 主流算法對比Table 6 Comparison of indicators
對無人機巡檢回傳可見光視頻進行截取,利用截取圖像數據(分辨率為3 840×2 160)對模型的檢測速度進行比較測試。經實驗計算,在本文實驗環境下,YOLOv5s 表現出優異的檢測速度,FPS 達到68.03。除此之外,YOLOv5s6 與CA-YOLOv5s6 的FPS 實驗結果分別為59.17、39.37,模型結構的改變在一定程度上降低了網絡的推理速度,但是仍然滿足在計算資源有限的移動設備上進行實時檢測的要求,驗證了CA-YOLOv5s6的可行性。在參數量方面,除兩階段檢測算法Faster RCNN模型參數量較大之外,其余模型均在7×107以內,同時,CA-YOLOv5s6 憑借CA 的嵌入Parameters 比YOLOv5s6減少了4.8×105。
圖13中展示了不同場景下光伏組件表面遮擋物體的實際檢測效果,圖像截取于測試視頻數據;左、右兩列圖像分別對應YOLOv5s6、CA-YOLOv5s6 的檢測結果。由于圖像分辨率較高,為方便展示檢測效果,對圖中紫色矩形框區域進行放大處理,并用黃色方框及箭頭對差異結果進行標注。結果顯示:CA-YOLOv5s6 可以有效善YOLOv5s6存在不同程度的漏檢情況,實現可見光背景下小型異物遮擋的精確檢測,檢測性能更高。

圖13 遮擋小目標檢測效果Fig.13 Occlusion small target detection effect
圖14 為YOLOv5n 訓練過程中查準率、查全率、平均精度均值可視化情況(數據集Data2)。紅外圖像熱斑故障特征較為明顯,模型收斂速度較快,并在50次迭代后趨于平穩,各項指標均接近1,檢測精度較高。

圖14 曲線變化Fig.14 Curve change
實驗選擇Faster RCNN、SSD、YOLOv3、YOLOv5s、YOLOv5n 目標檢測算法在數據集Data2 上進行對比實驗,實驗結果如表7 所示。結果顯示:各算法在熱斑檢測任務中均表現出較好的檢測精度,mAP指標均在99%附近。Faster RCNN檢測精度最高,mAP結果為99.89%,不過模型的參數量很大,且檢測速度比較慢,FPS 為9.35。YOLOv5n 的mAP 值為99.31%,雖然檢測精度相較于Faster RCNN、SSD、YOLOv5s略低一些,不過模型在檢測速度與參數量方面表現出巨大的優勢,YOLOv5n的Parameters 僅1.76×106,且FPS 達到了83.3,表現出極佳的性能,大幅度節省了無人機等移動設備的存儲及計算資源。通過各項指標的綜合對比,將YOLOv5n 作為紅外圖像熱斑檢測模型。

表7 性能比較Table 7 Performance comparison
光伏組件由于受到陽光反射的影響,部分區域會呈現出亮度較高現象,模型容易將其誤判為熱斑故障。YOLOv5n 對紅外圖像數據的熱斑檢測效果如圖15 所示,借助錨框機制YOLOv5n 可以很好地利用陽光反射區域與熱斑在尺寸、形狀上的差異,精確識別無人機巡檢拍攝的紅外圖像數據中存在的熱斑故障,有效避免因陽光反射造成的模型錯誤判別。

圖15 熱斑檢測效果Fig.15 Heat spot detection effect
基于YOLOv5 系列模型,開展光伏組件表面熱斑以及異物遮擋問題的研究,以實現光伏熱斑更加全面的處理。
首先,結合K-means++算法與IoU 指標調整了YOLOv5算法的錨框設定方案,根據可見光與紅外光圖像特點進行錨框設定,并通過實驗驗證了該設定方案的有效性。
其次,針對光伏組件可見光視頻數據中遮擋物體較小的問題,以YOLOv5s6 作為基礎模型,在主干網絡部分嵌入坐標注意力,設計了遮擋小目標檢測模型(CA-YOLOv5s6)。實驗結果顯示,相較于YOLOv5s6,CA-YOLOv5s6的mAP提高2.97個百分點,Parameters減少4.8×105,針對遮擋小目標表現出更高的檢測性能。
最后,選擇主流目標檢測算法基于光伏組件紅外光數據進行對比實驗,結果顯示,YOLOv5n 模型的mAP、FPS、Parameters 分別為93.31%、83.3、1.76×106。相較于其他算法,YOLOv5n在保證檢測精度同時,具有更強的部署便利性,更加契合紅外圖像熱斑檢測任務。