鐘泳松,徐凌樺,周 克
(貴州大學電氣工程學院,貴陽550025)
近年來光伏行業快速發展,其中集中式光伏電站裝機容量逐年提高,分布式光伏系統也發展迅猛,將近占據全球光伏增量的一半。然而巨大的增量也帶來了新的挑戰,光伏運維問題隨之產生。大型集中式光伏電站多處于地形復雜的山地且規模較大,分布式光伏也分布稀疏,為光伏巡檢帶來諸多困難。利用體積小飛行靈活的無人機搭配高質量相機進行圖像采集,后期分析所采集的圖像即可對光伏組件的情況做出初步診斷。光伏組件圖像數據巨大,利用機器代替人工無疑是更好的選擇,還可進一步避免人為認知因素的影響,提高診斷效率[1]。隨著硬件性能和深度學習算法不斷提升,深度學習被廣泛運用于目標檢測和故障診斷中,它與神經網絡技術一同都是對人腦機制的仿生學模擬。通過對神經元建模和搭建神經網絡,再通過巨量相關圖像數據的訓練,逐級提取故障特征,學習和固定模型參數,構建能夠識別某種種類的神經網絡模型,從而應用于目標檢測和故障診斷領域[2]。
在光伏板識別的基礎算法網絡結構中嵌入注意力模塊,通過調試和優化模塊位置,可構建出改進的SSD目標檢測算法。本研究嘗試運用擴充樣本以及遷移學習的方法,訓練和迭代改進SSD算法參數,最終通過與訓練集互斥的大量光伏板圖像數據樣本測試,驗證該算法的精度和速度。
SSD(Single Shot MultiBox Detector)是劉偉等人在ECCV 2016上發表的一種的目標檢測算法。對于輸入圖像大小300×300的版本在VOC2007數據集上達到了72.1%mAP的準確率且檢測速度達到58 FPS(Faster RCNN:73.2%mAP,7FPS;YOLOv1:63.4%mAP,45f/s)。SSD算法主要由兩部分構成,前半部分為圖像分類網絡(VGG-16、ResNet等),主要負責對應尺度圖像特征提取;后半部分為卷積層,輔助完成對圖像更深層次和抽象特征的提取。具體結構為以VGG-16為網絡骨干,再將原本網絡結構中最后兩層全連接層替換為卷積層,移除Dropout,同時添加四個卷積層提取額外的更深的特征,構成SSD網絡結構。
輸入一張300×300的圖片,經過特征提取網絡不斷卷積和池化壓縮為150×150、75×75等網格,分別 提 取 圖 中conv4_3、conv7、conv8、conv9、conv10、conv11的結果作為特征層,得到不同大小的特征圖,用以檢測不同大小的物體,以此提升目標檢測網絡的準確度。對這些特征圖進行邊框預測和分類對比,經過標注后,標準原始邊框圖像數據可獲得分類損失及定位損失,通過非極大抑制算法去除冗余項得到最終輸出。
計算機視覺中的注意力機制的主旨是讓計算機和系統能夠像人類一樣擁有注意力,即能夠忽略無關信息,而關注重點信息。ECA[3]是一種有效的通道關注模塊,是對SENet[4](Squeeze-and-Excitation)的改進。為減少SENet的網絡參數數量,使網絡更加輕簡,在網絡學習中增加了一步先降維后升維的操作,然而經過降維再升維之后,最后輸出維度雖不變,過程中有些關鍵信息卻損失掉了。文獻[3]經過大量實驗表明在使用通道注意力時避免降維和適當跨信道交互可在保持網絡性能基礎上降低模型復雜度,因此ECA可通過一維卷積在不降維的基礎上通過跨信道交互降低模型參數而保證優良的性能和較低的模型復雜度度,它依靠一維卷積不降維局部跨信道交互策略和自適應選擇一維卷積核大小的方法來確定局部跨信道交互的覆蓋率。
ECA模塊可以通過卷積核大小為k的一維卷積來實現通道之間的信息交互,如下式:

式中C1Dk表示只涉及k個參數信息的一維卷積。可以看出ECA模塊模型復雜度相對較低的同時還保留了模型效率和性能,也能發現k決定了交互通道覆蓋范圍,其取值與通道C有關。k和通道C的最優映射關系無法直接求得,只知k和C成非線性比例,因此用參數話指數函數可以寫作:

整理公式(2)可以得出k和C的映射關系如下:

至此,k的最優解可以由公式(3)算出,其中|·|odd為選擇最近奇數,r=2,b=1。
改進SSD算法模型如圖1所示。

圖1 嵌入ECA模塊的改進SSD網絡結構
改進的方法是在conv3、conv4之間,以及conv7、conv8、conv9、conv10、conv11之間加入ECA模塊。在前向網絡訓練過程中,添加ECA模塊會增加光伏板位置所占比例,因此更大程度發揮了各個通道的作用,相較于其他注意力機制只引入少量的參數,改進方法提升了光伏板特征提取效率,并且在之后的回歸定位步驟中提高了誤差的計算精確度。
在訓練深度網絡時往往需要大量訓練數據,為避免因缺乏足夠的樣本數據造成網絡欠擬合,在此引入遷移學習的策略來彌補訓練樣本的不足。遷移學習是把已訓練好的模型(預訓練模型)參數遷移到新的模型來幫助新模型訓練[5],大部分數據或者任務都存在相關性。通過遷移學習,可將已經學習到的模型參數通過某種方式分享給改進后的模型,以改善模型學習效率[6-7]。
選擇與光伏板檢測數據集任務領域具有相似性的車輛、桌子作為原始訓練資源[8],對特征提取網絡進行預訓練。在所得的模型基礎上用準備好的光伏板圖像數據對模型參數進行精調。完成預訓練之后,凍結前半部分網格層參數,再利用準備的光伏板圖像數據集對模型進行精調,使特征提取網絡后半部分的權重隨著網絡訓練的迭代同步更新。
實驗使用的開發平臺為Windows10,平臺具體配置由表1列出。實驗現場的實物擺放情況如圖2所示。

表1 實驗平臺參數

圖2 實驗現場實物布置
為了能讓神經網絡提取足夠多的樣本特征,需要對現有樣本進行擴充。實驗采用方式為以相同比例對樣本進行亮度、對比度增強和旋轉平移等。算法網絡運用Pascalvoc2007權重數據集,選取300張完好狀態光伏組件圖像、300張積灰狀態圖像、300張碎裂狀態圖像、300張發黃狀態圖像,當完整度大于80%時才做標記。完整光伏板標記為“wu”;碎裂光伏板標記為“broke”;發黃光伏板標記為“yellow”,積灰光伏板標記為“dust”。按照9:1比例劃分訓練集和數據集.使用軟件Labelimg對數據集進行標注。
為避免算法本身采集到背景樣本(負樣本)遠大于其他樣本數量使模型本身精確度降低,正樣本對負樣本(背景樣本)的比例為1:3。
實驗得到引入遷移學習模型前后的損失率,結果曲線如圖3所示。從圖中可以看出使用遷移學習后模型損失率下降更快,可用更少的數據集達到良好的訓練結果,訓練速度也提升了,整體效果較為理想,證明遷移學習對本模型有性能上的提高。

圖3 使用遷移學習前后的損失率變化
實驗對比了主流目標檢測算法Faster-RCNN、YoLo3、VGG16-SSD與改進算法在該數據集的光伏缺陷檢測性能的差異,實驗結果如表2所示。

表2 不同算法性能對比
可見,改進的光伏板檢測算法雖然在檢測速度并沒有達到最高,但在精確率和召回率上有了很大提升,尤其精確率也是幾種算法中最高的。對于光伏板缺陷檢測來說,如此的檢測速度在可接受范圍內,精度也達到了預期。
全面無人機巡檢將是未來智能光伏電站發展的必然趨勢,運用高精度高速度人工智能代替人工巡檢和人工判斷缺陷類型,將大大提升巡檢效率和準確率,減少人員配比,降低勞動強度和企業成本。改進的SSD神經網絡算法可以用于光伏板缺陷檢測,通過在原網絡上嵌入注意力模塊和并運用遷移學習策略,模型的檢測精度有了有效的提升,檢測速度也加快了。改進算法已在實際應用中嵌入到無人機終端中,有效提升了無人機巡檢效率。