國電電力新疆新能源開發(fā)有限公司 孟憲梁 楊 志 黃文廣 華風數據(深圳)有限公司 袁昌國 饒 巍
魯東大學數學與統(tǒng)計科學學院 張中正 付恩強 劉廣臣
隨著全球能源不斷地消耗,且化石燃料所導致的環(huán)境問題日益突出,世界各國對清潔可再生能源的開發(fā)研究投入越來越大,其中利用太陽能,光伏發(fā)電的技術得到了迅猛發(fā)展,廣泛應用于各個領域,但太陽能光伏電站在長期運行過程中,會出現一些影響光伏組件安全運行的問題,如隱裂、EVA 黃變、熱斑等,其中熱斑效應對光伏組件性能影響最大[1],已成為危害最大、發(fā)生最頻繁的一類故障熱斑效應是造成光伏組件損壞的主要原因之一,提早發(fā)現光伏組件熱斑效應并及時解決,可有效減少損失[2]。
熱斑檢測一般使用電氣檢測和圖像分析2種模式進行檢測,電氣檢測是基于分析太陽能發(fā)電的電氣數據,通過對發(fā)電數據的波動分析出是否存在故障[3]。該方法需要線路接入和電路監(jiān)控,會增加光伏組件的額外成本。圖像分析通常對紅外圖像進行分析,運用圖像處理技術在紅外圖像中找到熱斑的位置。小規(guī)模的光伏組件熱斑檢測可使用便攜式紅外儀進行直接觀測,但大規(guī)模光伏發(fā)電站采用這種檢測方式效率低下,而利用人工智能技術能達到快速、便捷及高效的完成檢測[4]。
目前,光伏電站運維工作一般是先通過監(jiān)測光伏發(fā)電系統(tǒng)的輸出功率和輸出電壓粗略判斷運行故障,然后根據經驗對故障類型進行分類,再進行相應的處理。
但隨著光伏電站規(guī)模的不斷擴大,光伏系統(tǒng)的運行故障類型及頻次也在不斷上升,這不僅增加了光伏電站的運維工作量及工作難度,而且增加了運維成本。所以,傳統(tǒng)的運維模式顯然已經不再適用于當前的大規(guī)模光伏電站。
圍繞此問題,國內外都進行了相應研究。在分析Otsu 法和最大散度閾值法的基礎上,提出自適應最大散度閾值差法來進行紅外圖像識別[5]。基于邊緣檢測方式,使用Canny 邊緣檢測算子作為診斷模塊進行光伏板故障識別[6]。先對光伏電池片的各種運行狀態(tài)進行狀態(tài)分類編碼,然后通過可擴展脈沖神經網絡方法實現了對光伏熱斑的識別[7]。利用深度學習算法的CNN 對光伏板圖像進行自動識別判斷,找出有故障電池板的精確位置,以及確定故障的類型[8]。
在基于人工智能技術的光伏電站巡檢系統(tǒng)中,無人機遙感技術、地面數據分析站等技術雖然已經相對成熟,但是在后期數據的處理方面,尤其結合深度學習算法的應用方面,國內外的研究和應用都還較少,因此這是一個值得探究的領域。
本文采用基于多層卷積神經網絡的光伏組件紅外熱斑故障識別方法,解決由于特征數目過少,無法精確分類,即欠擬合問題或由于特征數目過多,導致在分類過程中過于注重某個特征導致分類錯誤,即過擬合的問題。通過深度學習算法對實時數據、無人機采集圖像等數據的綜合分析,快速、準確地進行故障定位及檢測,不僅可以做到故障早預防、早發(fā)現、早解決,避免電量損失及事故發(fā)生,還可以進行智能化的故障定位及識別,大幅度提高光伏電站的發(fā)電量,降低維修事故及成本。
分析時間跨度:某天上午8:00-14:00光伏板紅外錄像數據。
圖片采樣頻率:紅外視頻每12幀間隔采樣圖片數據。
圖片命名方式:具有熱斑的標記為1,其余標記為0。
為了使算法能夠在紅外圖像中更加準確的識別到熱斑和異物,我們采取了如下的操作:首先將訓練集和驗證集中的紅外圖片(如圖1所示)轉換成黑白兩色,以使圖片特征更加明顯。由于光斑和異物明顯的呈現黑白兩色,將其轉換成單通道的圖片并不影響識別過程。為了獲得更多的數據,我們將圖片隨機水平翻轉、隨機旋轉,并將數值歸一化至[0,1]。測試集不執(zhí)行數據增強工作。處理之后的圖片展示如圖2。

圖1 紅外狀態(tài)下的圖片數據

圖2 黑白轉換后的圖片數據
卷積神經網絡是一種人工神經網絡,其的結構可以分為3層。
2.1.1 卷積層——主要作用是提取特征
卷積層是CNN 的核心,卷積層由多個卷積核組成,每個卷積核和上一層特征圖的局部區(qū)域相連接,卷積核是一個權值矩陣,卷積核通過在上一層特征圖上不斷移動進行卷積運算,從而完成特征提取,卷積核移動的過程中,在同一層上其權值參數是共享的。卷積運算后,通過非線性激活函數的作用,增強網絡的表達能力。卷積層對應的計算公式如下所示:

式中:xlj 為經過卷積運算后第l 層第j 個神經元的輸出,xil-1是第l-1層第i 個神經元的輸出,*為卷積運算,為卷積核,blj 為偏置,f 為激活函數。

通過卷積層,網絡的特征圖通常變得更深,可以對輸入數據進行深層次分析,充分進行特征提取。網絡訓練時,為卷積核中權值和偏置設定初始值,訓練過程中不斷調整卷積核中權值和偏置,使網絡性能達到最優(yōu)。
2.1.2 池化層——主要作用是重采樣,卻不會損壞識別結果
池化層通常在卷積層之后,類似于卷積層,池化層和上一層特征圖的局部區(qū)域相連接,進行池化操作。常用的池化操作包括平均池化和最大池化,平均池化是對特征圖局部區(qū)域求取平均值,最大池化是對特征圖局部區(qū)域求最大值。和卷積層不同,池化層沒有權值等參數,只是一種運算規(guī)則,池化層不會改變上一層網絡特征圖的個數。池化層的計算公式如下所示:

式中:subsampling 表示池化函數
2.1.3 全連接層——主要作用是分類
全連接層位于CNN 的最后部分。經過卷積和池化操作后,特征圖平鋪為一維向量作為全連接層的輸入,其中每個神經元和下一層所有神經元全部連接。根據任務要求,設定合適的全連接層和輸出層神經元節(jié)點數,完成相應的分類或回歸任務。其計算公式如下所示[9]:

為了避免過擬合,全連接層通常要采用隨機失活(Dropout)技術,Dropout 是一種正則化技術,通過設置Dropout 值的大小,使得網絡中部分節(jié)點不參與CNN 的訓練過程,從而降低模型的復雜度,提高模型的適應能力。
CNN 能夠有效的將大數據量的圖片降維成小數據量,有效的保留圖片特征,符合圖片處理的原則圖像,解決了需要處理的數據量太大,導致成本很高,效率很低,圖像在數字化的過程中很難保留原有的特征,導致圖像處理的準確率不高等問題。通過獲得的數據,我們首先對其進行分類,將正常的光伏圖片標記為0,將不正常的圖片標記成1,對圖片進行灰度處理,對數據進行數據增強,將數據分為訓練集、驗證集和測試集,將處理過的數據放入到神經層進行訓練,首先對預處理后的數據進行卷積化操作,然后進行池化操作,這個過程中提取數據中重要的特征,拋棄對于學習累贅的特征,這個過程我們重復多次,提取特征中最重要的數據指標,然后將神經層中的數據進行全連接,通過全連接層輸出0,1這兩種類別。
本文利用無人機拍攝太陽能光伏板的遠紅外視頻,結合圖片處理和深度學習的方法,解決智能識別太陽能光伏板故障的問題。
我們先對數據進行采集,最終應用于樣本數據進行訓練的圖片一共有4100張,其中正常圖片1100張,故障圖片3000張,將圖片劃分成70%的訓練集,20%的驗證集以及10%的測試集。
后對采集數據進行預處理,將經過預處理理后的圖片劃分為訓練集和測試集,其中訓練集占70%,測試集占30%,隨后基于訓練集利用卷積神經網絡算法進行模型訓練,并將訓練得到的模型帶入測試集中進行評估驗證,最后利用經過評估驗證的模型進行熱斑紅外圖片的識別。
CNN 算法在光伏組件紅外熱斑故障識別中具有較大的優(yōu)越性,為了展示模型的效果,在同樣條件下建立多個其他模型與其進行對比,用與CNN 相同的70%的訓練集,20%的驗證集以及10%的測試集展示預測效果,綜合分析各個算法模型指標。數據顯示,CNN 算法在光伏組件紅外熱斑故障識別中能力顯著優(yōu)于其它算法,該算法預測的準確率高、時效性好、穩(wěn)健性強。綜合來看,我們選取CNN 算法模型。圖3展示了CNN、Resnet18和Resnet50等多種算法模型在訓練、驗證及上的準確率,圖4展示了各種算法的損失函數。評估各項評價指標對比結果后,針對bach_size 不同的取值如32或者64等參數的調優(yōu)將數據帶入模型中進行訓練。

圖3 不同模型Train Acc(A) 和Val Acc (B)對比圖

圖4 不同模型Val Acc_Loss 對比圖
通過訓練得到的數據,我們將迭代后穩(wěn)定下來的結果進行平均值處理,對比模型的優(yōu)劣。
我們從得到的結果可以看出CNN 算法總體上優(yōu)于Resnet18以及Resnet50算法,在計算耗時上,如表1的數據顯示CNN 算法耗時較短,具有更好的時效性,避免產生不必要的損失。在模型的準確率上,由上圖3和表1所示CNN 算法較其他兩種算法準確率高,圖4可知CNN 的loss 值最低且不斷地在降低,沒有到達局部最優(yōu)解。綜上所述,CNN 算法在光伏組件紅外熱斑故障識別中效果最優(yōu)。

表1 不同模型之間數據的對比
確定卷積神經網絡的超參數;對紅外圖片進行卷積池化操作,其中用BatchNorm2d 方法對卷積層處理過的紅外圖象數據進行歸一化操作,以免因數據過大而導致的網絡性能不穩(wěn)定,并且運用交叉熵損失函數和Adam 優(yōu)化器進行訓練,防止出現過擬合現象;對處理好的數據進行全連接操作;經過5次卷積完成對紅外圖片的特征提取。
對卷積神經網絡的多種超參數進行確定,以優(yōu)化模型的精度;通過卷積神經網絡對于圖像的訓練集和驗證集進行訓練,得到的模型帶入測試集,并驗證模型準確率;通過不同超參數下準確率的比較,選取準確率高的超參數;通過不同參數之間的比較,發(fā)現當批處理(batch)=64時模型的準確率會比較高并取預測結果穩(wěn)定下的平均值為0.938,達到預期的結果。
通過模型導出測試集的csv 文件進行構建混淆矩陣并計算其AUC[10]。即對所有正負樣本獲得一個score,然后對score 從大到小排序,令最大score 對應樣本的rank 為n,第二大score 對應樣本的rank 為n-1,以此類推。然后把所有的正類樣本的rank 相加,再減去所有正樣本和正樣本配對的情況(即排在它后面正例的個數)。得到的就是所有的樣本中有多少對正類樣本的score 大于負類樣本的score。然后再除以M×N,從而得到AUC 如下:

其中M 為正類樣本的數目,N 為負類樣本的數目,rank 的值表示能夠產生score 前大后小這樣的組合數。
計算所得混淆矩陣如表2所示:

表2 基于CNN 模型構建所得混淆矩陣
利用上述混淆矩陣,通過AUC 計算得到結果的準確率很高,幾乎完美的分出了想要得到的結果。
通過采用了上述技術方案,本發(fā)明可利用無人機拍攝太陽能光伏板的遠紅外視頻,利用深度學習中的卷積神經網絡算法,解決智能識別太陽能光伏板熱斑故障的問題。
本文利用無人機拍攝的太陽能光伏板遠紅外圖像,采用CNN、Resnet18和Resnet50多種主流深度學習方法建模,并進行對比分析,尋求模型的最優(yōu)體系。每種深度學習方法基于樣本數據進行調參,選出最優(yōu)的參數組合來擬合模型,達到局部最優(yōu)。采用無人機搭載紅外攝像機獲取一手的光伏板圖像數據,保證了訓練數據的高質量要求。并采用多種圖片處理方法,能夠有效的提取圖片特征,提高了模型的學習效率。可以對光伏板異物進行實時動態(tài)監(jiān)測,極大的減少了光伏板監(jiān)測和維護工作的復雜度。對可能存在異物遮擋的光伏板進行識別、定位,以便工作人員及時、準確的尋找到損壞的太陽能光伏板,并清理光伏板上的異物,從而提高光伏的發(fā)電效率。