曹鵬晉
(浙江大唐國際江山新城熱電有限責任公司,浙江 江山 324100)
太陽能光伏發電是目前最流行的綠色發電方式之一,而光伏逆變器是光伏發電系統的重要環節,一旦其發生故障則嚴重影響光伏發電系統的安全穩定運行,因此準確地診斷逆變器的故障十分重要。
從20 世紀開始,國內外相關學者就光伏逆變器故障診斷展開廣泛研究。傳統的光伏逆變器的故障診斷方法主要是根據三相電流判斷逆變器開關電源故障,該方法需要人為設定閾值。隨著人工智能、大數據技術的不斷發展,基于機器學習的故障診斷技術被應用到電氣設備的故障診斷中。機器學習是一種數據驅動型模式識別方法,可以直接從數據中提取內部關系,利用數據集構建統計模型從而對數據進行預測和分析,提高系統的性能。文獻[1]提出了基于隱馬爾可夫模型的光伏逆變器故障診斷方法,對于非線性系統該方法仍然適用。文獻[2]將卷積神經網絡應用到光伏逆變器的故障診斷中,并在不同白噪聲水平的條件下進行測試。文獻[3]提出了一種基于稀疏貝葉斯極限學習機的光伏逆變器診斷方法,該方法從運維數據中提出特征并進行模型訓練,實現了光伏逆變器故障的準確診斷。為了進一步提升逆變器故障診斷的速度,本文提出了基于PCA-CNN的光伏逆變器故障診斷方法。
主成分分析是一種多元統計的分析方法,在數據降維、信號處理、模式識別等領域有著廣泛地應用。在保證計算精度的前提下,使用主成分分析法可以明顯降低計算成本,剔除冗余,提取出數據中的主要特征[4]。設樣本集X={x1,x2,… xN},xi為第i 個特征向量。基于最大可分原理,樣本點xi 在新空間中超平面的投影為UTxi,其中U 為投影矩陣。投影點后樣本點xi的方差為UTxixiTU,若所有的樣本點投影盡可能分開,則應該使投影后樣本點的方差最大化[4],因此優化目標可以表述成:

式中XXT是散度矩陣;I 是n 階單位矩陣。
對式(1)使用拉格朗日乘子法可得:

式中λ 是散度矩陣。
為了獲取投影后樣本點的最大方差需要對散度矩陣進行特征值分解,并將求得的特征值進行排序:λ1≥λ2≥…≥λk,其中最大的特征值λ1對應著第一個主要成分,以此類推我們可以獲得第二個主要成分、第三個主要成分等[5]。主元個數k 可以由累計方差貢獻率法獲得,第i 主成分的貢獻率Qi和前m 個主分量的累計貢獻Qcv分別定義為:

為了獲取足夠量的原始數據信息,在確定主元個數時一般要求累計貢獻率的值大于85%[5]。
卷積神經網絡的結構圖如圖1 所示,其中卷積層用于卷積運算并提取輸入數據的不同類型特征,再經過池化層降低數據大小,然后接全連接層分類或者回歸任務。

圖1 卷積神經網絡示意圖
2.2.1 卷積層
卷積層是利用不同大小的卷積核與卷積核參數對輸入進行卷積操作,不同大小的卷積核獲取到的輸入特征的感受野不同,不同的卷積核參數可以獲取到不同類別的特征信息。卷積層的計算公式為:

2.2.2 池化層
池化層一般連接在卷積層的后面,用于對當前輸入的下采樣,可以用于壓縮數據規模并減小過擬合現象。池化層根據不同的計算方式可以劃分成最大池化層、平均池化層等。池化層的計算公式為:

2.2.3 全連接層
全連接層可以將學習到的特征表示映射到樣本標記空間中,用于分類或者回歸問題。如果是分類任務,可以選擇sigmoid 函數作為全連接層的最后一層的激活函數;如果是回歸問題,可以選擇Relu、Linear 等作為最后一層的激活函數。全連接層的數學表達式為:

本論文涉及到的數據來源于2019-2020 年大唐國際江山新城熱電有限責任公司廠內光伏電站的運維數據,廠內共包含19個光伏發電組。本次主要選取三相光伏逆變器每一相的直流輸入電壓、直流輸入電流、交流輸出電壓、交流輸出電流、電網阻抗、無功功率、功率因數等信息作為逆變器故障診斷的初始特征,獲取的實驗數據類型如表1 所示。本文主要針對深圳晶源福品牌的逆變器的故障數據進行了實驗,該品牌逆變器共產生了直流過壓、直流欠壓等8 類故障。

表1 逆變器數據表及故障類型
本文設計了基于PCA-CNN 光伏電站設備故障診斷模型,采用主成分分析可以利用降維后的主成分表征高維的原始數據,降低訓練復雜度和計算成本,本文提取了4 個主成分分量,其累計貢獻率為95.6%,說明選取的主分量能夠替代原始信息,因此模型輸入的維度為4×100,選取批量(batch)設置成128。卷積神經網絡不僅能用于提取特征并進行故障診斷,而且該網絡可以實現并行化計算,進一步提高了故障診斷效率,本文設計的卷積神經網絡共包含5 個卷積模塊,前三個卷積模塊為二維卷積,后兩個卷積模塊為一維卷積,在卷積層最后是一個全局最大池化層,最后壓縮矩陣維度變為一維矩陣,輸出利用卷積網絡提取出的深層特征。相關參數如表2 所示。

表2 卷積層參數
本文用于訓練模型的CPU型號是i5-9400F,內存大小是16G,GPU型號是RTX2060-6G。圖2 為模型訓練和驗證損失值隨迭代次數epoch的變化情況。當模型迭代步數為150 左右,損失基本收斂,此時的故障識別準確率為96.8%,基本符合預期要求。

圖2 損失值與epoch 關系曲線
本文從大唐國際江山新城熱電有限責任公司廠內光伏電站運維數據入手,針對于光伏設備在實際運營中出現的故障進行研究,構建了基于主成分分析(PCA)和卷積神經網絡(CNN)組合式故障診斷方法,實驗結果表明:本文所提出的方法可以有效地檢測出光伏變電站的故障。