戴森柏,陳志聰,吳麗君,林培杰,程樹(shù)英
(福州大學(xué)物理與信息工程學(xué)院,微納器件與太陽(yáng)能電池研究所,福建 福州 350108)
隨著光伏產(chǎn)業(yè)的快速發(fā)展和光伏裝機(jī)容量的快速增長(zhǎng),光伏陣列的使用壽命和安全性受到越來(lái)越多的關(guān)注[1-4].光伏陣列常見(jiàn)的故障類型可分為短路故障、開(kāi)路故障、老化故障、陰影故障和電弧故障等[5-6].近年來(lái)提出的光伏陣列故障診斷方法主要分為基于紅外/熱成像[7]、基于信號(hào)分析[8-9]、基于數(shù)學(xué)模型[10-11]以及基于人工智能的故障診斷技術(shù)[12-13].基于人工智能的光伏陣列故障診斷方法包括支持向量機(jī)[14]、極限學(xué)習(xí)機(jī)[15]、決策樹(shù)[16]、神經(jīng)網(wǎng)絡(luò)[17]等.其中基于神經(jīng)網(wǎng)絡(luò)的方法憑借其效率高、準(zhǔn)確率高、人力成本低的優(yōu)勢(shì)倍受關(guān)注.文獻(xiàn)[18]提出一種BP神經(jīng)網(wǎng)絡(luò)算法進(jìn)行故障識(shí)別和分類,但仍然存在局部最優(yōu)的問(wèn)題.文獻(xiàn)[19]提出一種小波神經(jīng)網(wǎng)絡(luò),提高了故障診斷的精度.文獻(xiàn)[20]提出一種概率神經(jīng)網(wǎng)絡(luò),在面對(duì)有噪聲的直流異常時(shí)仍有較高的診斷率,但是無(wú)法檢測(cè)一個(gè)模塊的短路.
這些傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)算法主要依賴手工提取的特征,對(duì)有干擾的噪聲數(shù)據(jù)較敏感,泛化能力和魯棒性較差.文獻(xiàn)[21]提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的故障診斷算法,采用故障發(fā)生的瞬態(tài)時(shí)間序列作為特征,該方法能夠從原始的電壓和電流的時(shí)序圖中自動(dòng)提取關(guān)鍵特征.文獻(xiàn)[22]提出一種深度殘差網(wǎng)絡(luò),自動(dòng)地從I-V曲線中提取特征,訓(xùn)練出好的診斷模型.雖然這些網(wǎng)絡(luò)都可以自動(dòng)提取特征,但是無(wú)法過(guò)濾包含噪聲的數(shù)據(jù).針對(duì)這個(gè)問(wèn)題,提出一種基于穩(wěn)態(tài)的多元時(shí)間序列作為故障特征,設(shè)計(jì)一種突變點(diǎn)檢測(cè)算法,可以過(guò)濾掉大量的干擾數(shù)據(jù).此外還提出一種基于LSTM的故障診斷模型,在基于Simulink仿真數(shù)據(jù)和實(shí)際實(shí)驗(yàn)數(shù)據(jù)上進(jìn)行驗(yàn)證.實(shí)驗(yàn)結(jié)果表明,該方法在識(shí)別各種常見(jiàn)的故障上具有很好泛化能力以及精度.
本研究中的光伏系統(tǒng)由18個(gè)PV模塊組成,構(gòu)成3 × 6(并聯(lián)數(shù)3,串聯(lián)數(shù)6)的光伏陣列,單晶硅PV模塊的型號(hào)為GL-m100,其中每一個(gè)PV模塊采用了常用的高效的單二極管模型(SDM),如圖1所示.

圖1 單二極管模型Fig.1 PV array model
假設(shè)陣列中所有的太陽(yáng)能電池參數(shù)是相同的,則SDM模型可直接應(yīng)用于光伏組件[23-24],方程如下:

(1)

(2)

圖2 光伏陣列故障模擬Fig.2 PV array fault simulation
大型光伏電站大多建在人煙稀少、環(huán)境惡劣的野外,容易遇到各種故障,包括短路故障、線到線故障,開(kāi)路故障、退化故障、陰影故障.
故障的模擬如圖2所示.E1,E2,E3,E4,E5均為觸發(fā)器,可以設(shè)置故障前后的值,分別控制五種故障.E1連接一個(gè)乘法器,控制輻照度的比例,模擬陰影故障; E2連接一個(gè)理想開(kāi)關(guān)和開(kāi)路電阻Rde(10 MΩ)控制退化故障; E3連接一個(gè)理想開(kāi)關(guān)和Roc控制開(kāi)路故障; E4連接一個(gè)理想開(kāi)關(guān)控制線對(duì)線故障; E5連接一個(gè)理想開(kāi)關(guān)控制短路故障.理想開(kāi)關(guān)輸入值為0時(shí)為打開(kāi),輸入值為1時(shí)為關(guān)閉.
光伏陣列在正常工作時(shí),會(huì)根據(jù)逆變器的最大功率點(diǎn)追蹤(maximum power point tracking, MPPT)算法追蹤最大功率[25].較為常用MPPT算法為擾動(dòng)觀察法,即按一定的規(guī)律擾動(dòng)光伏陣列的輸出電壓,計(jì)算擾動(dòng)后的輸出功率,將擾動(dòng)前后的輸出功率進(jìn)行比較,進(jìn)一步繼續(xù)擾動(dòng)輸出電壓.光伏陣列的故障前后,工作點(diǎn)電壓電流均會(huì)發(fā)生一定規(guī)律的變化.在t=15 s時(shí)刻將光伏陣列的某個(gè)組串短路,工作點(diǎn)電流變化如圖3(a)所示,工作點(diǎn)電壓如圖3(b)所示.短路的組串的電流震蕩幅度會(huì)更大,幅值減小,正常的組串的電流震蕩幅度會(huì)更小,幅值增大,光伏陣列電壓的幅值減小,這些都是較明顯的特征.當(dāng)光伏陣列達(dá)到故障后的新的穩(wěn)態(tài),在溫度和輻照度不變的情況下,光伏陣列電壓仍然以相同的擾動(dòng)步長(zhǎng)震蕩.本研究將對(duì)光伏陣列的開(kāi)路故障,組串內(nèi)短路故障,組串間短路故障,陰影故障,老化故障數(shù)據(jù)進(jìn)行相應(yīng)的分析和故障識(shí)別.

圖3 光伏陣列的工作點(diǎn)狀態(tài)Fig.3 Working point status of photovoltaic array
因原始的光伏陣列工作點(diǎn)受到環(huán)境參數(shù)和逆變器的MPPT算法的影響,大部分的工作點(diǎn)并非真正的最大功率點(diǎn).環(huán)境參數(shù)的時(shí)刻變化,導(dǎo)致逆變器根據(jù)自身的算法不停地追蹤最大功率點(diǎn),所以最大功率點(diǎn)分布在溫度和輻照度相對(duì)穩(wěn)定的狀態(tài)下.為了提取處于穩(wěn)態(tài)下的震蕩電壓電流波形,并過(guò)濾掉暫態(tài)波形和噪聲干擾,提出一種突變點(diǎn)點(diǎn)檢測(cè)算法.因數(shù)據(jù)采集頻率為200 Hz,為了保證全局的數(shù)據(jù)都可以檢測(cè)到,將每連續(xù)的200個(gè)光伏陣列工作電壓作為一個(gè)集合,隨機(jī)選擇一個(gè)點(diǎn)將該集合分為兩部分,計(jì)算兩邊各點(diǎn)與各部分平均值的殘差.當(dāng)總殘差為達(dá)到最小值,即可找到突變點(diǎn),由下式定義:

(3)

圖4 光伏陣列電壓突變點(diǎn)檢測(cè) Fig.4 Photovoltaic array voltage mutation point detection
將V1,V2,V3, …,Vk, …,V200依次帶入,當(dāng)J取最小值時(shí),記錄Vr=k時(shí)間節(jié)點(diǎn),如圖4所示.
每?jī)蓚€(gè)相鄰的節(jié)點(diǎn)之間約有160個(gè)數(shù)據(jù),為避免數(shù)據(jù)的冗余,對(duì)其進(jìn)行整數(shù)倍采樣,將其時(shí)間序列降低.根據(jù)其數(shù)據(jù)的特點(diǎn),過(guò)濾突變點(diǎn)時(shí)刻的10個(gè)干擾數(shù)據(jù),將其長(zhǎng)度壓縮為原來(lái)的1/25,最終在每一段區(qū)間取6個(gè)數(shù)據(jù).本研究定義5段區(qū)間為一個(gè)完整的波形,即將30個(gè)數(shù)據(jù)作為光伏陣列的電壓的特征,該時(shí)間窗口完整的震蕩波形特征如圖5所示.
根據(jù)Vr=k記錄的時(shí)間節(jié)點(diǎn),以相同的方法提取光伏陣列的其他特征. 故障特征包括組串1電流I1,組串2電流I2,組串3電流I3,以及陣列總電流IPV,陣列總電壓VPV.每一類特征包含30個(gè)基于時(shí)間序列的數(shù)據(jù),將五類特征進(jìn)行縱向的維度拼接,獲得5 × 30的多元穩(wěn)態(tài)時(shí)間序列,如圖6所示.

圖5 光伏陣列電壓的序列特征Fig.5 Sequence characteristics of photovoltaic array voltage

圖6 序列故障特征Fig.6 Fault characteristics
LSTM是循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)的變體之一,常用于處理基于時(shí)間序列的數(shù)據(jù),能在一定程度上解決連續(xù)特征長(zhǎng)時(shí)的依賴問(wèn)題[26].LSTM模型的結(jié)構(gòu)與RNN相似,都是鏈?zhǔn)窖h(huán)的網(wǎng)絡(luò)結(jié)構(gòu),不過(guò)LSTM在網(wǎng)絡(luò)內(nèi)部擁有更加復(fù)雜的結(jié)構(gòu), 如圖7所示.

圖7 LSTM的基本模型Fig.7 Basic model of LSTM

圖8 基于LSTM的光伏故障診斷模型Fig.8 Photovoltaic fault diagnosis model based on LSTM

以LSTM神經(jīng)網(wǎng)絡(luò)搭建的故障診斷模型如圖8所示.深層神經(jīng)網(wǎng)絡(luò)在模型訓(xùn)練的過(guò)程中存在著梯度消失和梯度爆炸、過(guò)擬合等問(wèn)題.大量研究表明,批次歸一化(batch-normalization,BN)可以規(guī)范特征的數(shù)值范圍,有效解決梯度消失問(wèn)題[27].Dropout技術(shù)[28]可以通過(guò)隨機(jī)丟棄一部分神經(jīng)元,使每一次更新的參數(shù)不同,最后預(yù)測(cè)結(jié)果相當(dāng)于多個(gè)網(wǎng)絡(luò)模型集成的結(jié)果,從而有效預(yù)防過(guò)擬合情況.LSTM模型相比于RNN可以有效解決在處理長(zhǎng)時(shí)間序列特征中的梯度消失以及梯度爆炸等問(wèn)題.由圖8可見(jiàn),本研究所提出的基于LSTM網(wǎng)絡(luò)的故障診斷模型主體結(jié)構(gòu)為BN+LSTM+Dropout,在此基礎(chǔ)上堆疊4層的BN+LSTM+Dropout,以提高網(wǎng)絡(luò)的表征能力.且在分類層加入一個(gè)Softmax函數(shù),輸出故障類別.
采用Mini-Batch[29]的訓(xùn)練集合劃分方法訓(xùn)練LSTM網(wǎng)絡(luò).優(yōu)化器選取了適應(yīng)性矩估計(jì)(adaptive moment estimation,Adam),它結(jié)合了帶動(dòng)量(momentum)的隨機(jī)梯度下降法和均方根柱(root mean square prop,RMSProp)的特點(diǎn),能夠更加自適應(yīng)地設(shè)置學(xué)習(xí)率,其超參數(shù)設(shè)置為β1=0.9,β2=0.999,ε=1.0 × 10-7.因本研究目標(biāo)是光伏陣列的故障診斷和識(shí)別,屬于分類問(wèn)題,故選取交叉熵(cross entropy)作為損失函數(shù).本研究的故障診斷模型在Pycharm環(huán)境和深度學(xué)習(xí)框架Pytorch上實(shí)現(xiàn), 并使用了NVIDIA的CUDA平臺(tái)加速模型的訓(xùn)練.
為驗(yàn)證提出的故障診斷方法的正確性和有效性,在3 × 6的小型光伏實(shí)驗(yàn)系統(tǒng)做了故障實(shí)驗(yàn),模擬開(kāi)路故障、組串內(nèi)短路故障、組串間短路故障、陰影故障、老化故障.本設(shè)計(jì)數(shù)據(jù)采集系統(tǒng)采用LV25-P型和LSP-10A型霍爾電流傳感器,在將電信號(hào)轉(zhuǎn)換為模擬電壓信號(hào)時(shí)均采用高分辨率的USB-1608數(shù)據(jù)采集卡.
通過(guò)基于Simulink的光伏陣列,模擬了5種常見(jiàn)的故障狀態(tài)和正常工況.為最大限度地覆蓋光伏陣列的工作環(huán)境,設(shè)置模型的輻照度范圍為110~1 000 W·m-2,步長(zhǎng)為10 W·m-2,溫度范圍為11~60 ℃,步長(zhǎng)為1步.每一組環(huán)境參數(shù),提取一個(gè)完整的多元序列特征樣本,各工況得到4 500組樣本,共27 000個(gè)樣本.其中將數(shù)據(jù)樣本隨機(jī)劃分,數(shù)據(jù)樣本的70%劃分為訓(xùn)練集,30%劃分為測(cè)試集.為了驗(yàn)證基于LSTM的故障診斷模型的優(yōu)越性能,另外采用BPNN和RNN的方法進(jìn)行比較.為了避免結(jié)果的偶然性,每一種模型獨(dú)立訓(xùn)練50次,得到的實(shí)驗(yàn)結(jié)果如表1所示.LSTM模型對(duì)于仿真數(shù)據(jù)的故障分類效果優(yōu)于RNN和BPNN.

表1 BPNN,RNN和LSTM在模擬數(shù)據(jù)集上的比較
對(duì)于實(shí)際的小型的3 × 6光伏陣列,以200 Hz的采樣率連續(xù)采集3 h,對(duì)每一種工況進(jìn)行數(shù)據(jù)獲取,通過(guò)USB-1608采集卡串口發(fā)送到上位機(jī).采用突變點(diǎn)檢測(cè)算法過(guò)濾掉噪聲和不穩(wěn)定波動(dòng)特征.因?yàn)閷?shí)際的實(shí)驗(yàn)數(shù)據(jù)在任何時(shí)刻都會(huì)受到溫度、輻照度以及噪聲的影響,最后檢測(cè)到的優(yōu)質(zhì)故障樣本為6 067個(gè).同樣按70%和30%的比例劃分訓(xùn)練集和測(cè)試集,經(jīng)過(guò)50次獨(dú)立實(shí)驗(yàn),得到對(duì)比結(jié)果如表2所示.由于噪聲數(shù)據(jù)的影響,BPNN在區(qū)分除了開(kāi)路故障外的其他工況類型后,精度有明顯的降低.LSTM和RNN模型采用了多元穩(wěn)態(tài)時(shí)間序列特征,分類效果優(yōu)于BPNN.LSTM憑借對(duì)長(zhǎng)時(shí)特征記憶性的優(yōu)勢(shì),仍然可以有很好的故障識(shí)別性能.

表2 BPNN,RNN和LSTM在實(shí)測(cè)數(shù)據(jù)上的比較
針對(duì)光伏陣列故障數(shù)據(jù)易受噪聲和最大功率點(diǎn)追蹤算法的影響,導(dǎo)致故障識(shí)別精度偏低的問(wèn)題,提出將一種多元穩(wěn)態(tài)時(shí)間序列作為光伏陣列的故障特征,分析光伏陣列故障發(fā)生前和發(fā)生后的特征變化,設(shè)計(jì)了一種突變點(diǎn)檢測(cè)算法自動(dòng)提取時(shí)序特征.此外,還設(shè)計(jì)了一種基于LSTM的光伏陣列故障診斷模型,并通過(guò)仿真和實(shí)際的故障實(shí)驗(yàn),與傳統(tǒng)的RNN和BPNN模型進(jìn)行比較.結(jié)果表明,LSTM模型在仿真數(shù)據(jù)分類中整體精度達(dá)到99.9%,在實(shí)測(cè)數(shù)據(jù)下整體精度達(dá)到98.7%,能夠更準(zhǔn)確地識(shí)別出故障類型,在泛化性、可靠性方面都具有更優(yōu)異的性能.