陳世群 高 偉 陳孝琪 涂彥昭 楊 艷
一種基于極限學習機和皮爾遜相關系數的光伏陣列故障快速診斷方法
陳世群1高 偉2陳孝琪2涂彥昭2楊 艷3
(1. 國網福建省電力有限公司福州市長樂區供電公司,福州 350202; 2. 福州大學電氣工程與自動化學院,福州 350108; 3. 淮陰工學院自動化學院,江蘇 淮安 223003)
光伏陣列故障會造成能量損失,甚至引發供電中斷或火災事故。因此,對故障的快速識別至關重要。本文提出一種光伏陣列故障快速診斷方法,用于快速感知故障及故障發生的時刻。通過分析光伏陣列常見故障的信號變化規律,提出利用正常運行時的功率波形訓練一個極限學習機預測模型,用于預測短時功率的變化;接著計算實測波形和預測波形的皮爾遜相關系數;若光伏陣列發生故障,相關系數將低于一定的閾值,從而識別故障的發生。實測實驗驗證了所提方法具有很強的故障辨識能力,準確率達到99.37%。所提方法的故障辨識時間僅為4.355ms,亦可作為光伏陣列故障錄波的啟動方法使用。
光伏陣列;故障錄波;極限學習機(ELM);皮爾遜相關系數
近年來傳統化石燃料逐漸枯竭,且化石燃料所引起的環境污染問題日益嚴重,人們對可再生清潔能源的需求不斷提高。太陽能發電在不產生有害物質的前提下,將太陽能直接轉換為電能,得到各國的青睞和廣泛應用。在過去的十年里,光伏裝機容量快速增加。根據國家能源局官網發布的《國家能源局2021年一季度網上新聞發布會文字實錄》[1],截至2020年底,我國累計光伏并網裝機容量已經達到253GW,位列世界第一;光伏全年發電量達到2 605億kW·h,同比增長16.1%。
光伏陣列安裝在室外環境,持續暴露在惡劣的環境條件(陽光、降雨等)下會誘發各種故障,導致發電效率降低。當故障嚴重時甚至會損壞設備,造成火災等嚴重安全事故[2]。因此,對光伏陣列的故障識別和故障診斷至關重要。光伏陣列的故障診斷方法可分為離網診斷和并網診斷兩種。離網診斷方法是在光伏系統退出運行的情況下,通過專用設備,執行電流-電壓(-)掃描操作,獲得當前狀態的-曲線。接著針對該曲線,推導光伏陣列的內、外特征參數。根據故障前后內、外特征參數的變化規律,識別光伏陣列的故障類型。文獻[3]提出一種通過觀察和評估電壓、電流的變化來診斷光伏故障的新方法。用開路電壓、短路電流和最大功率點的電壓、電流來定義電壓、電流指標,并根據故障特征的變化確定閾值。通過對實時采集的指標值和閾值的比較,判斷系統是否存在故障。由于受電站規模、組件參數的影響,通過閾值判斷故障狀態的方式,泛化性較弱,在組件性能老化時,閾值需重新確定。文獻[4]以-曲線中mpp、mpp、sc、oc等4個特征參數作為辨識特征量,通過大量的標簽樣本訓練BP神經網絡,從而建立一個能夠識別短路、開路、老化和遮陰的診斷模型。文獻[5]首先利用Lambert W函數重新建立光伏陣列的-關系,然后提出使用混沌粒子群算法搜索光伏陣列的模型參數,估計出5個內部參數。將正常和異常狀態的參數進行比較實現故障辨識。參數估計法往往只能求得局部最優值,而不是全局最優值。兩個結果相似的解析解差異可能很大。因此,以最優值代替真實值進行診斷容易導致誤判。離網診斷方法的最大缺陷是難以實現實時的故障診斷,導致故障無法在第一時間被檢測到,并且在執行-曲線掃描時,需要斷開網絡,造成人為的能量損失。
并網診斷方法是在光伏系統運行時,利用電壓、電流波形在故障發生前后的變化規律識別故障類型。常用于解決多串列系統的線間故障、動態遮陰及電弧故障診斷問題[6]。線間故障又稱為失配故障,因線間故障存在故障電流回流的現象,故常采用瞬時波形分解及時頻變換來提取故障特征、辨識故障類型。而失配比例、接地電阻的大小及阻塞二極管的使用,都會限制故障電流的產生和變化,給故障辨識帶來很大困難。文獻[7]從理論上解釋了線間故障及其演化過程,通過仿真和實驗研究,證明了在低失配比、高阻抗、低輻照度或晝夜變化等條件下,故障串的回流電流不足以讓過電流保護裝置動作,給系統的安全運行帶來很大隱患。為此,文獻[8]利用光伏陣列輸出特征中右側功率峰值(right power peak, RPP)的惟一性來檢測線-線、線- 地故障,使用全局的擾動觀測的最大功率點跟蹤(maximum power point tracking, MPPT)算法來追蹤RPP。實驗結果表明,該方法可以有效檢測出故障,而與失配級別、系統類型和系統額定值無關。在低輻照度和局部遮陰下,同樣有效。文獻[9]將功率數據進行經驗模態分解,將分解后得到的固有模態函數(intrinsic mode function, IMF)分量、分解余項和相關因素(太陽輻射強度、濕度、溫度)作為BP神經網絡的輸入變量,建立一個能夠實現短時功率預測的模型。然而,傳感器存在安裝角度偏差,陣列積灰或老化都會影響該方法的準確性。文獻[10]利用提取的低分辨率功率和照度損失比計算陣列損失,尋找多串列光伏系統中,失配、局部遮陰和正常狀態在上述特征量范圍內的幅值差異,進行故障探測。并網故障診斷法的優點是無需停機即可辨識故障,避免了人為的功率損失。但若故障發生在逆變器停機期間,由于無法提取波形變化的數據,這類方法就會失效。因此,需要將并網和離網故障診斷方法相結合,從而實現光伏系統故障的快速、準確識別。
目前,絕大部分的研究主要關注使用何種算法對已獲得的數據進行準確診斷。這些數據大多是通過仿真和實驗獲得,并通過人工選取的方式得到理想時間窗的信息。在實際應用中,首先需要能辨識故障,自動發現故障發生的時刻,記錄故障發生前后的波形,再利用前述診斷方法辨識故障類型。因此,故障自動錄波是故障辨識的前提,為故障辨識提供數據支撐。鑒于這方面的研究工作甚少,本文提出一種基于極限學習機(extreme learning machine, ELM)和序列相關系數的光伏系統故障快速診斷方法,通過比較發電功率的預測波形和實際波形的相關系數變化,實現光伏系統的故障診斷和對故障時刻的甄別。
并網故障檢測可以辨識開路、遮陰、線間等故障類型。在不同的故障類型下,電壓、電流、功率的波形在故障瞬間均會產生特異性波動。各狀態下的時序電壓、電流如圖1所示。正常狀態下,電壓、電流、功率波形均保持規律性變化,如圖1(a)所示。

圖1 各狀態下的時序電壓、電流
部分遮陰指光伏陣列的某些模組被云層、樹木、建筑物等物體遮擋,導致陣列輸出功率出現受損的情況。遮陰故障發生時,被遮陰模組的輻照度會逐漸減小,所以陣列的總輸出電流開始下降。當被遮陰模組的輻照度減小到一定程度時,對應的旁路二極管就會因電壓差而被激活。此時被遮陰模組短路,陣列輸出電流出現回升,而陣列電壓因為被遮陰模組短路而變小,這個過程的時序波形如圖1(b)所示。
線間故障指在光伏陣列中,兩個不同電位點發生連接,導致部分光伏模組被短路,進而導致陣列的輸出功率受到損失[11]。線間故障可以發生在同一光伏串內,也可發生在相鄰的兩個光伏串之間。被短路的模組越多,則失配比越大,線間故障越嚴重。這個過程的時序波形如圖1(c)所示。由于故障電流容易受到光照輻射度和MPPT的影響,線間故障在光伏陣列中難以檢測,特別是低失配比的線間故障,波形的變化非常小。若不及時清除線間故障,則其會一直隱藏在陣列中,導致更大的安全隱患[12]。
開路故障指光伏陣列中的某串任意一點發生斷路,導致故障串開路,不產生能量。當開路故障發生時,陣列的電流瞬間下降為非故障串電流之和。由于開路故障前后最大功率工作點的電壓相差不大,因此經過一個較短的時間,時序波形就趨于穩定,如圖1(d)所示。
從上述分析可以發現,當光伏陣列發生故障時,電壓、電流和功率的波形均會發生規律性變化。因此本文以功率波形為研究對象,通過機器學習算法,預測波形的發展變化。當實測波形和預測波形出現明顯差異時,即判定發生故障,記錄故障發生的時刻,并以此作為故障錄波的啟動判據。
考慮到不同模組參數的差異及光伏陣列規模的不同,需要對采集到的電壓、電流數據進行標準化預處理以提高方法的適應性。本文將時序電壓、電流分別除以在標準測試條件(standard test condition, STC)(1 000W/m2, 25℃)下的陣列開路電壓oc和陣列短路電流sc,得到標準化后的電壓、電流值,再將標準化后的電壓、電流相乘則得到功率的標準化值。其表達式為




極限學習機[13]網絡結構如圖2所示,其為單隱含層前饋神經網絡與隨機學習相結合的產物。ELM隨機生成輸入層與隱含層之間的權重與偏置,一旦確定就不再改變。隱含層與輸出層之間的權重和偏置則是通過矩陣變化求解,無需多次迭代計算。ELM在學習過程中無需耗時調整網絡參數,學習速度極快,需要的計算內存很少。ELM網絡模型的訓練過程可描述如下。




式(6)可以簡化為



圖2 極限學習機網絡結構
相關系數是一種用于表征變量之間變化關系的數學統計指標[14],最早由統計學家卡爾·皮爾遜設計,包含標準差和協方差。兩變量之間的皮爾遜相關系數為


正常情況下,光伏陣列一般運行在電壓、電流相對穩定的狀態下。在這種情況下,功率波形短時間內基本保持在一個較小的范圍內波動。而當光伏陣列發生故障時,功率波形在短時內會出現明顯的下降趨勢。基于此,本文提出基于ELM功率預測結合相關系數的光伏陣列故障快速診斷方法。通過將正常運行的功率數據作為ELM的訓練樣本,生成一個功率預測模型,實現正常運行情況下的短時功率預測。在正常運行時,由于ELM所輸出的功率預測值與實際值之間存在強相關,則相關系數值較大。當故障出現時,預測模型輸出的是正常狀態的預測值,則預測值與實際值的相關性變低,相關系數會出現明顯的下降。故障診斷流程如圖3所示,具體如下:
1)以一定的采樣率采集光伏陣列的電壓、電流。
2)按式(1)~式(3)進行數據標準化處理。
3)使用標準化后的時序功率訓練一個實現短時功率預測的模型。
4)求取功率預測值與實際值之間的皮爾遜相關系數。

圖3 故障診斷流程
光伏系統實驗平臺由光伏陣列、直流匯流箱、逆變器、交流電源和數據采集模塊組成。光伏陣列的規模為2×12,即2串列并聯,每串列有12塊光伏模組,裝機容量為6.48kWp。標準測試條件下的光伏系統技術參數見表1,實驗場景如圖4所示。在本文中,通過霍爾傳感器將陣列電壓與電流轉換為小電壓信號;NI 9220采集卡將電壓模擬信號轉換為數字信號;NI cDAQ—9185承擔NI 9220采集卡和PC端之間的數據交互角色;使用LabView和Python編寫相關程序。

表1 標準測試條件下的光伏系統技術參數
正常類別的樣本由輻照度穩定的樣本和輻照度快速變化的樣本組成;通過硬紙板對任意串任意模組進行遮擋以模擬部分遮陰;在任意時刻斷開直流匯流箱中任意一串的空氣開關以模擬開路故障;利用“Y”型接頭及短路發生器(固態繼電器)在某一時刻連通陣列中兩個不同電位點以模擬線間故障。實驗在200~900W/m2的輻照度和20~50℃的環境下完成。總計獲得了448個樣本,其中正常樣本144個、部分遮陰樣本100個、開路故障樣本102個、線間故障樣本102個。數據采樣率為500Hz,時間窗口為0.2s。

圖4 光伏實驗場及故障模擬實驗場景
將實驗中采集到的100個正常運行樣本作為訓練集對極限學習機進行訓練,其余44個正常樣本及304個故障樣本用于測試所提方法的性能。極限學習機神經元使用300個,激活函數采用Sigmoid。以0~0.15s內功率波形的數據作為ELM的輸入數據,ELM的輸出數據則為0.15~0.20s內的預測功率數據。通過分析功率預測波形同實測波形之間相關系數的變化關系來決定故障辨識的閾值。
1)正常狀態


圖5 正常狀態下的功率曲線

圖6 正常狀態下50個檢測周期的相關系數變化
2)線間故障
在線間故障中,失配比越小,故障的嚴重程度越低,檢測難度越大。為此,本文直接使用在本實驗環境下能夠獲得的最低失配比(一個模塊失配)的故障樣本進行測試。


圖7 線間故障下的功率曲線


圖8 線間故障下50個檢測周期的相關系數變化
3)開路故障
開路故障為光伏陣列故障中較為嚴重的一種,相對而言更容易檢測。開路故障下的功率曲線如圖9所示。從圖9可以看出,預測值與實際值之間變化趨勢顯著不同。故障發生前,預測值與實際值較為近似;故障出現后,實際功率輸出突然下降,而預測功率值仍然保持在0.45附近波動。

圖9 開路故障下的功率曲線
開路故障下50個檢測周期的相關系數變化如圖10所示。在圖10中,在0.164s前相關系數都高于0.85,而在0.166s開始突降,由前一刻的0.896 0瞬間降低至0.245 8,此后持續低于0.6,區分度極高。

圖10 開路故障下50個檢測周期的相關系數變化
4)部分遮陰
在光伏陣列的故障中,部分遮陰是相對較難檢測的。原因在于其不存在突變量,故障暫態的時序波形變化較為緩慢,并且功率變化幅值較小,遠不及線間故障和開路故障,極易與正常狀態混淆。部分遮陰下的功率曲線如圖11所示。在圖11中,故障出現在0.162s。故障發生后,功率實際值逐漸下降。預測值與實測值逐漸出現偏差。

圖11 部分遮陰下的功率曲線
部分遮陰下50個檢測周期的相關系數變化如圖12所示。在圖12中,0.10~0.162s期間的相關系數都在0.9以上波動。在0.162s發生部分遮陰故障后,相關系數開始逐漸減小。在0.168s時,相關系數減小到0.641 2,此后,相關系數持續低于0.7。不同于前述的開路和線間故障,部分遮陰發生后,相關系數不會突降,而是逐漸減小,并且減小程度也不如前兩者。但本文所提方法仍然能夠有效檢測到部分遮陰故障。

圖12 部分遮陰下50個檢測周期的相關系數變化

由于所提方法主要實現光伏陣列的故障檢測,以作為錄波啟動的判據,因此需要盡可能地降低硬件需求,實現最快速的故障判斷。為此,在原算法的基礎上,需要考慮滑動窗口長度及滑動步長的選擇。滑動窗口的長度關系到ELM運行速率,窗口越長則所需計算的數據越多,影響故障檢測的速率;窗口越短則難以準確地獲得預測值,預測結果的不準確將進一步降低方法的準確率。滑動步長則關系到故障檢測的周期,滑動步長越短,檢測周期也越短,對硬件要求越高;滑動步長越大,則故障暫態波形難以有效填充整個預測值的窗口,導致預測準確率下降。事實上,預測精度越高,預測功率和正常狀態下的實測功率吻合度就越高,正常狀態被誤判的幾率就越小,故障識別的成功率也越高。
為了測試不同長度滑動窗口下所提方法的故障檢測性能,本文對上述304個故障樣本進行測試,不同時間窗口的準確率及運行時間見表2。可以看出,0.2s長度的滑動窗口表現出最優的性能,判斷總準確率為99.37%,與窗口長度為0.4s、0.7s的準確率相同,而運行時間卻比上述兩者更短。當窗口長度為0.1s時,所提方法的故障檢測準確率出現明顯的下降。綜上,本文以0.2s作為所提方法的滑動窗口長度。

表2 不同時間窗口的準確率及運行時間
本文故障檢測模型的運行環境為:Windows操作系統,i5—8300H的CPU,內存8G,集成顯卡。運行時間由數據預處理、ELM功率預測、相關系數計算三部分組成。從表2可以看出,本文所提方法單次運行時間十分短,僅使用4.355ms。本文方法的采樣率為500Hz,兩個數據點采樣間隔時間為0.002s,因此最小的滑動步長為6ms。
針對光伏陣列故障診斷方法在實際應用中缺乏故障錄波啟動判據的問題,本文提出了一種基于極限學習機和皮爾遜相關系數的故障快速檢測方法。所提方法通過極限學習機模型預測了未來功率波形的變化,并通過波形相關系數的下降特征判定故障發生的時刻。經實驗驗證,所提方法能準確辨識出線間、開路、遮陰等故障,準確率達到99.37%,運行時間僅4.355ms,達到實際應用要求。
在本文中,逆變器的MPPT啟動,可能會導致算法將其誤判為故障。但是作為故障錄波的啟動算法,追求的是快速性,而非極高的辨識準確率。位于其后端的故障分類算法可以將MPPT啟動的樣本辨識出來[15]。因此,所提方法滿足作為故障啟動判據的要求。在后續的研究中,將重點考慮將算法部署到單片機或樹莓派上,以測試其在實際應用中的適應性。
[1] 國家能源局. 國家能源局2021年一季度網上新聞發布會文字實錄[EB/OL]. [2021-01-30]. http://www.nea. gov.cn/2021-01/30/c_139708580.htm.
[2] 陳國燈, 林培杰, 賴云鋒, 等. 基于電流時間序列的光伏故障在線監測系統[J]. 電氣技術, 2018, 19(6): 20-25.
[3] PEI Tingting, HAO Xiaohong. A fault detection method for photovoltaic systems based on voltage and current observation and evaluation[J]. Energies, 2019, 12(9): 1-16.
[4] 王元章, 吳春華, 周笛青, 等. 基于BP神經網絡的光伏陣列故障診斷研究[J]. 電力系統保護與控制, 2013, 41(16): 108-114.
[5] 程澤, 董夢男, 楊添剴, 等. 基于自適應混沌粒子群算法的光伏電池模型參數辨識[J]. 電工技術學報, 2014, 29(9): 245-252.
[6] GEORGIJEVIC N, JANKOVIC M, SRDIC S, et al. The detection of series arc fault in photovoltaic systems based on the arc current entropy[J]. IEEE Transactions on Power Electronics, 2016, 31(8): 5917- 5930.
[7] ZHAO Ye, PALMA J D, MOSESIAN J, et al. Line-line fault analysis and protection challenges in solar photovoltaic arrays[J]. IEEE Transactions on Industrial Electronics, 2013, 60(9): 3784-3795.
[8] PILLAI D S, NATARAJAN R. An MPPT-based sensorless line-line and line-ground fault detection technique for PV systems[J]. IEEE Transactions on Power Electronics, 2019, 34(9): 8646-8659.
[9] 孫祥晟, 陳芳芳, 賈鑒, 等. 基于經驗模態分解的神經網絡光伏發電預測方法研究[J]. 電氣技術, 2019, 20(8): 54-58.
[10] HARIHARAN R, MANICKAM C, ILANGO G S, et al. A method to detect photovoltaic array faults and partial shading in PV systems[J]. IEEE Journal of Photo- voltaics, 2016, 6(5): 1278-1285.
[11] MOHAMMED K A, FAISAL K, JAY J, et al. A comprehensive review of catastrophic faults in PV arrays: types, detection, and mitigation techniques[J]. IEEE Journal of Photovoltaics, 2015, 5(3): 982-997.
[12] GAO Wei, WAI Rongjong, CHEN Shiqun. Novel PV fault diagnoses via SAE and improved multi-grained cascade forest with string voltage and currents measures[J]. IEEE Access, 2020(8): 133144-133160.
[13] HUANG Guangbin, ZHOU Hongming, DING Xiaojian, et al. Extreme learning machine for regression and multiclass classification[J]. IEEE Transactions on Systems Man & Cybernetics Part B, 2012, 42(2): 513-529.
[14] 師愉航, 汲勝昌, 張凡, 等. 變壓器油箱表面運行變形振型特性研究[J]. 電工技術學報, 2019, 34(5): 202-209.
[15] CHEN Shiqun, YANG Gengjie, GAO Wei, et al. Photovoltaic fault diagnosis via semi-supervised ladder network with string voltage and current measures[J]. IEEE Journal of Photovoltaics, 2021, 11(1): 219-231.
A fast fault diagnosis method for photovoltaic array via extreme learning machine and Pearson’s correlation coefficient
CHEN Shiqun1GAO Wei2CHEN Xiaoqi2TU Yanzhao2YANG Yan3
(1. Fuzhou Changle District Electric Power Supply Branch of State Grid Fujian Electric Power Co., Ltd, Fuzhou 350202; 2. College of Electrical Engineering and Automation, Fuzhou University, Fuzhou 350108; 3. Faculty of Automation, Huaiyin Institute of Technology, Huaian, Jiangsu 223003)
The failure of the photovoltaic (PV) array can cause energy loss and even cause power supply interruption or fire accident. Therefore, it is very important to identify the fault quickly. A new fast fault diagnosis method for PV array is proposed to quickly perceive the fault and the time of fault occurrence in this paper. Based on the analysis of the signal variation rule of PV array traditional faults, a prediction model of extreme learning machine (ELM) is investigated to train the power waveform during normal operation, which is adopted to predict the short-time power variation. Then Pearson’s correlation coefficient of measured waveforms and predicted waveforms are calculated. If the PV array fails, the correlation coefficient will be below the threshold, thus identifying the occurrence of the fault. Experimental results show that the proposed method has strong ability of fault identification, and the accuracy reaches 99.37%. The fault identification time of the proposed method is only 4.355ms, and it can be used as the start-up method of PV array fault recording.
photovoltaic array; fault recording; extreme learning machine (ELM); Pearson’s correlation coefficient
江蘇省住房和城鄉建設廳指導項目(2019ZD001287)
江蘇淮安市科技局自然科學研究計劃項目(HAB201905)
2021-02-26
2021-03-31
陳世群(1995—),男,福建福州人,碩士,研究方向為新能源故障診斷研究。