鄭光軍 ,王 霄 ,龍道銀 ,楊 靖 ,覃 濤
(1.貴州大學電氣工程學院,貴州 貴陽 550025;2.中國電建集團貴州工程有限公司,貴州 貴陽 550025)
光伏陣列既是光伏發電的核心,又是光伏發電的基礎設備。近年來,隨著光伏發電應用的快速發展,光伏陣列布置的復雜程度也在不斷提高。光伏發電系統故障類型也呈現出各式各樣的變化。其中,光伏陣列發生故障較常見、易發生。光伏陣列發生故障對整個發電系統影響是巨大,嚴重的話甚至會造成火災。因此,對光伏陣列故障診斷的方法進行研究具有重大意義。因為光伏陣列長期暴露在室外的環境下,經過長年累月的風吹雨打,不免會出現一些故障。隨著智能算法的迅速發展,Dempster-Shafer(D-S)證據理論因為具有很高的解決不確定信息特性、在工業應用中有非常好的實用性,被廣泛運用在信息融合、決策分析和人工智能等領域[1]。將D-S 證據理論運用在光伏陣列故障診斷中,不僅可以解決光伏陣列故障中存在的數據交叉、誤判率高、診斷速度慢的問題,而且可以提高光伏陣列故障診斷的準確性。但是采用傳統的Dempster 組合規則進行證據融合時,其結果在某些情況下經常會出現違背常識的結論。這主要是因為傳統的Dempster 融合規則只適用于融合證據沖突較小的證據,一旦融合沖突大的證據就會出現結論悖論。為解決融合沖突大的證據這一缺陷,眾多學者針對這一缺陷積極地進行分析和探討,提出了多種改進方案。這些方案都在某種程度上彌補了證據理論的缺陷。但迄今為止,仍沒有取得一種特別可靠的方案。總體而言,現有的D-S 證據理論改進方案主要歸納為兩大類。第一類方法就是提出一種新的證據組合規則來代替傳統的Dempster 規則,如:文獻[2]認為所有沖突證據都不可以提供對證據融合結果有力的信息,將所有沖突信息全部歸納為未知來減少證據沖突;文獻[3]認為證據之間的沖突有一部分是對證據融合結果有用的,因此應將證據沖突的信息按照一定的分配比例分給所有證據的焦元集合;文獻[4]~文獻[10]也都分別提出相對應的改進方案。這些方法的核心是研究沖突信息應如何分配給哪些命題,以及按照怎樣的分配方案去分配。第二類方法就是證據預處理[11],其核心就是在不改變證據理論中Dempster 組合規則的情況下,在證據合成前先對沖突證據進行修改,減小沖突后用Dempster 組合規則進行合成。目前,第一類方法效果不是很理想,因為如果證據沖突是因設備故障所導致的,卻將其認為是證據組合規則所引起的就很不合理。第二類方法也存在著各種瑕疵。針對以上所述的問題,本文提出了一種新的算法,并將其運用在光伏陣列故障診斷中,得到了顯著的改進。
光伏陣列在工作中會出現陰影遮蓋、組件老化、組件短路、組件開路、電池板裂化等故障。這些故障的出現會影響光伏陣列正常的運行,甚至損壞光伏陣列器件。光伏陣列故障診斷就是通過光伏陣列發生故障時的狀態特征和對應時刻的系統數據,快速地判定故障類型。
光伏陣列發生開路、短路、陰影遮蓋等故障時,就會出現其故障特有的現象。如:電壓、電流的突變使整個光伏發電系統輸出的電壓增大或減少等。光伏陣列的一種故障可能產生多種故障現象,而有些故障的故障現象有可能一樣。因此,只是單純地檢測一種故障特征,并不能完全正確地診斷出光伏陣列發生了哪一種故障。
本文以光伏陣列短路故障診斷作為研究對象,結合大量的光伏發電試驗與運維經驗,總結引起光伏陣列短路的故障原因主要有:組件短路、組件老化、陰影遮蓋。同時,總結引起光伏陣列短路故障的特征主要有以下7 種:A-組件溫度升高;B-電流瞬間增大;C-輸出功率增大;D-電流緩慢增大;E-產生電弧;F-輸出功率下降;G-故障點因過熱而損壞。其中:A、B、C 可表示組件短路;A、D、F、G 可表示陰影遮擋;A、B、E、F、G可表示組件老化;E、F 互斥,并且每種特征發生的概率不同。因此,當特征A 發生或特征A、B 同時發生時,每種故障特征和與之相對應產生的原因的可能性大不相同。由此可知,不能簡單地依靠每種故障特征發生原因的概率診斷短路故障的原因,也因此不能及時有效地排除故障。這體現了光伏陣列故障診斷的不確定性。
傳統的D-S 證據理論融合算法融合證據時與沖突系數K有關,但是傳統的證據沖突系數K不能有效地衡量各個證據之間的沖突。本節介紹傳統D-融合規則和利用Jousselem 改進的衡量證據沖突系數。
在D-S 證據理論中首先定義一個辨識框架Ω,是一個非空集合,是由兩兩互斥的命題組成的有限完備集,即Ω={θ1,θ2,...,θn}。2Ω是Ω的冪集,是Ω所有子集的集合。
對2Ω的任意命題A,定義映射函數m:2Ω→[0,1]為Ω上的一個基本概率分配函數(basic probability assignment,BPA)。m滿足 :

對于?A?Ω,如果m(A) >0,則A為焦元,m(A)為A的基本概率賦值。m(A)反映了證據對A的信任度。
定義1:m1、m2是辨識框上的兩個獨立的BPA。m1、m2利用Dempster 組合規則為:

式中:m(A)為D-S 證據理論基本概率賦值,也是對A的可信度;K為證據沖突因子,表示了證據之間的沖突程度。

式中:K∈[0,1],K越大表示證據沖突越大。
當K=1 時,證據之間的沖突量最大,表示不能使用Dempster 組合規則。采用的Dempster 規則合成m1和m2的運算也稱為求取m1和m2正交和的運算,記為m1⊕m2。
對多組證據信任分配函數m1,m2,...,mn也可以通過正交和運算實現,即m1⊕m2⊕m3⊕...⊕mn。
定義2:m1,m2,...,mn是在同一個辨識框架Ω上的n組獨立的BPA,焦元分別為Ai(i=1,2,...,N)。則Dempster 規則為:

D-S 證據理論在融合證據時與沖突系數K也有關系。因此,如何有效地計算出證據之間的沖突有著重要意義。沖突系數K∈[0,1]。當K越大,證據之間的沖突也就越大。反之,當K越小,證據之間的沖突程度就越小。當K=1 時,表示證據完全沖突,Dempster組合規則就不再適用,并且還會出現對一致證據的“誤判”以及沖突系數表征的沖突程度與實際不相符等問題。以下通過案例說明傳統的證據沖突衡量標準沖突系數存在的缺陷。
證據E1:m1=(0.25,0.25,0.25,0.25) 和E2:m2=(0.25,0.25,0.25,0.25),經過計算得到兩個證據的沖突系數K=0.75。依據所定義的K進行分析,可以得到這兩個證據的沖突程度很大。但實際上,這兩個證據沒有任何沖突是完全一樣的。
因為傳統的沖突系數K在衡量證據沖突時有缺陷,導致D-S 證據理論在融合證據時得到的結果會出現誤判。因此,本文利用改進的Jousselme 距離Q[12]作為證據沖突衡量標準,可以準確、有效地衡量證據沖突。
定義3:辨識框架Ω={θ1,θ2,...,θn},有證據E1和E2及其對應的基本概率賦值為m1、m2,焦元各為A、B。則兩個證據E1、E2之間的mdBPA距離公式為:

式中:<m1,m2>為這兩個向量的內積;<m1,m1>=;<m2,m2>=

利用Q計算證據沖突,對于例1 計算得到Q=0,可以得到兩證據無沖突,符合實際。因此,用沖突系數Q作為衡量證據沖突有效。
傳統的D-S 證據理論無法融合高沖突證據。因此,本節利用權重系數的概念和沖突系數Q對各個證據基本概率賦值重新分配,然后利用改進的融合規則融合證據,并通過建立的判定規則識別融合結果。
由于傳統的D-S 證據理論中Dempster 融合規則,在融合高沖突證據時會失效,融合的結果一般與實際不相符。對此,本文從Haenni 的論點出發,并思考發現證據源在一定程度上因為本身的條件有限以及工作環境差異性的影響,所以由它們所提供的證據在證據組合的過程中,每個證據的重要程度都是有差別的。因此,在利用證據融合規則融合證據的過程中,引進了表征各證據在證據融合中重要程度的權重系數h。
定義4:利用Dempster 規則進行融合時,有n個證據源同時提供證據,證據集為E=(E1,E2,...,En)。則每個證據權重系數組成的權重向量H,用每個證據所占權重hi表示如下:

式中:hi∈[0,1]。

證據權重系數表述的是:由證據源所提供的證據,在證據融合的過程中的所占比重和對融合結果的影響大小。
在數據信息融合、決策等領域,少數服從多數的觀點得到了廣泛的運用。Zadel 認為D-S 證據理論中的各證據之間產生的高沖突或者是完全沖突,究其原因可能是單個證據或者是一小部分證據之間的極大不相容性所導致的。Yamada 提到D-S 證據融合規則的融合結果,可以保證大部分證據觀點,是證據融合規則所具備的一個特征。本文受少數服從多數的決策思想啟發,D-S 證據理論在證據合成過程中,產生高沖突或完全沖突的單個證據或是一小部分證據,對Dempster 融合規則的結果影響作用應該較小,所以其證據權重系數所占比就小。本文采用Q作為證據沖突衡量標準,利用信息熵的思想衡量每個證據在證據合成過程中的重要程度。若是某個證據與其他證據的沖突越小,熵就越小,則此證據所占權重就越大,即證據之間支持度就越大;反之,沖突越大,熵就越大,則此證據所占權重就越小,即證據之間支持度越小。根據該標準,即可確定權重向量H。
定義5:D-S 證據理論在證據合成的過程中,若有n個證據源一起提供證據,則此證據集可表示為E={E1,E2,…,En}。此證據集里證據Ei的權重系數為hi,則由每個證據的權重系數所構成的權重向量H為:H={h1,h2,…,hn}。其權重系數和權重向量的計算方法如下。
①計算此證據集中的證據Ei和其他證據Ej(j=1,2,n且j≠i)之間的沖突程度,則證據Ei的沖突向量Qi為:

式中:Qi為證據集中證據Ei與其他證據之間的沖突程度。
②將第一步得到的沖突向量Qi進行歸一化處理:

從這一步驟可以清楚地看出,對某個證據和其他證據之間的沖突所占比重進行歸一化,可以方便后面步驟的計算。

④對得到的沖突向量的熵值取倒數:

⑤計算每一個證據Ei的權重系數hi:

這一步驟歸一化,可以更加簡便地計算出權重系數。
通過定義5,可以確定各證據的權重系數hi和權重向量H。
首先,將定義5 求得的各證據權重系數hi進行排序,可以很明顯地看出各證據在證據合成過程中的重要性。設權重系數最大的證據為核心證據,其他證據均為非核心,則可知各證據相對于核心證據的證據權重為:

式中:εi∈[0,1]。
當εi=0 時,證據Ei是完全不可靠的。當εi=1時,該表征證據Ei是完全可靠的。
其次,利用各證據相對于核心證據的證據權重,基于“折扣率”的思想,將各證據的基本概率賦值進行轉換。令mεi表示對證據mi調整后的基本概率賦值,轉換方法如下:

式(15)中減小了證據權重小的證據中元素A提供的確定信息,加大了不確定元素Θ 提供的不確定信息。因此,通過式(15)的轉換,可以有效地減小證據之間彼此支持度較小的證據對合成結果的影響。
最后,仍利用Dempster 組合規則合成轉換后的基本概率賦值mεi:

改進的合成公式不僅擁有傳統的證據理論中Dempster 合成公式的優勢,而且還包含了各證據在證據合成過程中的重要程度。這樣可以提高D-S 證據理論合成的結果的可靠性,并且與實際相符合。
本文將用以下規則進行最后融合結果的目標判定。
①最后判定的目標對應的基本概率賦值必須是最大的。
②最后判定的目標對應的基本概率賦值與其他目標的基本概率賦值之差必須大于本文設置的下限σ1。
③不確定集合對應的基本概率賦值m(Θ)必須小于所設定的上限σ2。其中,Θ 為不確定集合。
④最后判定的目標對應的基本概率賦值必須大于不確定集合基本概率賦值m(Θ)。
光伏陣列故障參量和故障特征屬于非線性一一映射關系。D-S 證據融合算法是利用不同證據之間的基本概率值進行證據融合,以解決不確定性的信息。但證據之間可能存在高沖突。因此,需要先解決證據之間高沖突的問題,再建立目標判定規則,最后實現故障診斷。光伏陣列故障診斷流程如圖1 所示。

圖1 光伏陣列故障診斷流程圖Fig.1 Fault diagnosis process of PV array
在試驗室外搭建一個小型的光伏陣列測試平臺。此次光伏發電測試平臺由10 塊光伏板搭建成兩個2×2 的陣列和一個2×1 的陣列串聯而成,一塊光伏板開路電壓為21 V,短路電流為2 A,功率為50 W。根據光伏陣列發電試驗,建立光伏陣列故障診斷中短路故障的識別框架Θ={A=陰影遮擋,B=組件短路,C=組件老化}。對應光伏陣列短路故障識別框架的證據如下。
①Z1:組件溫度升高。
②Z2:輸出功率增大。
③Z3:電流緩慢增大。
④Z4:故障點因過熱而損壞。
依據光伏電站以及試驗室搭建的小型光伏陣列測試出的200 組數據,由專家經驗以及大量的光伏陣列發電測試試驗數據分析,對每條證據的焦元進行基本概率賦值。
①Z1:m1(A)=0.6,m1(B)=0.1,m1(C)=0.3。
②Z2:m2(A)=0,m2(B)=0.8,m2(C)=0.2。
③Z3:m3(A)=0.7,m3(B)=0.2,m3(C)=0.1。
④Z4:m4(A)=0.6,m4(B)=0.2,m4(C)=0.2。
利用本文的方法對這4 條證據進行沖突計算,并將計算結果與傳統的沖突計算進行對比。證據沖突系數對比如圖2 所示。

圖2 證據沖突系數對比示意圖Fig.2 Evidence conflict coefficient contrast
由圖2 中的數據對比可知,利用傳統的方法描述證據沖突時存在著不一樣的缺點。沖突系數K描述證據1、3、4 之間的沖突都在0.50 以上,與實際不符。Pignistic 概率距離描述證據沖突時,證據1 和2 以及證據2 和3 之間的證據沖突是一樣的,但從證據源的概率知證據1、3 支持A 的概率程度是不一樣,所以也存在問題。Jousselme 證據距離描述證據之間的沖突時符合實際,但是與本文方法描述證據沖突對比可知,本文方法在描述證據沖突時能更有效地描述證據之間的沖突。由本文方法計算到證據2 與證據1、3、4 之間的沖突較大,沖突分別達到了0.87、0.84、0.80。除此之外,其他證據之間的沖突程度都比較小(在0.25 以下),符合實際情況。由此可知,這4 條證據之間存在高沖突。
為了驗證本文方法的有效性以及改進的效果,下面對上述獲取的基本概率賦值,分別使用經典Dempster 規則融合方法、Yager 算法、郭華偉算法、胡昌華算法和本文方法進行證據融合,并對證據融合結果作比較分析。
若取上限值σ1=0.050 0、σ2=0.700 0,根據目標判定規則,可得到5 種算法證據融合結果如表1 所示。

表1 5 種算法證據融合結果Tab.1 5 algorithms evidence fusion results
由表1 可知,采用Dempster 規則、Yager 算法進行證據融合,其識別結果是錯誤的。對于Dempster 規則而言,是傳統的證據理論融合方法無法融合高沖突證據;對于Yager 算法而言,不確定命題的基本概率m(Θ)大于所設定的σ2=0.700 0,因此識別結果是無法判斷的。這主要是因為Yager 算法將支持沖突的基本概率都歸納為未知命題。表1 中,郭華偉算法、胡昌華算法以及本文方法的融合結果識別目標都是正確的。但本文方法的識別精度很大程度上高于其他算法,且收斂快。因此,利用本文方法進行證據融合,其融合結果相對于傳統的方法更可靠、更具有可信度。由本文方法可知,當證據集中有3 個證據時,就能夠快速、準確地融合到正確的結果。結合證據集中的4 個證據可知,證據2 應該是干擾數據,與其他的證據相互存在著很大的差別。本文利用改進的Q和信息熵改進的權重系數,極大地減少了一些干擾證據對證據融合結果的影響,并且有著很強的抗干擾能力和收斂速度快等特點;而且此方法極大地加強了D-S 證據合成結果的準確性和可靠性。從表1 還可知,當證據集中支持A的證據越來越多時,收斂速度會越來越快,融合結果也會越來越可靠。
針對光伏陣列故障有大量不確定性的問題,本文利用D-S 證據理論具有處理不確定性信息能力的優點,建立了光伏陣列故障特征的基本概率賦值函數,并將其隸屬度的值作為證據理論融合的基本概率賦值,從而有效找出光伏陣列故障的原因。該方法的基本隸屬度的確定是由歷史數據和經驗賦值產生的,不需用大量的樣本數據去訓練。該方法利用改進的D-S 證據理論解決故障特征不確定信息,可以在證據相對較少的情形下快速融合證據并得到正確的結果、提高收斂速度并減少高沖突證據帶來的決策缺陷。與此同時,該方法極大程度地提高了融合證據沖突的情況下融合結果的可信度,有效提高了光伏陣列故障診斷的準確性和靈敏性,減少了光伏陣列故障帶來的損失。