吳俊宏,張 印,李 莎,周 杰,吳 松,王金磊
(雅礱江流域水電開發有限公司二灘水力發電廠, 四川 攀枝花 617000)
目前將深度學習技術引入電力線路故障診斷領域已經取得了一定的成效[1]。然而,對深度學習模型進行訓練需要用到大量的故障數據,如果用于訓練的故障數據不能滿足要求,將會導致模型的性能嚴重下降[2]。近年來,隨著深度學習的廣泛應用,遷移學習也受到了越來越多的關注[3]。遷移學習可以把深度學習模型在某一領域中學習到的知識遷移到另一相關領域中,這樣可以使深度學習模型在數據不足的情況下仍能在新領域具備良好的性能[4]。為了使訓練出的LSTM 故障診斷模型具有良好的可遷移性,本文將結合遷移學習的理論和LSTM 深度學習模型,提出了基于遷移LSTM(T-LSTM)模型的電力線路故障診斷方法。
在現實生活中,想要獲取如此多數量的帶標注的數據是十分困難的,即使能夠獲取,也需要花費大量的人力物力。除此之外,不同應用場景下的數據分布是存在一定差異的,想要用一個通用的深度學習模型來滿足不同應用場景下的使用需求是非常困難的。即使擁有足夠用于訓練的標注數據,但是要從頭訓練一個復雜的深度網絡模型是十分耗時的。因此,為了解決標注數據缺乏、數據分布差異和訓練過程耗時的問題,提出了遷移學習的概念。在遷移學習中,對“域”和“任務”的數學定義分別如式(1)和式(2)所示:
式中,x表示域中樣本的特征空間,P(X)表示邊際概率分布,其中,X滿足X={x1,x2,...,xn}∈x;y代表標簽空間,f(g)為目標預測函數。
所謂的遷移學習,就是將深度學習模型從一個或者多個源域Ds的任務Ts中學習和提取到的有用知識和經驗用在新的目標域DT的任務TT上。簡單來說,就是將對于某一個問題訓練好的模型通過對其進行簡單地調整,使其同樣能夠在一個新的問題上表現出良好的性能。
當對模型進行遷移學習時,其中一個關鍵的問題就是負遷移。負遷移不僅不會對遷移模型在目標域任務上的表現有任何幫助作用,反而會影響其在目標域任務上所表現出的性能。因此,在進行遷移學習之前,對源域數據和目標域數據的分布進行相似性計算是非常有必要的。
本文將用來對模型進行預訓練的線路稱為源線路,將應用遷移訓練后的模型進行故障診斷的線路稱為目標線路。為了檢驗源線路與目標線路故障數據分布之間的相似性,本文使用最大均值差異(MMD)的方法來計算源線路與目標線路故障數據分布之間的相似性。然后,選取與目標線路故障數據相似性最大的源線路對應的預訓練模型,并對其進行遷移訓練。
對于一個滿足p分布的樣本集X={x1,x2,...,xn}和一個滿足q分布的樣本集Y={y1,y2,...,yn},通過尋找在樣本空間上的映射函數f,計算出兩個分布的樣本在函數f上的均值,通過將兩個均值相減,即可求出兩個分布對應于f的均值差異。當找到某一個f使得這個均值差異有最大值時,就得到了MMD 值。MMD 的計算表達式如式(3)所示:
式中,sup(g)表示求上界,Ex~p和Ey~q表示均值,F表示在樣本空間上的函數集合。
設源線路的故障樣本和目標線路的故障樣本分別對應分布p和q,X和Y則分別表示從源線路和目標線路上采集得到的兩個短路故障數據集,數據集的大小分別為m和n。可以得出MMD 的經驗估計表達式如式(4)所示:
V'MMD[X,Y]的值越小,就表示源線路的故障數據和目標線路的故障數據分布相似性越大,當V'MMD[X,Y]=0 時,則表示兩個數據集來自同一分布。反之,當V'MMD[X,Y]的值越大時,則表示源線路的故障數據和目標線路的故障數據分布差異越大。
在對線路故障診斷的研究中,本文提出了基于LSTM 深度網絡模型的故障診斷方法[5]。用于線路故障診斷的LSTM 深度網絡模型的結構見圖1。

圖1 LSTM 深度網絡模型的結構
該模型包含了2 個具有64 個隱藏單元的LSTM層。在LSTM 層后設置了一個展平層,用于從LSTM層到全連接層的過渡。展平層可以獲取LSTM 層最后一個記憶單元的輸出并將其平鋪成一維向量。在展平層后設置隱藏單元為128 的全連接層,使用ReLU函數作為該層的激活函數。最后使用一個隱藏單元為10 的全連接層作為分類層,使用Softmax 函數作為激活函數輸出0 到1 的值,實現對線路故障的診斷。
在深度網絡模型的訓練過程中,對于有q個樣本的訓練集,將前向傳播迭代輸出的向量Y'i與故障樣本真實的標簽向量Yi的均方誤差值作為損失函數的函數值J,其計算公式如式(5)所示。
然后,使用基于梯度下降的Adam 優化算法[6],將損失值和損失函數的梯度反饋到網絡以更新權重和偏差,從而達到訓練深度網絡的目的。
為保證訓練時網絡能夠更好的收斂到最優值,這里使用指數衰減學習率[7],使學習率隨著訓練的迭代輪次增加而減小,其表達式如式(6)所示:
其中:η0表示初始學習率;RD為衰減率;NB為一個訓練批次中的樣本數;ST為訓練迭代的輪次;q為訓練集總的故障樣本數;η表示經過ST輪訓練后的學習率。
其訓練和驗證過程中損失值與正確率的迭代圖如圖2 所示。

圖2 模型訓練過程中的損失值與正確率迭代圖
從圖2 中可以看出,算法在訓練集和驗證集上的損失值均在下降,故該模型沒有出現過擬合的現象。此外,在經過500 個迭代周期的訓練后,總體的識別準確率均可以穩定在100%。
根據遷移學習的相關理論,本文在LSTM 模型的基礎上,提出了使用經過遷移訓練的LSTM(T-LSTM)模型來對輸電線路短路故障進行故障診斷的方法。T-LSTM 故障診斷模型的原理框圖如圖3 所示。

圖3 T-LSTM 故障診斷模型的原理框圖
根據圖3 可知,基于T-LSTM 模型的故障診斷方法主要包含了以下3 個步驟:
(1)在仿真平臺上搭建電力線路仿真模型,通過改變電力線路中的電壓等級、線路長度和線路單位長度的電阻、電感、電容等參數,分別建立起源線路和目標線路的仿真模型。再分別對源線路和目標線路在不同工況下進行短路故障仿真,來分別獲取源線路的故障樣本和少量目標線路的故障樣本,并將其制作成數據集;
(2)根據本文第2 節中所提到的方法計算每條源線路和目標線路的故障數據分布的相似程度,選擇與目標線路相似度最大的源線路,并使用該源線路的故障數據集對LSTM 模型進行預訓練,從而得到經過預訓練后的LSTM 故障診斷模型;
(3)使用少量目標線路的故障樣本來對經過預訓練后的LSTM 模型進行遷移訓練,來獲得經過遷移訓練過后的LSTM(T-LSTM)模型,并將T-LSTM模型用于對目標線路進行故障診斷。
利用仿真平臺搭建輸電線路故障仿真模型,分別建立起源線路和目標線路的仿真模型。本文分別搭建了3 條源線路和1 條目標線路的仿真模型,每條輸電線路的具體參數如表1 所示。

表1 源線路和目標線路的系統參數
根據表1 中的參數搭建起輸電線路的仿真模型后,在各條源線路和目標線路的仿真模型上,對不同故障類型、不同故障位置、不同故障阻抗和系統兩端電源不同相位差的各種參數組合進行故障仿真,來分別獲取源線路的故障樣本和少量目標線路的故障樣本,并將其制作成故障數據集。這里采集的故障數據同樣是故障發生后一個周期內三相故障電流序列,采樣頻率為20 kHz。
由于源線路和目標線路的故障數據分布存在一定的差異,為了防止在遷移訓練的過程中出現負遷移的問題,使用本文第2 節所述的MMD 來計算每條源線路和目標線路故障數據分布的相似程度,選擇與目標線路故障數據相似度最高的1 條源線路,并對使用該源線路故障樣本預訓練后的LSTM 模型進行遷移訓練。
在對LSTM 模型進行預訓練的過程中,源線路的短路故障樣本為1 350 組,目標線路的故障樣本為540 組。由于本文中的3 條源線路和目標線路故障數據之間的MMD 值相近且數值較小,不存在負遷移的問題,故選擇源線路L1的故障樣本對模型進行預訓練。在預訓練模型的基礎上,使用少量的目標線路的短路故障樣本對模型進行遷移訓練,最終得到T-LSTM 模型。并使用目標線路的測試集樣本對T-LSTM 模型的性能進行測試。
在T-LSTM 模型的整個訓練過程中,預訓練的迭代次數設置為500,遷移訓練的迭代次數設置為100。除此之外,遷移訓練中使用的目標線路的故障樣本數量會對模型最終的診斷準確率產生較大的影響。這里將用于模型遷移訓練的目標線路故障樣本數量與用于模型預訓練的源線路故障樣本數量的比值稱為微調率。圖4 展示了在不同的微調率下,T-LSTM 模型在目標線路的測試集上故障診斷正確率的變化情況。

圖4 不同微調率下T-LSTM 模型診斷正確率的變化
從圖4 中可以看出,當微調率為0 時,即沒有對模型進行遷移訓練時,模型在目標線路上的故障診斷正確率僅為81.11%。隨著微調率的升高,T-LSTM模型的故障診斷準確率也隨之得到提升。當微調率達到10%時,T-LSTM 模型在目標線路上的故障診斷正確率能夠達到100%。由此可以得出,和沒有經過遷移學習的LSTM 模型相比,T-LSTM 故障診斷模型具有更好的可遷移性,能夠在新的目標線路的故障診斷問題上表現出更加良好的性能。
為了更好地驗證本文所提出的故障診斷模型在實際線路故障時的診斷準確率,這里使用了某大型水電站某線路發生單相接地故障時的故障錄波數據對該故障診斷模型的性能進行驗證。該線路發生故障時的故障錄波波形如圖5 所示。

圖5 某水電站線路發生單相接地故障時故障錄波波形
截取該線路故障發生后一個周期內的三相電流信號作為故障特征信號,經過前向傳播計算,故障診斷模型輸出一個表示短路故障類型的多維向量。針對該線路的故障,經故障診斷模型計算后,輸出的向量 為Y'=[0.99 0.00 0.00 0.00 0.00 0.01 0.00 -0.01 0.01 0.00]。其中,輸出的十維向量Y'中,不同的數字代表該故障診斷模型將此故障診斷為10 種故障類型時分別對應的概率。
通過輸出的向量可以看出,故障診斷模型將該線路故障診斷為A 相接地故障的概率為99%,因此,診斷該線路故障類型為A 相接地短路,與線路實際故障情況一致。
經過實例驗證,該方法能夠對實際電力線路的故障類型準確地進行診斷。
本文闡述了基于T-LSTM 模型的故障診斷方法,并對其進行了可遷移性研究。首先,結合遷移學習的相關理論,提出了使用T-LSTM 模型來對目標線路進行故障診斷的方法。在對LSTM 模型進行遷移訓練的過程中,提出了使用MMD 算法來對源線路和目標線路故障數據的相似性進行計算,選出與目標線路相似性最高的源線路所對應的預訓練模型,并使用目標線路的訓練集樣本對其進行遷移訓練。然后,使用目標線路的測試集故障樣本對T-LSTM 模型進行測試。通過實驗驗證,當遷移訓練的微調率為10%時,T-LSTM 模型在目標線路上的故障診斷正確率能夠達到100%,并且能夠對實際電力線路的故障進行準確地診斷;而當微調率為0 時,即沒有對模型進行遷移訓練時,傳統的LSTM模型在目標線路上的故障診斷正確率僅為81.11%。因此,表明了在目標線路故障樣本較少的情況下,T-LSTM 僅需少量目標線路的故障數據對預訓練模型進行微調,即可構建適用于目標線路的故障診斷模型。