中圖分類號:TM411 文獻標志碼:A 文章編號:1672-1098(2025)02-0001-09
引文格式:,,.改進蜣螂優化 XGBoost 的變壓器故障診斷研究[J].安徽理工大學學報(自然科學版),2025,45(2) :1-9.
Transformer Fault Diagnosis Based on Idbo-optimized XGBoost LI Hongyue,LI Chunyu ,LI Tao
(Scholof Electricaland Information Engineering,Anhui UniversityofScienceandTechnology,Huainan Anhui 232Ool,Chna) Abstract:Objective To address the problems of difficulty in selecting key parameters for extreme gradient boosting(XGBoost),and the dung beetle optimizer(DBO)being prone to local optima,which lead to low accuracy in transformer fault diagnosis. Methods By using 14- dimensional gas feature vectors as input,a transformer fault diagnosis model based on IDBO-optimized XGBoost was proposed.Firstly,to improve the algorithm's optimization capability,the four stages of the DBO algorithm were improved by Tent chaos mapping,adaptive spiral strategy, Cauchy-Gaussian mutation,and T-disturbance.Then,by comparative optimization tests with the original DBO, grey wolf optimizer(GWO),sparrow search algorithm (SSA) and whale optimization algorithm(WOA),the superiority of the IDBO algorithm was demonstrated.Finally,in fault diagnosis comparative experiments,the IDBOXGBoost model was compared with XGBoost models optimized byusing DBO,SSA and GWO,as well as with multiple machine learning methods optimized by using DBO and the IEC standard method.Results The results showed that the IDBO-XGBoost model achieved an accuracy of 91.76% and a Kappa coefficient of O. 900 8, which demonstrated better fault diagnosis effectiveness.Conclusion The IDBO-XGBoost model can effectively improve fault diagnosis accuracy,providing an effective solution for transformer fault diagnosis.
Key words : transformer;fault diagnosis;dung beetle optimizer; XGBoost
電力變壓器作為電力系統中重要的一環,其穩定運行對系統正常工作具有關鍵性作用。變壓器檢修和故障診斷技術的發展對保障電力系統正常、穩定運行具有重大意義[1]
長期運行情況下,變壓器會發生電、熱等故障導致多種氣體溶解于變壓器油中且穩定存在[2]。因此,溶解氣體分析(dissolved gas analysis,DGA)法逐漸成為變壓器故障診斷的一種主流、有效的方法[3-4]。在DGA 技術的基礎之上,傳統診斷方法不斷發展,如常見的IEC三比值法、大衛三角法、無編碼比值法等,但傳統方法存在缺碼、臨界過大等問題,實際工程應用中有很大的局限性[5-6]。隨著人工智能技術的發展,基于DGA技術與機器學習結合的智能變壓器故障診斷方法也得到快速發展,如支持向量機(support vector machine,SVM)、隨機森林(randomforest,RF)LogitBoost等方法廣泛被學者應用于變壓器故障診斷,文獻[7]提出改進禿鷹算法優化SVM實現變壓器故障診斷模型;文獻[8]通過天鷹算法優化RF模型實現故障診斷;文獻[9]利用LogitBoost集成多顆決策樹并采用鯨魚算法對關鍵參數進行尋優,進而搭建故障診斷模型。但SVM易受到不平衡樣本影響;RF在訓練中容易過擬合;LogitBoost的訓練時間較長。極端梯度提升(extreme gradient boosting,XGBoost)是對梯度提升樹(gradient boosting decision tree,GBDT)優化后的同質集成算法,其通過對多個分類回歸樹(classification and regression tree,CART)基分類器進行集成得到一個強分類器,模型受不平衡樣本的影響較小和具有較快的訓練速度的優點,被學者廣泛的應用于故障診斷當中,但又因超參數過多,人工尋參過于繁瑣,不易找到最優超參數。目前,針對超參數的主流尋優方法是采用智能尋優算法,文獻[10]提出改進麻雀算法優化XGBoost實現變壓器診斷模型,尋優算法的改進與XGBoost結合為變壓器故障診斷提供一種思路。
綜上,針對XGBoost超參數難以選取造成的變壓器故障診斷精度低及蜣螂優化算法(dungbeetleoptimizer,DBO)易陷人局部最優的問題,本研究提出一種改進蜣螂優化算法(improved dung beetleoptimizer,IDBO)優化XGBoost的變壓器故障診斷模型。首先,通過使用Tent混沌映射、自適應螺旋、柯西-高斯變異及T擾動對DBO進行改進,并與原始DBO、灰狼算法(grey wolf optimizer,GWO)、麻雀算法(sparrow search algorithm,SSA)、鯨魚算法(whale optimization algorithm,WOA)進行尋優對比實驗,驗證IDBO的尋優能力;其次,將14維特征量作輸入,采用IDBO對XGBoost的超參數進行尋優,搭建IDBO-XGBoost的變壓器故障診斷模型;最后,將IDBO-XGBoost 模型與 DBO、SSA、GWO優化的XGBoost和DBO優化的多種機器學習和IEC方法進行對比實驗,以驗證本文模型的有效和可行性。
1 DBO算法
DBO算法是一種模仿蜣螂的覓食尋找最優位置的新算法[],包括蜣螂的滾球、繁殖、覓食和偷竊行為。種群和更新策略的多樣化使DBO算法能更好地找到最優解,不同行為的蜣螂位置更新規則如下:
滾球蜣螂的位置更新如下
xit+1=xit+β?K?xit-1+b?∣xit-xw∣
式中, xit 表示當前迭代時第 i 個滾球蜣螂個體的位置; β 表示依據概率賦予1或-1的自然常數: K 表示偏轉系數, ∈(0,0.2];b 表示常數, Ψ∈(0,1);xw 表示全局最差的位置。
當滾球蜣螂遇到障礙物時,轉變為跳舞蜣螂,位置更新如下
xit+1=xit+∣xit-xit-1∣tanθ
式中, θ 表示偏轉角,取值在 [0,π] 。
繁育蜣螂的位置更新如下:

式中, Xlbest 表示局部最優解; R=1-t/Tmax , Tmax 表示最大迭代次數; Ub1 和 Lb1 分別表示產卵區的上、下限; Ub 和 Lb 分別表示問題優化的上、下邊界; b1 和b2 分別表示 1×D 維的獨立隨機向量。
覓食蜣螂的位置更新如下

xit+1=xit+C1?(xit-Lbg)+C2?(xit-Ubg)
式中, Xgbest 表示全局最優解; C1 表示正態分布的隨機數; C2 表示 1×D 維的隨機向量; Ubg 和 Lbg 分別表示覓食區的上、下限。
偷竊蜣螂的位置更新如下
xit+1=Xgbest+S?g?(∣xit-Xgbest∣+∣xit-Xlbest∣)
式中, s 表示常數; g 表示 1×D 維正態分布的隨機向量。
2 DBO算法改進
2.1 Tent映射
DBO中蜣螂的初始位置是隨機的,易導致個體位置分布不均、種群多樣性低,使算法陷入局部最優。因此,使用Tent混沌映射對種群進行初始化,提升種群的均勻度和多樣性,提高算法的搜索能力。
Tent混沌映射描述如下

式中, xm+1i?xmi 表示混沌序列; i 表示種群規模; m 表示空間維度。
2.2 自適應螺旋策略
自適應螺旋策略是受到鯨魚算法中螺旋策略的啟發[12-13],在螺旋策略中引入自適應螺旋形狀動態系數 c ,解決螺旋策略易受到螺旋形狀參數過大或過小的影響。在算法迭代過程中使用自適應螺旋策略代替式(2)的位置更新,能更好地增加蜣螂的多樣性、彌補了滾球蜣螂位置更新中只依賴最差位置的弊端及促進蜣螂種群之間的信息傳遞,自適應螺旋策略的更新公式如下

式中,
: l 表示[-1,1]的隨機數。
改進后的滾球蜣螂位置更新如下

式中, ST 表示(0.5,1]的隨機數; α=rand(0,1) 。
2.3柯西-高斯變異及T擾動策略
原始DBO算法中,蜣螂在迭代的過程中會不斷朝最優的位置聚集,所有蜣螂個體會易快速同化,導致最優停滯情況。繁殖蜣螂和偷竊蜣螂的位置分別依賴局部和全局最優位置的信息進行更新,但受種群同化的影響,不一定會找到最優的繁殖和偷竊的位置。因此,改變傳統擾動形式,在式(5)和式(9)中加入柯西-高斯變異,增加繁殖、偷竊種群和路線的多樣性同時,使其更規律性的朝最優個體靠近,跳出最優停滯,公式如下


式中, Xnewit+1 表示擾動后的位置, C=μlcauch(σ)+
caucl u(σ).Gauss(σ) 分別表示柯西、高斯隨機變量的變異算子。
覓食蜣螂采用T分布擾動,跳出局部最優,位置更新如下

式中, t(iter) 表示以迭代次數為自由度的T擾動。
上述擾動方式均可增強算法跳出局部最優的能力,但無法確定進行擾動后的個體位置是否比原來的位置更優,因此,引入貪婪規則,以確定是否進行擾動 I(X) 表示 X 位置的適應度值。貪婪規則如下

2.4 IDBO尋優性能測試
為測試改進DBO算法的尋優效果,經典測試函數中選取8個進行IDBO尋優,測試IDBO的尋優能力。測試函數信息見表1。

除DBO以外,還選取了GWO[14]、SSA[15]WOA3種廣泛應用的優化算法作為對比;為確保測試結果的可靠性,5個算法的迭代次數設置為500,種群規模為30,獨立運行30次,統計最優值(Best)、平均值(Mean)、標準差(Std)作為算法測試的評價標準,來驗證IDBO算法的優越性;評價標準的值越小,代表改進策略效果越明顯。5種優化算法的測試結果如表2所示,平均適應度曲線見圖1。



由表2和圖1可知,IDBO在函數F1、F3、F9和F11都能尋到理論的最優值0,在F2、F4、F7上的最優值也比其他的算法高出幾到上百個數量級;雖然在F9、F1O、F11上IDBO和部分其他算法都可找到相同最優值,但從圖1的迭代曲線可看出IDBO的收斂速度遠超過其他算法,其他算法陷入局部最優的次數更多、尋優速度較慢;證明了IDBO尋優能力的有效性和可行性。
3 IDBO-XGBoost的故障診斷
3.1 XGBoost原理
XGBoost是對傳統GBDT算法的優化,支持多種基分類器,一般選擇樹模型為基分類器構成集成學習分類器[16]。相比GBDT,XGBoost將損失函數按二階泰勒展開,并在損失函數中加入正則化以防止過擬合。通過每次迭代的預測殘差構建新的樹模型并不斷修正前一代的誤差,最終提升模型的預測準確率。
對于有 n 個樣本
個特征的數據集,模型最終故障診斷結果如下

式中,
表示最終的預測結果 ?fk 表示每一個獨立的CART; k 表示樹的數量; F 表示所有CART的集合。
加入正則化XGBoost模型的目標函數如下

式中,
表示損失函數; n 表示樣本的數量; Ω(fk) 表示正則項,公式如下

式中, T 表示節點數; γ,λ 表示懲罰因子; wj 表示葉子權重。
XGBoost模型采用加法學習的方式進行疊加訓練,使 Obj 隨著迭代次數的增加朝最小值不斷趨近。因此,第 χt 次迭代的預測值如下

3.2 基于IDBO-XGBoost故障診斷模型
XGBoost模型分類效果的好壞與其眾多的超參數相關[17],為提升XGBoost對變壓器故障診斷的效果,采用IDBO算法優化XGBoost的超參數,但對全部超參數優化對硬件要求較高,運行時間過長。最終選擇對XGBoost模型分類效果影響最重要的6個超參數進行優化,對應的超參數和搜索范圍如表3所示。

IDBO-XGBoost故障診斷模型流程圖如圖2所示,具體步驟如下:
1)對變壓器的DGA數據進行歸一化處理,確定模型的輸人和輸出參數,并將數據集按照一定比例劃分為訓練集和測試集;2)設定蜣螂算法和XGBoost模型的相關超參數范圍,并用式(10)混沌映射初始化種群;3)更新模型參數,計算當前蜣螂位置下所有個體的適應度值及其對應位置;4)根據式(13)更新滾球蜣螂的位置,并計算最優的適應度值及其對應的位置信息;5)根據式(5)和(14)式(8)和(16)式(9)和(15)分別更新和擾動繁殖、覓食、和偷竊蜣螂的位置,再利用貪婪算法確定蜣螂個體是否進行擾動;6)計算蜣螂個體新位置對應的適應度值,更新最優和最劣的適應度值及其對應位置;7)判斷是否滿足 t

4算例分析
4.1 數據處理和特征選取
根據IEC60599定則,將變壓器故障類型分為正常(N)、低能放電(D1)、局部放電(PD)、高能放電(D2)、中低溫過熱(T1T2)以及高溫過熱(T3),對應編號定為0\\~5。變壓器DGA數據集來源文獻[18-19],隨機抽取了425組,保證了數據的普適性,按 8:2 比例劃分為訓練集和測試集,分布情況如表4所示。

文獻「20]研究表明,無編碼比值和5原始特征量組合的14維特征量作模型的輸入,蘊含故障的特征信息更多,模型故障診斷效果更好,所以選擇14維特征量作模型的輸入。但為消除不同數據之間的差異帶來的不利影響,需對數據集歸一化處理。歸一化公式如下

式中, ??xi 表示原始數據; xmin 和 xmax 分別表示原始
數據的最小和最大值。
4.2 IDBO-XGBoost診斷模型驗證
利用軟件對IDBO-XGBoost模型進行代碼搭建,按照表3對XGBoost模型參數進行設置,將14維特征量輸入模型,使用IDBO算法對6個參數進行尋優。為驗證診斷模型的效果,IDBO算法的迭代次數設為45,種群數為30,執行IDBO算法尋優的流程。
IDBO-XGBoost模型的最佳適應度和平均適應度值的迭代曲線如圖3(a)所示。由圖3(a)可知,隨著迭代次數的增加,診斷模型的準確率逐漸增加,在第3次迭代時,陷入局部最優并在第19次迭代時跳出局部最優,最終在20次迭代時模型的準確率趨于穩定。
IDBO-XGBoost模型的診斷混淆矩陣結果如圖3(b)所示。由圖3(b)可知,85個測試樣本下,預測正確的樣本為78個,誤判的樣本為7個。IDBO-XGBoost模型的預測準確率為 91.76% ,此時模型的超參數組合為n_estimators =463 ,learning_rate
0.26,max_depth =19 ,subsample =0.24 ,colsample_bytree =0.10,gamma=1.37 。
本文選擇準確率(accuracy,ACC)和Kappa系數作為模型效果的評價指標,具體定義見文獻[21]。

4.3 不同尋優算法優化XGBoost模型的分析
將IDBO-XGBoost與 DBO-XGBoost、SSA-XG-Boost、GWO-XGBoost進行對比,得到的結果如表5所示。由表5可知,IDBO-XGBoost模型的ACC和Kappa系數均高于其他算法模型,ACC相比其他模型提升了 4.7%.5.88%.5.88% ;Kappa系數提升了 0.057 2.0.070 8.0.071 1 。實驗證明了IDBO算法跳出局部最優的能力是有效的。
4.4 不同故障診斷模型的分析
為證明XGBoost模型的有效性,將IDBO-XG-Boost 模型與IEC、DBO-KNN、DBO-SVM、DBO-RF、DBO-GBDT多種方法進行實驗比較,結果如表6所示。


由表6可知,IDBO-XGBoost模型相比IEC、KNN、SVM、RF、GBDT,ACC提升了 35.05%.16.47%.8. 23% .5.88% .5.88% ,Kappa系數提升了 0.400 8.0 1989.0655.0.071.0.0707 。說明IDBO-XGBoost模型對故障的診斷效果更好。
5 結論與展望
為提高XGBoost變壓器故障診斷模型的準確率,提出了一種IDBO-XGBoost的故障診斷模型并通過14維DGA數據對模型進行實驗驗證。采用Tent混沌映射、自適應螺旋策略、柯西-高斯及T擾動策略改進的DBO具有更好的尋優效果和收斂速度;利用IDBO對XGBoost模型的關鍵參數進行尋優,有效地提升了XGBoost模型對變壓器故障分類的準確率;并與DBO-XGBoost、SSA-XGBoost、GWO-XGBoost,DBO-GBDT、DBO-RF、DBO-SVM、DBO-KNN、IEC方法進行對比實驗,結果表明本文模型的故障診斷準確率為91. 76% 、Kappa系數為0.9008,綜合準確率和Kappa系數更好,具有一定的理論意義和工程應用價值。
但本研究沒有考慮到不平衡樣本對故障精度的影響,未來重點研究如何均衡樣本或在不平衡樣本的情況下改進診斷模型減小類不平衡帶來的影響,進一步提升變壓器故障診斷的精度
參考文獻:
[1]李雷軍,吳超,付華,等.基于油中溶解氣體分析的ISSA優化LSSVM變壓器故障診斷研究[J].電工電能新術,2023,42(10):84-94.
[2] LIJ,LI G,HAI C,etal. Transformer faultdiagnosisbased on multi-class AdaBoost algorithm[J]. IEEE Ac-cess,2021,10:1522-1532.
[3] 王艷,李偉,趙洪山,等.基于油中溶解氣體分析的DBN-SSAELM變壓器故障診斷方法[J].電力系統保護與制,2023,51(4):32-42.
[4] 宋輝,苑龍祥,郭雙權.基于數據增強和特征注意力機制的灰狼優化算法-優化殘差神經網絡變壓器故障診斷方法[J].現代電力,2024,41(2):392-400.
[5] ZHANG M,CHEN W.Fault diagnosis of power trans-formerbased on SSA—MDS pretreatment[J].IEEE Ac-cess,2022,10:92505-92515.
[6]方濤,錢曄,郭燦杰,等.基于天牛須搜索優化支持向量機的變壓器故障診斷研究[J.電力系統保護與控制,2020,48(20):90-96.
[7]周曉華,馮雨辰,陳磊,等.改進禿鷹搜索算法優化SVM的變壓器故障診斷研究[J].電力系統保護與控制,2023,51(8):118-126.
[8]葉育林,劉森,黃松,等.基于GJO 特征量優選的 AO-RF的變壓器故障診斷模型[J].高壓電器,2024,60(5) :99-107.
[9]張國治,陳康,方榮行,等.基于DGA與鯨魚算法優化Logit Boost-決策樹的變壓器故障診斷方法[J].電力系統保護控制,2023,51(7):63-72.
[10]王雨虹,王志中.基于RFRFE與 ISSA-XGBoost 的變壓器故障辨識方法[J].電子測量與儀器學報,2021,35(12) :142-150.
[11]XUE J,SHEN B. Dung beetle optimizer:A new meta-heu-ristic algorithm for global optimization[J].The Journal ofSupercomputing,2023,79(7) :7 305-7 336.
[12]MIRJALILI S,LEWIS A. The whale optimizationalgo-rithm[J]. Advances in engineering software,2016,95(5) :51-67.
[13]王穎超.鯨魚優化算法研究與應用進展[J].計算機工程與科學,2024,46(5):881-896.
[14]MIRJALILI S,MIRJALILI S M,LEWIS A. Grey wolfoptimizer[J]. Advances in engineering software,2014,69(3) :46-61.
[15]XUE J,SHEN B.A novel swarm intelligence optimiza-tion approach: sparrow search algorithm[J]. Systemsscience control engineering,2020,8(1) :22-34.
[16]龔澤威一,饒桐,王鋼,等.基于改進粒子群優化XGBoost 的變壓器故障診斷方法[J].高壓電器,2023,59(8) :61-69.
[17]JINYANG J,ZHI L,PENGBO W,et al. Improved CrowSearch Algorithm and XGBoost for Transformer FaultDiagnosis[J]. Journal of Physics : Conference Series,2023,2 666(1) :012040.
[18]尹金良.基于相關向量機的油浸式電力變壓器故障診斷方法研究[D].保定:華北電力大學,2013.
[19]DUVAL M,DEPABLA A. Interpretation of gas-in-oilanalysis using new IEC publication 6O599 and IEC TC10 databases[J]. IEEE Electrical Insulation Magazie,2001,17(2) :31-41.
[20]榮智海,齊波,李成榕,等.面向變壓器油中溶解氣體分析的組合DBN 診斷方法[J].電網技術,2019,43(10) :3 800-3 808.
[21]王雪,韓韜.基于貝葉斯優化隨機森林的變壓器故障診斷[J].電測與儀表,2021,58(6):167-173.
(責任編輯:丁 寒)