路 建,李 勇,王宗收,郝崇清
(1.河北張河灣蓄能發電有限責任公司,河北石家莊 050300;2.河北科技大學電氣工程學院,河北石家莊 050018)
主站發電機是抽水蓄能發電站核心運行單元,然而發電機組設備在長期運行時存在下導瓦間隙偏小、冷卻器容量不足、透平油老化、雜質混入等風險隱患[1]。對一些長期緩慢變化的趨勢信息,如發電機瓦溫等,采用機器學習算法和大數據處理方法對生成的報表數據進行分析,進而實現故障監測和潛在風險預警,對提高整個系統的穩定性和可靠性,以及給監控系統國產化改造提供了很好的范本,具有很好的推廣意義。
基于機器學習的故障監測方法,目的在于通過不同故障模態下信號傳感器采集的數據信息,訓練學習得到一個數據與故障之間的數學模型,并通過該模型對后測數據進行實時監測,以確定故障類型和時間,其中隨機森林、決策樹、神經網絡、支持向量機等方法已越來越多地應用到各類故障檢測和診斷領域[2-5]。李兵等[6]利用一種改進的隨機森林算法,在考慮漏報率的基礎上提出了電機軸承故障診斷決策方法;鄭日暉等[7]提出了優化決策樹的智能診斷方法,在簡化模型的基礎上使得故障分類的準確率大大提升;賈京龍等[8]基于油中溶解氣體濃度信息,利用卷積神經網絡的方法實現了電力變壓器故障診斷。陳如清等[9]基于振動傳感器的頻譜信息,提出了一種基于遞歸神經網絡的方法,成功用于旋轉機械裝置的故障診斷。支持向量機作為一種有監督的機器學習方法,其在樣本數量、待識別的模式數量以及非線性問題分類等方面均能達到良好效果。樊浩等[10]提出了主元分析結合支持向量機的斷路器故障診斷方法,在噪聲背景下實現了斷路器7種故障的準確分類。然而,支持向量機的懲罰因子以及核函數參數組合較大程度地影響了故障識別準確率,有學者利用各類尋優算法對支持向量機的參數組合進行優化配置以期望獲得更高的故障識別準確率[11-13]。近年來,麻雀搜索算法受到了學者們的廣泛關注,其可以有效避免陷入局部尋優的問題,現已被成功應用于三維無人機航跡規劃[14]。
基于以上分析,提出一種通過主站發電機瓦溫信息構建發電機故障診斷模型的方法,利用麻雀算法全局尋優和局部尋優自由切換的優勢,對支持向量機的懲罰因子以及核函數參數組合進行優化,以提高發電機故障模式識別準確率。
支持向量機(SVM)是一種具有較強泛化能力、適用小樣本學習的模型,被廣泛應用于分類和回歸等問題。對于線性可分問題,SVM通過建立一個最優決策超平面,滿足平面兩側待分類的樣本之間距離最大化,從而獲得良好的泛化能力和分類效果。對于非線性可分問題,是將低維不易區分的特征點通過核函數實現到高維特征空間的非線性映射,然后在特征空間中建立最優超平面進行分類。
1)設最優決策超平面:
ωφ(x)+b=0,
(1)
式中:ω為權重;b為偏置量。
2)通過ωφ(x)+b>0或ωφ(x)+b<0對x進行分類,決策函數如下:
f(x)=sgn(ωφ(x)+b)。
(2)
3)為了解決非線性可分問題,通過將懲罰因子C和松弛系數ζi引入到目標函數中,以此來間接增大目標函數值。目標函數和約束條件構造如下:
(3)
式中:C為懲罰因子,用于調整樣本間的權重;ζi為松弛系數,對應于非線性樣本。
4)利用拉格朗日函數及拉格朗日乘子αi解出不等式約束條件下的最大值。
(4)
可得最優分類函數為
(5)
式中:K(x,xi)為支持向量機的核函數;m為向量樣本個數。
SVM的核函數種類包括高斯徑向基核函數、線性核函數和多項式核函數等。其中,相較于其他核函數,高斯徑向基核函數有更好的分類效果,因此采用RBF核函數求解,表達式[15]如式(6)所示:
(6)
使用虛擬麻雀進行食物的尋找,由n只麻雀組成的種群可如式(7)表示:
(7)
式中:d為待優化問題變量的維數;n為麻雀的數量。則所有麻雀的適應度值可以表示為
(8)
式中f表示適應度值。
在第t次迭代中,擁有較好適應度的第i個麻雀在第j維更新位置為
(9)
式中:itermax為最大迭代次數;α為介于0~1的隨機值;Q為服從正態分布的隨機值。R2(R2∈[0,1]) 和 ST(ST∈[0.5,1])分別表示預警值和安全值。L表示一個1×d大小的元素為1的矩陣。
在覓食過程中,新入麻雀的位置更新表示為
(10)
式中:Xp是目前發現者所占據的最優位置;Xworst則表示當前全局最差的位置;A表示每個元素隨機為±1的1×d向量。
“意識到危險”位置的麻雀位置更新為
(11)
式中:Xbest是當前的全局最優位置;β作為步長控制參數;K∈[-1,1]是一個隨機數,表示麻雀移動的方向;fi是當前麻雀個體的適應度值。
由式(3)和式(6)可知,SVM的懲罰因子C和核函數半徑g是影響其分類能力的主要因素,其中懲罰因子C可以影響SVM對樣本學習的準確性,參數g影響樣本的空間投射[16]。通過麻雀搜索算法尋找到最佳的2個參數C和g,進而提高SVM在故障模式識別中的正確率。利用麻雀搜索算法來進行SVM參數優化的步驟如下:
Step1 確定訓練樣本和測試樣本;
Step2 設置麻雀種群規模pop,搜索空間維度dim,最大迭代次數Max_iteration。生成麻雀初始位置,取[-1,1]之間的隨機數作為麻雀的初始位置,設置“意識到危險”的麻雀及“發現者”麻雀占比,并確定預警值ST;
Step3 計算出麻雀種群適應度值,得到最優位置Xp和最劣位置Xworst;
Step4 根據式(9)—式(11)更新“發現者”“加入者”“意識到危險”的麻雀位置;
Step5 計算麻雀更新位置后的適應度值,并與前一次迭代中的適應度值做對比。假如高于原有適應度值,則把新位置值作為最優的適應度值Xbest;否則保持原適應度值不變;
Step6 判斷是否已經達到了最大迭代次數,若未達到,則轉到Step3,若已經達到,則停止迭代過程;
Step7 結束尋優過程,輸出最優(C,g)組合,以最優參數構造SVM分類器。
利用張河灣抽水蓄能電站監控系統采集的水泵發電機實測溫度數據進行方法的驗證和分析。數據覆蓋正常、下導瓦間隙偏小、冷卻器容量不足、透平油老化、雜質混入故障5種狀態模式。每個狀態中選取了200組故障樣本數據作為研究數據,其中訓練樣本集160組(占80%)和測試樣本40組(占20%),對故障狀態進行診斷測試。限于篇幅,各故障狀態下部分溫度數據(截取了下導軸承20個溫度數據點)變化情況如圖1所示,其中相鄰數據點之間的采樣時間間隔為10 min。

圖1 原始溫度數據在4種故障模式下的變化情況Fig.1 Distribution of original temperature data in four fault modes
采用本文所提方法對SVM模型進行優化,并完成故障模式識別,其相關參數設置如下:種群規模為50,最大迭代次數為100,搜索空間維度為2,“意識到危險”的麻雀占比為25%,“發現者”麻雀占比為75%,預警值為0.6;SVM模型中懲罰因子C∈[0.01,1],核函數半徑g∈[2×10-5,2×105]。
以識別錯誤率作為適應度,利用麻雀尋優算法對懲罰因子C和核函數半徑g的參數組合尋優,其適應度及參數變化過程分別如圖2和圖3所示。

圖2 麻雀尋優算法的適應度變化曲線Fig.2 Fitness curve of sparrow optimization

圖3 懲罰因子和核函數半徑的尋優過程Fig.3 Optimization process of penalty factor and kernel radius
由圖2可知,麻雀尋優算法在第6次迭代完成了參數尋優,因此,本文所提的麻雀尋優-支持向量機故障識別模型具備較快的收斂速度。參數尋優結果為C=448.5,g=0.036 72,并以此模型對200組測試樣本(正常、下導瓦間隙偏小、冷卻器容量不足、透平油老化、雜質混入各40組)故障識別測試。其中組數1~40為正常測試樣本,組數41~80為下導瓦間隙偏小故障測試樣本,組數81~120為冷卻器容量不足故障測試樣本,組數121~160為透平油老化故障測試樣本,組數161~200為雜質混入故障測試樣本。模型對測試樣本的識別結果及識別正確率統計分別如圖4和表1所示。為了驗證本文所提方法在提升識別正確率方面的有效性,傳統SVM模型識別的統計結果如表2所示。
由表1的統計分析可知,正常和冷卻器容量不足故障測試樣本的正確率最高,均可達到95%,下導瓦間隙偏小故障測試樣本的正確率較低為87.5%。在200個測試樣本中,識別錯誤的樣本數為16,其總體識別正確率達到92%。由表1和表2的數據對比,可見本文所提方法將200組測試樣本的識別正確率提高了7%。然而,下導瓦間隙偏小故障的識別錯誤樣本數仍然偏高。

圖4 測試樣本識別結果Fig.4 Identification results of the test samples
此外,為驗證所使用的麻雀尋優-支持向量機(Sparrow-SVM)方法較現行主流故障模式識別方法的優勢,分別利用粒子群-支持向量機(PSO-SVM)、遺傳算法-支持向量機(GA-SVM)和麻雀尋

表1 基于麻雀尋優-支持向量機方法的測試樣本識別正確率統計Tab.1 Statistical results for the identification accuracy of the test samples based on Sparrow-SVM

表2 基于傳統SVM的測試樣本識別正確率統計Tab.2 Statistical results for the identification accuracy of the test samples based on traditional SVM
優-極限學習機(Sparrow-ELM)以相同數據樣本進行訓練并測試識別,相應的統計結果如表3所示。由數據分析可知,Sparrow-SVM方法識別正確率均高于被對比的其他3種主流方法。一方面驗證了麻雀尋優方法較傳統粒子群尋優、遺傳算法尋優的優勢;另一方面說明在抽水蓄能電站主機故障訓練樣本有限的情況下,SVM方法較ELM方法故障模式分類效果更佳。

表3 與現行同類方法識別結果對比Tab.3 Performance comparison with other current fault pattern recognition methods 單位:%
提出了一種基于溫度信號分析的麻雀尋優-支持向量機發電機故障模式識別方法,經數據分析得到相關結論如下。
1)抽水蓄能電站下導瓦間隙偏小、冷卻器容量不足、透平油老化、雜質混入故障可導致發電機瓦溫等信息的變化。
2)通過瓦溫構建的故障樣本可用于訓練SVM模型并可實現實測數據的故障類型識別,同時,麻雀尋優算法可快速有效地對SVM的懲罰因子C和核函數半徑g進行尋優。與傳統SVM識別方法相比,麻雀尋優-支持向量機可將樣本識別正確率從85%提升至92%,在200組測試樣本中,識別錯誤樣本數由30組降至16組。
3)張河灣抽水蓄能電站故障下實測溫度數據表明,本文所提出的麻雀尋優-支持向量機方法可進行故障模式識別,為機組運行狀態的智能化監測提供了有效支撐,為抽水蓄能發電站主站電機的安全可靠運行提供了技術保障。
采樣過程中溫度波動對溫度變化率的影響容易導致下導瓦間隙偏小故障發生誤判。基于以上分析,各類故障下溫度數據的預處理將作為今后研究的重點。