蘭朝鳳,宋博文,郭小霞
(哈爾濱理工大學 測控技術與通信工程學院,哈爾濱 150080)
隨著居民用電量的增加,電網的安全可靠性已經成為了社會需要重視的一個問題。水力發電作為一種發電方式,保證水輪機安全穩定地運行,就顯得至關重要。因此,及時為水輪機進行狀態預測,是目前要解決的一個難題。
目前,國內外很多學者從理論研究、試驗研究、數值模擬3個角度出發,進行水輪機運轉狀態識別[1-3],取得了較好的進展。然而,這部分學者并沒有直接展示水輪機信號與與水輪機運轉狀態的關系。從文獻[4-5]可以看出,要想直接展示水輪機信號與水輪機運轉狀態的關系,實現水輪機運轉狀態識別的話,就要以信號預處理、特征提取、運轉狀態識別模型的構建為技術路線去實現。
合適的信號處理技術是信號預處理的重要部分。傳統的信號處理方法比如傅里葉變換(Fourier transformation,FT)[6],不能分析像水輪機信號這樣的非平穩信號,為此,出現了像小波變換(wavelet transform,WT)[7]、經驗模態分解(empirical mode decomposition,EMD)[8]、互補集合經驗模態分解(complementary ensemble empirical mode decomposition,CEEMD)[9]這樣的信號處理技術。文獻[10]對信號進行CEEMD分解之后,用夾角余弦計算信號與IMF分量之間的相似度,判斷噪聲主導模態和信號主導模態之間的分界點,最后獲得了較好的去噪效果。文獻[11]用CEEMD,分析高水頭混流式水輪機的穩定性。
水輪機故障的故障特征通常蘊含在水輪機信號里面,因此,要用合適的特征提取方法對水輪機信號進行特征提取。不少學者計算排列熵、能量矩、峭度等物理量以進行特征提取。其中,排列熵(permutation entropy,PE)是一種基于復雜性量度的非線性動力學參數,能有效地反映系統的特征。文獻[12]用PE將IMF分量組成滾動軸承故障診斷模型的特征樣本集,以實現軸承故障診斷,正確率為99.285 7%。
除了合適的信號處理技術和合適的特征提取方法,合適的水輪機運轉狀態識別模型也至關重要,部分學者用概率神經網絡(probabilistic neural network,PNN)[13]、極限學習機(extreme learning machine,ELM)[14]、小波神經網絡(wavelet neural network,WNN)[15]進行水輪機運轉狀態識別。ELM相較于PNN和WNN出現較晚,是一類基于前饋神經網絡(feedforward neuron network,FNN)構建的機器學習方法,適用于監督學習和非監督學習問題,在分類、模式識別等方面有一定的應用[16]。ELM的權值和閾值影響其自身的性能,部分學者用PSO優化ELM的權值和閾值[17]。然而,PSO存在易陷入局部最優的缺點,這影響了PSO的性能。
針對上述文獻提出的問題,本文提出基于SA-PSO-ELM的水輪機運轉狀態識別模型。在CEEMD中融合皮爾遜相關系數和小波方法對水輪機信號進行去噪。去噪之后,再利用CEEMD,對去噪之后的水輪機信號進行特征提取以構建水輪機運轉狀態識別模型的輸入特征向量。最后,利用SA-PSO優化ELM的權值和閾值,將SA-PSO與ELM結合,提出基于SA-PSO-ELM的水輪機運轉狀態識別模型,并通過比較正確率、均方誤差、決定系數3個指標,評價了本文提出的SA-PSO-ELM模型的性能。
小波變換(wavelet transform,WT)在低頻時的時間分辨率較高,頻率分辨率較低;在高頻則相反,這符合低頻信號變化緩慢而高頻信號變化迅速的特點,是它優于傅立葉變換的地方。
WT進行信號去噪已經應用廣泛。目前已經有很多種小波去噪方法,如極大值去噪、小波系數相關性去噪等,其中閾值去噪是一種效果比較明顯、易于實現的去噪方法,其中又分為硬閾值和軟閾值。
本文選取含噪矩形波信號,利用小波軟閾值函數對其進行去噪并與硬閾值進行去噪進行對比,去噪前和去噪后的矩形波信號時域圖如圖1所示。

(a)含噪信號的時域圖
由圖1可知,小波軟閾值去噪效果更好,能減少噪聲對水輪機運轉狀態識別的干擾。
為了更好地分析水輪機信號,本文針對傳統EMD方法容易出現模態混疊的問題,利用CEEMD對水輪機信號進行成分分析。
經過CEEMD法分解之后的原信號,可以看作是多個IMF分量和一個殘余量的和,即
(1)
式中,X(t)、t、r、IMFk分別為原信號、時間、殘余量、第i個IMF分量。CEEMD法的重構誤差較小,能有效地進行特征提取。
信號經CEEMD法分解后的所有IMF分量中,噪聲含量較高的分量叫噪聲主導模態,含量較低的分量叫信號主導模態。本文用皮爾遜相關系數確定噪聲主導模態和信號主導模態的分界點,相關系數越大,IMF分量越與原始信號相似。皮爾遜相關系數的表達式為
(2)
式中,COV(X,Y)、ρX、ρY分別為協方差、變量X的方差、變量Y的方差。在判斷IMF分量與原始信號的相似度時,可把原始信號當作X,IMF分量當作Y。
在特征選取時所選擇的特征上,本文選排列熵作為CEEMD法所提取的特征參數。
2.1.1 粒子群算法
PSO源于對鳥類捕食行為的研究,有演化計算的優勢。PSO首先在可解空間中初始化一群粒子,每個粒子都代表極值優化問題的一個潛在最優解,用位置、速度、適應值三項指標表示該粒子特征,通過適應度函數計算影響粒子優劣的適應值。PSO的流程圖如圖2所示。

圖2 粒子群算法流程圖Fig.2 Flow chart of particle swarm optimization algorithm
PSO的速度和位置更新可表示為
Vid=WVid+c1r1(Pid-Xid)+c2r2(Pgd-Xid)
(3)
Xid=Xid+Vid
(4)
式中:r1、r2在0~1之間隨機取值;Vid、Xid分別為粒子速度、粒子位置;Pid和Pgd分別是粒子的個體最優值、全局最優值;c1和c2為學習因子;W為慣性權重。
PSO在前期要加強全局搜索能力,后期要加強局部搜索能力。因此,粒子群的相關參數不應一成不變,其慣性權重W和學習因子c1應當逐漸減小,而學習因子c2應當逐漸增大。學習因子的改進公式和文獻[18]相同。慣性權重的改進公式為
(5)
式中:Wini、Wend分別為初始慣性權重、最終慣性權重;k為迭代次數;kmax為迭代次數最大值;?等于1。
PSO在解決多峰值問題時,容易出現早熟現象從而陷入局部最優解。因此,如何避免PSO陷入局部最優解,本文將在2.1.2節的研究中提出避免陷入局部最優解的解決方法。
2.1.2 模擬退火算法
SA是基于物理中固體物質的退火過程與一般組合優化問題之間的相似性,SA從某一較高初溫出發,伴隨溫度參數的不斷下降,結合概率突跳特性在解空間中隨機尋找目標函數的全局最優解,即在局部最優解能概率性地跳出并最終趨于全局最優。SA的流程圖如圖3所示。

圖3 模擬退火算法流程圖Fig.3 Flow chart of simulated annealing algorithm
模擬退火算法能以一定概率接受較差解,具有跳出局部最優解,進入全局最優解區域的能力。因此,SA-PSO的算法精度較高,可一定程度上避免PSO容易陷入局部最優的問題。
2.1.3 極限學習機
ELM是基于前饋神經網絡構建的機器學習系統,ELM在故障診斷(比如機械故障診斷)中得到了較好的應用。ELM的結構圖如圖4所示。
圖4中,X1-Xn為ELM的輸入變量,Wij、βjk分別為輸入層和隱含層之間的輸入權值、隱含層輸出權值,Y1-Ym為ELM的輸出變量。在ELM中,一旦Wij和隱含層的偏置確定了,隱含層的輸出就確定了。在ELM中,只需要提前設定隱含層神經元的個數即可。

圖4 ELM的結構圖Fig.4 Structure diagram of ELM
由于ELM的輸入權值和隱含層閾值是隨機產生的,其穩定性較差,進而影響了其自身的性能。因此,本文將SA-PSO利用均方誤差函數與ELM連接,通過SA-PSO優化ELM的閾值和權值,當均方誤差不隨迭代次數的增加而下降時,輸出的權值和閾值即為優化后的權值和閾值,近而構建SA-PSO-ELM模型。
計算均方誤差函數的表達式可寫為
(6)
式中,yi、ti、及n分別為ELM的預測值、ELM的實際輸出值及優化模型中訓練集的樣本個數。
SA-PSO-ELM的流程圖如圖5所示。

圖5 SA-PSO-ELM流程圖Fig.5 SA-PSO-ELM flow chart
本文構建的SA-PSO-ELM的演算過程如下:
步驟1ELM參數初始化;
步驟2由分類結果計算適應度;
步驟3更新ELM參數;
步驟4判斷尋優曲線是否收斂且誤差是否滿足要求。如果收斂且滿足要求,輸出分類結果,否則返回步驟2。
尾水管的作用是引導進出轉輪的水流,是水輪機的主要通流部件,是水輪機壓力脈動測試時的主要部位,本文試驗數據來自于用壓力傳感器采集的水輪機的尾水管的7個主要部位的信號:蝸殼進口、無葉區+Y、無葉區-Y、錐管+Y0.3D2、錐管-Y0.3D2、肘管外側、肘管內側。在采集數據的過程中,設置五種工況分別為正常狀態、預警狀態、報警狀態、異常狀態、故障狀態。試驗過程中,在每個部位安裝1個傳感器采集壓力脈動數據,每個部位在每個運轉狀態下采集10 000個數據,數據的采樣頻率為4 kHz,試驗裝置含尾水管部分的外形如圖6所示。

圖6 試驗裝置尾水管的外形Fig.6 Apparance of draft tube of test device
試驗因工況調整設有4個可變參數:導葉開度(mm)、單位轉速(r/min)、流量(m3/s)、裝置空化數。其中,裝置空化數越小,水輪機的抗空化性能越差,當設置不同的工況參數時,水輪機運轉狀態從正常狀態向預警狀態、報警狀態、異常狀態、故障狀態依次過渡。本試驗中,采集水輪機信號時的水輪機的參數設置如表1所示。

表1 不同運轉狀態下的導葉開度、單位轉速、流量、裝置空化數Tab.1 Guide vane opening,unit speed,flow and cavitation number of the device under different operatingconditions
為確定模態分界點,用CEEMD法對水輪機信號進行分解。本文只展示蝸殼進口部位的信號在正常狀態下的CEEMD分解結果,分解成11個IMF,結果如圖7所示。
由圖7可知,從第3階IMF分量開始,噪聲含量逐漸下降,可近似認為分界點為3。為確定分界點估計的準確性,繪制IMF相關系數分布隨IMF分量階數變化的曲線,通過皮爾遜相關系數計算水輪機信號與IMF分量之間的相關性,分界點的選取準則為相似度曲線首次發生逆向轉折的位置,結果如圖8所示。
由圖8可知,IMF4的出現,使相似度曲線的變化趨勢發生首次逆向轉折,分界點為3。可見,分界點估計的結果是正確的。

圖7 CEEMD分解結果Fig.7 CEEMD decomposition results

圖8 相關系數隨IMF分量階數變化的曲線Fig.8 Curve of correlation coefficient with IMF component order
為確定水輪機信號的頻率成分,對蝸殼進口部位在正常狀態下的水輪機信號去噪之后,繪制頻譜圖,結果如圖9所示。

圖9 去噪之后的頻譜Fig.9 Spectrum after denoising
由圖9可知,水輪機信號的頻率主要分布在0~60 Hz區間。可見水輪機信號的頻率主要分布在低頻段,對水輪機信號進行特征提取時主要提取水輪機信號在低頻部分的特征。
為提取水輪機信號的特征,對去噪之后的水輪機信號進行CEEMD分解,分解為10個IMF分量,同樣選擇蝸殼進口部位在正常狀態下的水輪機信號。不同的IMF分量的頻率成分不同,從分解得到的所有IMF分量中選擇頻率成分和水輪機信號的頻率成分相近的IMF分量,進行特征提取。10個IMF分量的頻譜圖如10所示。
由圖10可知,IMF3~IMF7分量為水輪機信號的主要頻率成分,因此,進行特征提取時,選擇IMF3~IMF7這5個分量。
對選用的IMF分量計算排列熵,并以排列熵構建水輪機運轉狀態識別模型的輸入特征向量,每個特征向量的每一維是一個IMF分量的排列熵。設置水輪機運轉狀態識別模型的輸入特征向量的個數為175個,每個運轉狀態的特征向量有35個,每個特征向量是5維的。
設置PSO的兩個學習因子的取值分別為2.8和1.3,最大迭代次數為180,初始慣性值和迭代至最大代數時的慣性值分別為0.9和0.3,微粒的最大速度是1,設置SA-PSO-ELM的退火常數慣性權重為0.5。
特征向量輸入個數為175個,選擇125個作為訓練樣本,50個作為測試樣本。模型的ELM輸入層神經元個數、隱含層神經元個數、輸出層神經元個數分別為5個、10個、1個。
為對比SA-PSO-ELM的正確率,繪制ELM、PSO-ELM、SA-PSO-ELM的分類結果圖,結果如圖11、圖12所示(縱坐標的1、2、3、4、5分別代表水輪機運轉狀態的正常狀態、預警狀態、報警狀態、異常狀態、故障狀態)。

(a) IMF1的頻譜

圖11 SA-PSO-ELM的分類結果圖Fig.11 Classification results of SA-PSO-ELM

圖12 ELM、PSO-ELM的分類結果圖Fig.12 Classification results of ELM and PSO-ELM
由圖11、12可知,ELM在樣本編號為13-16、40預測錯誤,樣本共計5個,因此正確率為90%,同時,由圖11、12可知,PSO-ELM與SA-PSO-ELM的正確率為100%。
為定量分析ELM、PSO-ELM、SA-PSO-ELM的預測效果與均方誤差和決定系數的關系,進行試驗,結果如表2所示。

表2 不同模型下的預測結果Tab.2 Prediction results under different models
由表2可知,SA-PSO-ELM的均方誤差為1.399 20,比ELM和PSO-ELM均小;SA-PSO-ELM決定系數為0.922 96,比ELM和PSO-ELM均大,即精度最高。且結合圖11、12可知,SA-PSO-ELM的預測正確率為100%,由此表明本文提出的模型應用在水輪機運轉狀態識別上,效果較好。
本文針對水輪機的運轉狀態識別,提出了基于SA-PSO-ELM的水輪機運轉狀態識別模型,并作出如下總結:
(1) 用小波軟閾值去噪對矩形波信號進行去噪,并用小波硬閾值去噪做對比,通過比較含噪信號的時域圖和去噪后的時域圖,確定了小波軟閾值去噪較好的去噪效果。
(2) 利用皮爾遜相關系數,繪制水輪機信號和IMF分量之間的相關系數隨IMF分量階數變化的曲線,確定了K值估計的準確性。
(3) 用SA-PSO優化ELM的權值和閾值,構建水輪機運轉狀態識別模型SA-PSO-ELM。正確率、均方誤差、決定系數分別為100%、1.399 20、0.922 96。同ELM、PSO-ELM相比,SA-PSO-ELM的正確率最高,均方誤差最小,決定系數最大,SA-PSO-ELM的性能要好于ELM、PSO-ELM,更適合于水輪機運轉狀態識別。
隨機森林(RF)、遷移學習在機械設備故障診斷中應用廣泛,但是在水輪機故障診斷中應用不足。因此,下一步的計劃是用RF或者遷移學習構建水輪機運轉狀態識別模型,識別水輪機運轉狀態,準確地診斷水輪機故障。