王怡祖,陸金桂,程智虎
(南京工業大學 機械與動力工程學院,南京 211816)
近年來,隨著清潔能源的推廣,風力發電機的裝機量日益上漲,在電力能源及可再生能源中的比重越來越大[1]。風力發電機的穩定運行是風場運維的重要任務[2],在風力發電機出現故障之前準確評價機器的健康狀況,有利于風場運維部門合理安排風力發電機診斷檢修,從而降低風場的運營成本。目前,主要通過數學模型和人工智能方法對風力發電機健康評價問題進行分析。文獻[3]建立了齒輪箱正常運行的溫度模型,通過預測溫度與實際溫度的殘差判斷齒輪箱是否存在故障隱患。文獻[4]使用最大絕對誤差、最大相對誤差、平均相對誤差、相對均方根誤差等4種誤差作為預測精度指標對齒輪箱故障進行預警。文獻[5]運用K-S檢驗法比較正常與故障工況下的振動信號判斷齒輪故障。
上述研究運用殘差與誤差等理論進行健康評價,忽視了數理統計中隨機現象的統計規律性,而且沒有使用評價方法對健康狀況的優劣程度進行量化處理,無法從直觀角度評判在役風力發電機的運行情況。另外,使用上述方法時需加裝傳感器,將增加風場運維成本。因此,基于風場自帶的檢測系統,從客觀量化的角度出發,基于假設檢驗法對在役風力發電機軸承的數據進行健康系數的實例分析,以對風力發電機軸承的健康狀態做出合理推斷。
當前風場都配備了數據采集與監視(Supervisory Control And Data Acquisition,SCADA)系統,可以進行現場設備的控制、參數設置、數據采集以及信號報警等[7]。由于每個風場記錄的SCADA指標不盡相同,用于提取數據的風場包括92個遙測站點,分別包含壓力、溫度、角度、速度等方面的指標,因此分析各個部件時需對具體指標進行相應的篩選。綜合比較了海裝、名揚、GE等主流風力發電機品牌,在提取共有指標參數的基礎上,結合葉片經葉輪通過主軸及軸承傳入齒輪箱的原理,對于軸承的健康評估選取了與溫度和轉速相關的指標量,主要包括風速、主軸轉速、主軸溫度和齒輪箱軸承溫度。
由于上述指標之間存在耦合性,因此選用神經網絡模型將風速、主軸轉速、主軸溫度作為輸入,將軸承溫度作為輸出,利用正常工況下的指標作為神經網絡的訓練數據。同時,在健康評估過程中利用在役數據進行預估,得出軸承溫度的神經網絡預估值,利用假設檢驗方法將其與監測系統中的實際溫度進行對比計算,求出軸承的健康系數值。若軸承溫度的預估值與實際值存在明顯差異,則說明軸承出現故障;若不存在問題,則通過健康系數值說明其運行狀態的優劣。
由于軸承溫度的預估值與實際值的分布是雜亂無章的,不符合任何分布形式,因此需要通過數理統計方法進行近似變幻。在獨立同分布的Lindeberg-Levy中心極限定理中,設X1,X2,…,Xn是相互獨立且服從同一分布的隨機變量序列[6],其數學期望和方差為
EXi=μ,DXi=σ2≠0;i=1,2,…,n,
則對任意的x有
無論隨機變量服從什么分布,只要滿足定理的條件,即隨機變量序列
當n無限增大時,總以標準正態分布為其極限分布,或者說當n充分大時,Yn近似服從標準正態分布。利用這一理論,在數理統計中許多復雜隨機變量的分布都可以用正態分布近似。
通過上述理論將軸承溫度的預估值與實際值近似為正態分布,然后運用正態分布下的假設檢驗法進行健康系數的分析。
實際應用中,常遇到兩正態總體參數樣本的比較問題,如2臺機床加工零件的精度是否有差異等,一般可歸納為兩正態總體參數的假設檢驗。

故對于給定的顯著性水平α,檢查正態分布表得臨界值Zα/2,再由樣本的具體觀察值計算得統計量Z的觀察值為
將Z與Zα/2比較,若|Z|≥Zα/2,則拒絕H0,反之接受。
根據上述計算步驟,在標準正態分布表中,統計量Z所代表的數值唯一對應了其中一個概率,此概率值說明了兩者近似程度的大小,因此通過概率值的大小可代表健康系數的大小。正常狀態下,預測值與實際值差異不大,健康系數較高,可判定為正常。非正常情況下,若數據極端超過閾值,則會出現停機報警;若數據異常不明顯,不超過閾值,無法通過閾值報警,即不會出現急停,但經過健康系數分析,雖然無明顯停機癥狀,健康值較低時仍需及時維修。
如圖1所示,對于軸承的健康評價主要根據檢測量判定,并根據嚴重程度對風力發電機組做出診斷。若監測值超過風機正常運行所設定的閾值,則發出故障報警,需停機維修;若未超過閾值,則通過神經網絡進行判斷。

圖1 健康評價模型
根據經驗公式m=2n+1(m為隱含層節點數,n為輸入層節點數),選用1個隱含層,隱含層節點數選為7,建立如圖2所示的神經網絡結構模型。參數選擇過程中,基于在役數據的時效性,學習速率設置為0.5,誤差精度為0.001,最大迭代次數為3 000。隱含層傳遞函數選用Log-Sigmoid,輸出層傳遞函數選用線性函數,學習函數選用Levenberg-Marquardt函數。神經網絡結構模型建立后,利用正常運行下的監測數據建立神經網絡評估模型,基于在役運行時段下的監測數據獲得軸承溫度的神經網絡預估值。然后運用假設檢驗方法比較軸承溫度的預估值與實際值之間的差異,計算出健康系數值,得出一個量化的優劣值,從而對風電軸承的健康狀態做出合理、科學的推斷。

圖2 神經網絡預估模型
選取2013年10月—2014年9月新疆某風場1.5 MW風電機組平穩運行狀態下的SCADA系統19 686組監測數據(表1)進行神經網絡的訓練,建立神經網絡評估模型。

表1 神經網絡學習數據
選擇同機組2015年1月份正常運行的801組監測數據(風速、主軸轉速及溫度)作為神經網絡的輸入量,使用訓練好的神經網絡進行軸承溫度預估,結果見表2。

表2 神經網絡預估數據(正常)
獲得上述數據后,使用如下步驟從量化的角度運用健康系數值對軸承的健康狀況進行評價:


表3 服從正態分布
2)做出原假設H0,即預測值與實際值不存在明顯差異。


5)判斷。因2.288介于2.28與2.29之間,因此,當α=0.022時,|Z|=2.288<2.29,接受原假設H0。當α=0.022時,在正態分布表中對應的概率值為0.989,即有98.9%的可靠度認為預測值與實際值不存在顯著差異。
由上述步驟可得,該軸承健康系數為98.9,健康狀況等級良好,與傳感器信號系統分析結果一致(健康系數值約95),無需進行維修處理。
選擇同機組2015年5月份異常運行的801組監測數據作為神經網絡的輸入量,使用訓練好的神經網絡進行軸承溫度預估,結果見表4。

表4 神經網絡預估數據(異常)
同理,經計算得|Z|=0.267,則


因為0.267介于0.26與0.27之間,所以由上述結果可知當α=0.787 2時,|z|=0.267<0.27,接受原假設H0,即只有有60.64%的可靠度認為預測值與實際值不存在顯著差異。
由此可知,該分析所使用的風機軸承健康系數為60.64,健康狀況等級較差,與傳感器信號系統分析結果一致(健康系數值約55),需要進行維修處理。
在數理統計的范疇之內,考慮了概率對健康評價的影響,運用假設檢驗方法及數理統計計算模型,對神經網絡試驗數據的實際值與預測值進行對比分析,計算出了基于概率的健康系數值,從而對在役風力發電機軸承的健康狀態做出合理的、科學的評價。同時,通過對在役風電機組軸承的SCADA數據進行健康系數的實例分析,驗證了該方法的有效性。
從計算過程可知,預測值與實際值之間仍存在一些差異,但通過數理統計的方法進行數據處理在實際中是可行的,后續需要對健康系數值大小與健康狀況等級的對應方面進行更深入的研究。