趙麗琴,劉 昶,鄧丞君
(成都大學 信息科學與工程學院,成都 610106)
健康度是設備量化的健康程度,是一種設備健康狀態的定量評估,可以更準確的反映設備健康狀態。隨著大型機電設備系統集成化、信息化程度的提高,其故障診斷與后勤保障的難度增大。為保障這些系統連續穩定的運行,不影響任務的正常執行,減少資源浪費,提高設備保養和維修效率,需隨時掌握設備的健康度,并根據系統健康度做出適當的維修維護決策,提高其工作效能。
根據文獻,目前對復雜系統健康度的評估,大部分都是基于向量距離的計算,也有部分是基于模糊評判或者信息熵方法。一般常規的方法包括:綜合權重法、模糊隸屬度、層次分析、灰色關聯、高斯模型等。如文獻[1-4]就運用了綜合權重和模糊評價法對設備的健康度進行了評估。文獻[5]利用模糊測度和模糊積分來計算配電網關鍵設備的健康度。文獻[6-7] 利用回歸算法預測健康度,取得了不錯效果。也有學者用灰色關聯法計算采集向量和虛擬向量的關聯度,得到健康度,對設備進行健康度評估[8-9]。文獻[10]分兩級計算設備健康度,在部件級計算了帶加權的距離,然后通過動態權重的模糊層次法計算系統級健康度。但這些方法都需要良好的先驗知識來確定權重及模糊函數等信息,且不適應大量采樣數據場合。
隨著大數據分析技術的出現,利用機器學習方法進行健康度評估的研究越來越多。例如為了對風洞設備進行健康狀態評估,文獻[11]利用深度學習LSTM算法,先降維,再計算向量距離得到健康度。利用傳統機器學習技術如支持向量機(SVM)算法來進行健康狀態評估的研究也得到廣泛重視。比如有研究采用SVM算法對高鐵動車的軸承進行健康評估[12];還有研究利用SVM算法對艦船的推進系統進行健康管理[13]。相對于深度學習算法,SVM算法占用資源少,訓練樣本要求不多,而準確度相差不大[14],因此成為設備健康狀態評估的主流研究方向。SVM方法是以多分類為框架,SVM通過對設備正常數據和異常數據進行學習構建分類器進行測試。但在實際測量中,容易獲得大量的正常樣本,而異常樣本不易獲得,就會造成嚴重的數據不平衡問題。如果異常樣本匱乏,則SVM不能很好地發揮作用,對于異常情況的分類效果就不甚理想[15]。
鑒于大多數設備具備較多的正常數據,缺乏或者只有少量異常狀態數據,SVDD作為一種單分類學習方法,成為一種評價健康度較好的備選方法。如文獻[16]采用主成分分析法、SVDD算法和馬氏距離等方法,計算設備的實時健康度。文獻[17]將模糊理論與SVDD算法相結合,提出基于模糊SVDD的電子裝備狀態評估模型。但該方法未考慮不同屬性的權重,適用于樣本權重均衡的場合。鄭州大學的李凌均等[18]將支持向量數據描述用于機械設備狀態評估研究,僅僅依靠正常運行時的數據信號,而不需要故障數據,就可以監測機器的運行狀態,對早期故障診斷提供很好的幫助。
基于SVDD的單類學習方法在機械設備異常檢測、設備故障預警,圖像異常檢測等領域逐漸得到廣泛應用,但在設備健康狀態評估方面應用甚少且準確性不高。本文以采集樣本不均衡的設備為評估研究對象,提出了基于動態權重的SVDD設備健康度評估方法。該方法首先采用SVDD算法訓練正常健康狀態的樣本得到一個超球面,然后利用少量各種健康度的標記樣本計算其到超球面距離,再采用二項式回歸學習算法得到健康度計算的擬合曲線。為了提高評估的準確性,本方法特別考慮了設備采樣參數值在偏離最佳值越大時,健康度越差的事實,提出了基于指數函數的動態權重算法。將該算法與前面方法結合可顯著提高準確性。最后以某型雷達發射機為例進行測試驗證。實驗結果表明,該方法對設備健康度準確評估具有不錯實用價值。
作為一種典型的單分類器,采用SVDD模型,對健康數據進行訓練后就可以對健康狀態和非健康狀態進行分類,適合缺乏全面樣本的場合。
假定健康樣本數據為集合{xi},xi∈Rd,i=1,…,N,訓練SVDD模型的目標是找到一個最小體積的超球體,使所有向量xi都包含在該球體內。用圓心a和半徑R來表示這個超球體。為了減少奇異點的影響,引入松弛變量ξi,問題轉化為求解下面的二次規劃問題[14]:
(1)
式中,C為懲罰系數,ξi≥0(i=1,…,N),‖φ(xi)-a‖2為點φ(xi)到球心a的距離。通過建立拉格朗日函數,并引入核函數κ(xi,xj)=φ(xi).φ(xj)代替內積運算,將上述二次規劃問題轉化為如下對偶問題:
(2)

解上述不等式,得到球心:

(3)
取特征空間內任一支持向量φ(xk),可得半徑:

(4)
相應地,一個樣本點z到球心a歐式距離d為:
(5)
通常一個設備有多個與健康狀態相關的參數,不同參數對設備健康狀態的影響不同。采用權重法是一種慣常做法。在工作中發現,一個參數對健康狀態的影響并不是一成不變的,隨著其參數值大小變化而變化。比如某個參數平時在正常范圍內,對健康狀態影響不大。但是隨著參數值偏離正常值越多,對健康狀態的影響就越大。根據長期觀察和實驗驗證,參數值變化對健康狀態的影響程度比較貼近指數函數。因此,對于參數i的動態權重指數,可用如下指數函數表示:
(6)

在公式(6)中gi是歸一化之后的參數檢測值。ψi是參數i的動態權重的指數函數參數,要求ψi>1,其具體值根據參數在報警區域對整個設備的健康度影響程度而定。影響越大,可設定ψi的值越大。不同采集參數具有不同的ψ值,說明參數值增加時,對整個健康度的影響程度。xi是采集參數i的值,ηi是參數i最佳值。boundi是其邊界閾值。很明顯,當采集參數值超過邊界值時,會快速增加,凸顯該參數對整個健康狀態的影響顯著增強。
參數i的綜合權重指數w’i是動態權重指數wid和靜態權重指數wis之和,如公式(7)。
(7)

(8)
為了得到含有權重因子的待處理數據,在數據進行歸一化處理時,需要融合權重因子的影響,這樣就更好地反映了各個參數對健康度的影響。含有權重的歸一化采集數據值為:
(9)
在公式(9)中,xi是采集參數i的數據值,wi是其對應的權重因子。μi則是該參數最佳值,δi是其標準差,考慮計算標準差的特殊性,可采用迭代算法[19]。這樣計算的結果代替原始采集數據xi用于SVDD建模及后續SVDD距離計算,可以很好地體現某些惡化參數對健康度的影響。
SVDD模型超球面反映了健康數據的范圍。對每個采集數據向量z,可以計算其到超球面圓心的距離d,然后根據這個距離大小可以得到量化的健康狀態,即健康度。通常d越大表示數據所代表的健康狀態越差,如圖1所示。

圖1 不同樣本與SVDD超球體位置關系
通過擬合運算可以從距離d得到健康度。要進行擬合運算需要有各種健康狀態的樣本數據。但在樣本不均衡情況下,很難有全面的樣本數據。通常對缺乏的數據樣本通過人工經驗進行構造。訓練樣本的距離d和健康度E之間屬于一種函數關系,根據設備健康度的變化特點,采用二項式回歸模型具有較好的擬合效果。二項式回歸的本質是通過學習,構造一條二項式曲線:
Eθ(d)=θ0+θ1d+θ2d2
(10)
二項式曲線應該盡可能擬合所有用于訓練樣本的距離d及其評估健康度E。當未來的采集數據計算出距離d后,可以很快根據曲線函數得到對應的健康度Eθ。
1)主成分分析法:
為了降低處理強度,在采集數據較多時,需要進行降維處理。即在盡可能保留原始數據特征的同時,盡可能降低處理數據的維度。本方法采用了PCA主成分分析法(Principal Component Analysis)來進行降維處理。它是一種常用的高維數據降維方法。其基本處理流程如圖2所示。

圖2 PCA降維處理方法流程
圖2是M條N維數據進行降維處理后,得到k維數據的處理過程。由于其處理過程比較簡單固定,在此不做過多分析。
2)異常值剔除算法:
異常值一般是由于采集器件出現漂移或者故障出現的,對健康狀態的評估具有錯誤的指示,需要剔除。基本思想是規定一個置信限度,凡是誤差超過該限度的值認為是異常值。本文采用一階差分法,即用兩個測量值來預估新的測量值,然后與實際測量值進行比較,如果大于設定的閾值,則認為是異常值需要剔除。令xn是采集值,則:
x′n=xn-1+(xn-1-xn-2)
(11)
|xn-x′n| (12) 公式(11)計算出參數的當前估計值x’n,在公式(12)中與真實的參數進行比較。w為設定的閾值,與參數的變化幅度有關。 3)參數平滑處理方法: 設備檢測參數由于設備的原因,免不了有噪聲影響。采用平滑處理可以減少噪聲影響,還可以表現參數數據的周期趨勢。采用指數加權平均算法,運算量少,且具有不錯的效果。 vt=βvt-1+(1-β)xt (13) 其中:vt是要代替的估計值,即t時刻的指數加權平均值。xt是t時刻采集的參數值;β是一個權重參數(0 <β< 1 )。β越小,噪聲越多,雖然可以很快適應參數的變化,但是容易出現異常值;β越大,得到的結果越平滑,但是對參數變化的適應慢。一般需要根據參數的實際情況進行調節,得到最佳效果。一般令β= 0.9。 綜合以上算法,可以總結出基于SVDD的健康度評估過程如圖3所示。整個過程分為兩階段進行: 圖3 基于SVDD的健康度評估算法 1)在學習階段,主要針對樣本訓練集進行處理。鑒于樣本數據已經經過選擇,一般不需要再進行預處理。這里主要根據樣本向量中的參數值計算其動態權重指數,得到各個參數的權重因子,然后利用公式(9)計算含權重因子的歸一化數據。如果樣本處于健康狀態,則進行SVDD超球面訓練得到SVDD模型。如果是非健康數據,則利用SVDD模型計算到其到超球面圓心距離d,根據其評估的健康度E進行二項式回歸學習,得到計算健康度的二項式回歸模型。 2)在檢測階段,主要針對測試和檢測集。首先進行數據預處理和權重因子計算,得到包含權重因子的歸一化數據,然后利用SVDD模型計算到超球面圓心距離d,接著利用前面學習得到的二項式回歸模型計算健康度,從而得到評估結果。 無論在訓練階段還是檢測階段,都利用了主成分分析的結果來選擇樣本向量參數,降低分析向量維度,提高分析效率。 為了驗證前述方法的正確性,利用某型雷達發射機作為實際例子進行評估分析。雷達發射機是雷達最重要的關鍵子系統,也是容易出現故障的部分,是重點健康管理監控設備。 1)采集數據分析,構建專家知識表: 雷達發射機的作用是在定時信號的激勵下,產生大功率的射頻信號。其狀態監控參數較多,主要包括電磁信號參數、機械性能參數、電力參數及熱參數等。為了對本文所提方法進行評估,針對某型氣象雷達的發射機系統進行了實例評估。該雷達發射機采集了將近二十多個數據,但并不是所有數據都與健康狀態密切有關。利用PCA算法及專家評估后,將與健康狀態有主要影響的參數分辨出來。最后選擇了11個與健康狀態密切相關的參數作為處理數據集,得到的專家知識表如表1所示。表中包括各個參數的最佳值、最大值、最小值邊界,以及靜態權重ws、動態權重參數φ等。需要根據采集值和最佳值的大小來決定bound值是選擇最大值還是最小值。雷達專家在長期維修過程中,對這些參數的含義具有非常深刻的理解,因此填寫表1的信息并不困難。雖然不是特別準確,但對用于驗證本方法已經具有足夠的準確性。 表1 主要監測參數基本信息表 2)構建樣本數據集: 在實際采集的雷達發射機監測數據中,共選取了3 000組數據作為訓練和測試樣本。其中2 900組數據是健康數據樣本用來訓練SVDD模型,另外100組數據是各種健康狀態下的數據樣本。選擇了其中92組用于二項式回歸學習建模,另外8組具有各種健康狀態的樣本作為測試集。由于非健康數據樣本積累較少,大部分非健康數據樣本利用了平時故障模型,并根據專家經驗評估其健康度,作為有標記樣本。在整個處理過程中,所有樣本數據都需要計算動態權重,最后按照公式(9)進行加權的歸一化計算,便于后續分析。 3)利用SVDD模型進行訓練得到超球面: 首先利用其中的2 900組健康數據樣本訓練SVDD模型。為了比較不同情況下訓練的結果,分別用兩種情況下的數據樣本進行了訓練,即①原始數據;②利用權重因子加權的數據。兩種情況下得到的超球面數據如表2所示。 表2 不同處理情況下的超球面數據 由于是11維的數據向量,其圓心也是由11個數據構成的數組。很明顯,在同樣的樣本下,加權處理后的數據超球面半徑小很多,證明數據收斂程度更好。 4)利用二項式回歸訓練方法建立健康度擬合曲線: 使用了92組數據進行二項式回歸訓練。每個健康狀態有20多個樣本,得到樣本到超球面圓心的距離與健康度的映射關系。為了對比,也是針對SVDD的兩種情況進行分別訓練,結果如表3所示。 表3 二項式回歸擬合結果 5)結果分析: 8個用于測試的樣本中,每個健康狀態有兩個樣本。與前面一樣,也是分別針對兩種數據處理情況,進行健康度評估測試。測試結果對比曲線如圖4所示。其中的標定健康度是根據專家經驗人工標定的結果。 圖4 測試樣本的結果分析 測試表明,經過加權處理之后評估健康度最接近人工標定的健康度,在各種不同健康狀態下的測試結果都比較穩定,具有最佳效果。而沒有加權處理的結果偏離比較大。雖然整體趨勢也比較一致,但在很多情況下,并不嫩準確地反應設備應有的健康狀態。 針對設備在進行健康管理過程中存在的樣本不均衡性,本文利用了SVDD模型超球面的特點,通過權重因子融合了采集參數值變化對健康狀態的影響。結合二項式回歸擬合算法,提出了一種適用于采樣不均衡條件下的設備健康度評估方法。該方法有效解決了實際工作中由于樣本缺乏或樣本不均衡情況下設備健康度評價的難題。特別是利用指數函數動態調整各參數在取值不同情況下對健康狀態的影響,反映了各個參數對健康狀態影響的動態變化,對健康度的準確評估具有重要意義。通過對某型雷達發射機的實際評估和分析,該方法對于準確評估設備的健康度適應性好,具有不錯的實用價值。2.5 健康度評估方法

3 健康度實例評估與分析




4 結束語