趙麗琴,劉 昶,易發勝
(成都大學 信息科學與工程學院,成都 610106)
雷達是現代防空探測預警系統的重要設備,結構復雜,使用頻率高,從而導致故障率高.為保障作戰任務的順利完成,及時了解雷達裝備的健康狀態具有非常重要的意義.特別是雷達發射機是雷達的核心功能部件,具有高功率、大電流、高電壓及熱耗大等工作特點,可靠性最低,保障難度大.因此選擇雷達發射機作為健康狀態研究對象,具有典型的指導意義和實用價值[1].
健康狀態的評估主要有兩種,一種是評估設備的健康狀態等級.比如按照國軍標的要求,雷達可分為健康、亞健康、注意、惡化、病態等5 個等級[2],也有根據實際情況分為健康、注意、警告、故障等4 種狀態的.另一種則是對健康狀態的量化,分析設備的健康度,可以更加準確的反映設備的健康程度,避免了分級的不統一性和粗放型.目前大部分健康狀態評估研究是評估設備的健康狀態等級,其本質是利用采集參數進行數據融合,確定設備的健康等級類別[3].鑒于設備健康狀態的模糊性,采用模糊綜合評判方法進行健康狀態評估是一種廣泛使用的方法[4-6].隨著大數據分析技術的成熟,利用機器學習進行健康狀態評估的研究也不斷涌現[7,8].
設備健康度一般用0 到100 的范圍來說明設備的健康程度.其中0 表示故障狀態,100 表示非常健康的狀態.為了更加準確地判斷設備的健康程度,目前對設備健康度的研究日益增多.文獻[9]把設備的健康狀態看做一個灰色系統,構建一個虛擬健康向量,用灰色關聯法計算采集向量和虛擬向量的關聯度得到健康度.文獻[10]分析不同屬性的相關性關系,通過信息熵方法進行量化來實時監控生產線健康度.也有基于機器學習方法來進行健康度的評價的研究[11,12],但是考慮到大多數設備缺乏足夠的數據進行訓練,這方面的研究并不多.更多的研究是把采集參數看做一組向量,利用采集向量和不同健康等級的向量相關性來評價健康度,使用較多的算法有馬氏距離、余弦相似度、高斯相似度等[13-15].鑒于各個參數在健康度中的影響不同,文獻[16,17]提出了綜合權重的健康度分析方法.為了防止單個參數異常可能信息被淹沒的現象,文獻[18]提出了動態權重機制,文獻[19]提出了利用變權權重替換常權權重,以得到科學的健康度指標.相較于傳統的權重指標大多通過專家經驗或者統計概率來獲取,文獻[20]利用大數據分析權重提供了一種新思路,但需要大量數據進行分析.
目前,針對設備健康度的分析方法還不夠成熟.主要問題是沒有考慮個別或者少數參數惡化對整個設備健康度的影響程度.鑒于此,本文利用向量相似性原理,重點關注少量指標惡化對整個設備健康度的影響效果,提出了一種新的動態權重指標模型.其主要思想是考慮采集參數的類別和大小變化對健康度的影響不同,構建基于指數函數的動態權重模型.通過對模型中有關參數的設置,可以得到比較準確的健康度數據,為實現設備精細化健康管理奠定基礎.
某型雷達發射機目前采集了二十多個與健康狀態相關的參數.根據其結構特點,有些部件是關鍵件,一旦狀況不佳將影響整個發射機的運行;有些是非關鍵零部件,出現故障可能會讓發射機工作狀況不佳,但不至于影響整體運行;還有些具有備份,是并聯部件,即使損壞也不影響設備的正常工作,但是顯然會降低設備的健康度.綜合這些情況說明,不同采集參數類別對雷達健康度的影響程度是不一樣的.
為了更好地描述不同參數對健康度的影響,參考相關文獻的做法,將權重分為靜態權重和動態權重兩種類型.其中,靜態權重說明了各個參數對健康度的固定貢獻,一般根據經驗值或者某種機制來決定,比如該參數的變化程度(方差)、某個時間內該參數超界發生故障的次數等.在本方法中,靜態權重一開始通過專家打分確定,然后在運行過程中,自動不斷修正,以反映雷達運行的實際情況.靜態權重的大小由靜態權重指數決定.靜態權重指數計算公式如下:

在式(1)中,對于參數i,其權重指數wis由3 部分構成.wi0是專家打分的結果.δi是參數的歸一化方差值.采用歸一化處理是為了消除量綱的影響.α是方差修正參數.γi是最近一年該參數出現故障的次數,β是故障次數修正參數.
根據設備實際運行中總結的經驗得知,不同參數在取值不同時對設備健康程度影響有很大差別.當參數值在健康區域周圍時,參數靜態權重起主要作用.但是當采樣參數值偏離正常區域越大,越接近報警區間,其對設備健康狀態的影響也越大.用動態權重指數表示某個采樣參數對健康狀態的影響程度,則其規律可用圖1來表示.

圖1 狀態數據與健康狀態影響權重指數關系
在圖1中,橫軸表示采集參數值,x0表示最佳值,xmin和xmax分別表示最小最大報警區間.縱軸表示健康狀態影響程度的權重指數,在采集參數值處于最佳值附近時,其體現的權重指數處于最低值w0,實際上體現了靜態權重指數.參數值向下偏離或者向上偏離最佳值,都會對導致健康狀態的惡化程度增加,體現在相應的動態權重指數增加.通常向不同方向偏離的影響程度可能不同,但根據總結,其增加趨勢皆呈現一定的指數形式增長.因此動態權重使用指數函數進行建模,表示如下:

其中,ai是采集參數i動態權重的指數函數底數值,且ai>1.按照參數i在報警區域對整個設備的健康狀態影響而定.影響越大,ai的值越大.不同采集參數具有不同的ai值.為了消除采樣數據量綱的影響,并且更方便地確定ai值,可讓歸一化到[0,1]之間.這樣動態權重指數的計算值區間為[1,ai],即動態權重指數在參數值為最佳值時,結果為1;達到報警區域時,得到最大動態權重指數為ai.因此只需關心參數i在處于報警區間時對整個設備健康狀態影響程度,就可以大概估計ai值.此外,計算權重指數只是確定不同采樣參數相對影響大小,并不用關心權重指數絕對值是否合理.這為本方法實際應用帶來了可行性.故:

其中,xi是參數i的監測值,xi0是最佳值,maxi(mini)是參數i的最大(最小)報警邊界值.
按照式(2)計算的動態權重指數本質上是參數采集值偏離最佳區域的大小對健康度的影響進行的計算.這需要理解和分析各個參數對健康狀態的影響情況.目前雷達維修專家根據長期積累的經驗,可以比較好的估計α值、最佳值、最大最小報警區間,構成專家知識表,能夠支持本文提出的評估方法.
兩個權重指數之和,代表參數i在某個時候的全部權重指數wip:

參數的權重指數并不能應用到實際計算中去,采用權重因子是更科學的做法.即對各參數組成向量,要求滿足因此有:

其中,wi是參數i在一個由n個參數組成的向量中的權重因子,說明參數i在整個向量中的重要性.
設備監測的一系列參數可以看作一個向量.考慮以一個最健康的向量u為中心,那么采集向量Xk到u的距離就可以看作是一個健康度的體現.距離越大,表示監測值越偏離健康中心,健康度越差.目前這樣的距離算法有余弦相似度、歐式距離、馬氏距離等不同的計算方法.余弦相似度主要以向量角度偏差為目標,不適合本研究的目標.雖然馬氏距離考慮了不同參數之間的聯系,且與參數量綱無關,廣泛用來表征設備的健康度.但在實際使用過程中,由于參數之間的相關性影響,常常由于無法求協方差逆矩陣而失敗,導致其計算不穩定,并且馬氏距離還夸大了變化微小變量的作用.很多情況下,歐式距離成為馬氏距離的后補算法.綜合考慮,本文采用加權標準歐式距離來進行計算,克服了普通歐式距離的缺點,具有較好的效果且計算量小.其計算公式為:

其中,假設在n個參數構成的向量Xk中,wki是向量中參數i對應的權重因子,xki是向量Xk中參數i 的采集監測值.健康向量u通過專家經驗構建.是參數i的方差,實際上反映了參數i的波動性.為了比較準確地計算實時采樣方差,采用文獻[21]提出的迭代法,可以迭代計算自從監測以來的各參數方差,且計算量少,在此不再詳述.
直接計算出來的距離值Dk還不是設備的健康度.考慮到距離越大,設備健康越差;而一般設備越不健康,健康度數值越低.因此使用負向函數,將計算得到距離換算為健康度.假設針對某個向量計算的距離值為D,根據文獻[18]可得如下公式:

其中,Dh和Dl是所有計算得到距離上下限.A是健康度范圍,b是形狀參數,當b=0 是表示線性處理.按照一般處理經驗,如果Dl=0,A=100,b=0,式(6)可以簡化為:

某型雷達發射機由射頻放大裝置、調制柜、高頻柜及冷卻系統構成.其中調制柜和高頻柜是發射機的核心部分,包括整流電源分機、發射監控分機、充電控制分機、可控硅調制分機、磁場電源分機、燈絲電源分機、注電源分機等若干部分構成.系統每6 s 采集20 個表征發射機健康狀態的監測參數.利用這些參數進行健康度評估過程如圖2所示.

圖2 雷達發射機健康度評估過程
整個過程分為3 步進行,分別說明如下:
① 根據主成分分析法,決定需要參與健康度評估的監測參數.然后按照專家經驗,確定參數的最優值、最大最小范圍及其靜態權重指數、動態權重參數等信息,作為數據分析的依據.
當獲取監測參數時,對這些參數進行預處理.主要預處理過程包括參數的平滑處理、歸一化處理,以及參數值的合理性檢查和剔除異常數據.
② 權重因子計算.根據前面的式(1)修正靜態權重,根據式(2) 計算動態權重,利用式(4)、式(5)計算各個參數的權重因子.
③ 健康度的計算.利用式(6)計算加權標準歐式距離,然后利用式(8)計算實時健康度.
考慮步驟②③前面已經介紹很清楚,下面重點介紹步驟①的各種處理.
利用主成分分析法確定參與健康度計算監測參數.主成分分析(Principal Component Analysis,PCA)是一種用于高維數據降維的技術.PCA 可以把可能具有線性相關性的高維變量合成為線性無關的低維變量.新的低維數據集會盡可能的保留原始數據的特征,從而達到降維的目的.假設有M個N維數據需要進行降維處理,PCA 算法步驟如下所述:
① 將原始數據按列組成N行M列矩陣X;
② 對X的每一行進行零均值化;
③ 計算出均值化矩陣X的協方差矩陣C;
④ 求出C的特征值及對應的特征向量;
⑤ 將特征向量按對應特征值大小從上到下按行排列成矩陣,取前k行組成矩陣P;
⑥Y=PX即為降維到k維后的數據.
經過PCA降維之后的數據有11 個,利用專家經驗可以估計其最佳值、預警邊界值、動態權重參數等信息.雷達發射機選擇的監測參數的重要信息如表1所示.表1中,αmax和αmin分別表示某個參數正向和負向偏離時的動態權重指數函數底數值,ws則表示當前靜態權重.由于權重最后要進行歸一化處理,這些經驗參數只需要相對值合理就行,降低了專家知識要求難度.

表1 監測參數重要信息表
在實時采集的監測參數中,由于傳感器的不穩定性或者人為因素,可能造成個別數據不切實際,這種數據稱為異常值;另外在采集數據過程中,也會不可避免地疊加上噪聲干擾,影響數據質量,因此必須進行平滑處理,消除噪聲干擾.下面簡要說明處理過程.
(1)平滑處理.為了過濾監測參數的噪聲,采用平滑處理可以減少噪聲影響,并將數據的周期趨勢表現出來.本文采用簡單的指數加權平均算法,運算量少,且具有不錯的效果.

其中,θt是t時刻采集的參數值;vt是要代替的估計值,即t時刻的指數加權平均值.β是一個權重參數(0 <β<1).一般令β=0.9.β越小,噪聲越多,雖然可以很快適應參數的變化,但是容易出現異常值;β越大,得到的結果越平滑,
但是對參數變化的適應慢.一般需要根據參數的實際情況進行調節,得到最佳效果.
(2)剔除異常值.基本思想是規定一個置信限度,凡是誤差超過該限度的值,認為是異常值,需要剔除免于處理.用一階差分法來進行異常值剔除處理.具體思路是用兩個測量值來預估新的測量值,然后與實際測量值進行比較.如果大于設定的閾值,則認為是異常值,給予剔除處理.


采用Python 語言編程實現了上述算法.使用了Pycharm 開發調試工具,運行在Windows 10 操作系統下.測試過程使用了前面表1選擇的11 個參數,利用了其專家知識表中的信息.考慮到實際監測的數據沒有包含所有健康狀態的情況,根據分析需要,對部分參數的監測值進行了模擬仿真,以檢查算法對各種健康度計算的適應性.這樣產生了多組測試數據,分別對應健康、注意、報警、故障等4 種狀態.表2選擇了其中具有代表性的八組數據來進行分析.

表2 用于測試分析的采集數據及其權重因子向量表
在表2中,采集數據向量X表示由11 個采用數據組成的向量,各個數據含義與表1中的參數名稱順序一致,如第一個數據是鈦泵電流、第二個是燈絲電流…依次類推.權重指數向量W則是按照公式(4)對靜態和動態權重指數進行相加后結果,可以直觀看出各個參數的當前相對比重.表中對偏移最佳值較多的數據用下劃線加粗給予重點標識,其對應的權重指數也一樣標識,便于識別.可以明顯看出,某個采集數據偏離正常值越多,其對應的權重因子占比增大.數據組1、2 是健康數據,其權重主要體現的是靜態權重的影響.3、5、7 僅有一個參數處于不同的健康狀態,而數據組4、6、8 則有2 個以上的參數相對最佳值偏移量較大.其對應4 個類別的健康狀態是專家評定的.從表2可明顯看出,偏移最佳值越多,其權重指數越大,表示這些偏差比較大的參數對整個健康度的影響占比就越大.
為了體現動態權重的計算對健康度準確評估的重要影響,對各種情況下的健康度計算做一個對比,即分別用標準歐式距離H1、純靜態權重標準歐式距離H2 及綜合靜態和動態權重標準歐式距離H3 進行評估,結果與專家評估的健康度H 對比,其結果如表3和圖3所示.
所有評估結果都是按照式(6)~式(8)計算出來的健康度數據.計算H1 時,令式(6) 的wki固定為1;在計算H2 時,令式(4)的wip等于wis,忽略動態權重的計算,后面的計算過程沒有變化;而H3 的計算則完全按照前面的描述進行.專家評估的結果是根據采集數據的情況由專家綜合評定的健康度.
從表3可以看出,H3 的值與專家評估的健康度最貼合.而不使用動態權重或者只使用靜態權重指數都很難體現準確的健康狀態.相對來說,某組偏離正常值的數據成員越多,其不同健康度評估結果相對比較接近.說明在沒有使用動態權重計算時,如果只是某個參數影響的整個健康狀態,很難得到準確健康度,甚至很難體現該組數據所代表的健康狀態.圖3通過折線圖的方式,更加直觀的體現出這個結論.

表3 在不同方法下的健康度評估對比表

圖3 不同方法健康度評估對比圖
為了檢驗專家知識不準確對計算結果的影響,我們有意修改表1的專家知識表中αmax和αmin的值.總共修改了3 組,其中一組隨機放大或縮小30%,一組在30%范圍內隨機減小,一組是整體等比例減小30%.其他數據保持不變,為了方便比較,圖中保留專家評估值,結果如圖4所示.

圖4 修改α 值的健康度評估對比圖
從圖4可以看出,隨機增減的一組影響最大,其次是隨機減少,而固定減少則基本和評估值保持一致,僅有比較小的差異.即使影響最大的一組,也只是部分地方誤差大,實際上隨機增減較容易讓某些參數的動態權重和對應的健康狀態不匹配,計算的健康度誤差也會比較大.總的來說,在30%的偏差下,綜合計算偏差在可接受范圍內.表明對專家預估的權重指數要求并不很高,從而表明該方法具有一定實用性.
本文根據某型雷達發射機的實際情況,提出了一種根據監測參數值的變化影響動態權重指數的計算模型,并利用加權標準歐式距離來準確計算設備健康度的方法.通過專家經驗設定了指數模型的參數之后,可以突出偏離健康區間比較大的參數的權重比例,從而讓少量參數惡化導致的設備健康狀態變差的情況在設備整體健康度計算上得到合理反映.測試分析表明,本方法具有較好的準確性,對于評價復雜設備的健康程度是可行合理的,具有一定的使用價值.
在具體實施過程中,本方法的準確性依賴專家對有關參數的理解和經驗,這在一定程度上限制了本方法的廣泛應用.下一步將根據采集的健康向量標記數據,利用核密度估計算法,結合數值優化算法自動評估和優化動態權重評估需要的相關專家經驗值,這樣可減少對專家知識的依賴,還可以自適應不同工作狀態下相關參數變化,讓本方法具有更好的適應性.