王佳晨,張宇來(lái),岑 崗
(浙江科技學(xué)院 信息與電子工程學(xué)院,浙江 杭州 310023)
液壓狀態(tài)監(jiān)測(cè)系統(tǒng)(hydraulic condition monitoring system,HCMS)作為一種通過(guò)減少機(jī)器停機(jī)時(shí)間來(lái)提高生產(chǎn)過(guò)程的規(guī)劃安全性的系統(tǒng)被廣泛使用[1,2]。在HCMS的使用過(guò)程中,其監(jiān)測(cè)過(guò)程所需數(shù)據(jù)一般通過(guò)各類傳感器獲取[3,4],然而在實(shí)際應(yīng)用中,HCMS內(nèi)的傳感器所處工況環(huán)境惡劣,傳感器在工作過(guò)程中易于導(dǎo)致自身故障、老化等問(wèn)題[5],從而對(duì)其監(jiān)控設(shè)備的健康程度進(jìn)行誤判,影響其監(jiān)控設(shè)備本身的工作狀態(tài),甚至引發(fā)系統(tǒng)故障[6]。同時(shí)隨著系統(tǒng)承載的子系統(tǒng)的增加,系統(tǒng)搭載的傳感器數(shù)量不斷增多[7],系統(tǒng)由于傳感器發(fā)生問(wèn)題而導(dǎo)致故障的可能性也急劇提高。現(xiàn)階段針對(duì)監(jiān)測(cè)系統(tǒng)的故障診斷方法一般通過(guò)添加相應(yīng)異常監(jiān)控模塊,在系統(tǒng)出現(xiàn)異常數(shù)據(jù)后進(jìn)行判斷[8,9],該類方法無(wú)法快速定位具體傳感位置,且無(wú)法在故障產(chǎn)生前預(yù)測(cè)故障,因此實(shí)際應(yīng)用效果較差。當(dāng)前故障監(jiān)測(cè)系統(tǒng)的底層都是由各種傳感器實(shí)現(xiàn)的,液壓監(jiān)測(cè)系統(tǒng)的各種故障也都對(duì)應(yīng)于各類傳感器故障。所以本文計(jì)劃將HCMS故障診斷方法定性為傳感器故障診斷,通過(guò)預(yù)測(cè)系統(tǒng)中傳感器是否出現(xiàn)故障判斷該傳感器所處區(qū)域是否發(fā)生故障,該方法可以在故障發(fā)生前定位并解決故障,解決了傳統(tǒng)方法的不足。
由于貝葉斯網(wǎng)絡(luò)針對(duì)不確定數(shù)據(jù)預(yù)測(cè)具有先天優(yōu)勢(shì),其針對(duì)傳感器故障預(yù)測(cè)有著極強(qiáng)的適用性,因此本文采用貝葉斯網(wǎng)絡(luò)對(duì)HCMS中的傳感器故障進(jìn)行預(yù)測(cè)。但是傳統(tǒng)的貝葉斯網(wǎng)絡(luò)在進(jìn)行預(yù)測(cè)時(shí),貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)往往依賴于專家人為給出,缺乏可靠性與準(zhǔn)確性。目前,許多針對(duì)貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)的構(gòu)建方案已被提出,主要可以歸結(jié)為以下兩類:第一類是結(jié)合神經(jīng)網(wǎng)絡(luò)相關(guān)概念生成貝葉斯網(wǎng)絡(luò)[10-12],第二類方法是將傳統(tǒng)方法與新的數(shù)理方法或者因果推斷技術(shù)相結(jié)合[13,14]?;跁r(shí)間效率與理論的可解釋性考慮,本文提出一種基于結(jié)合信息幾何理論與K2評(píng)分搜索策略優(yōu)化貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)的生成方法,生成高可靠性的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu),從而提高貝葉斯網(wǎng)在HCMS中傳感器故障診斷的準(zhǔn)確率。
本文具體工作如下:①提出一種基于信息幾何理論與K2評(píng)分搜索策略的優(yōu)化BN結(jié)構(gòu)的生成方法IGCS-k2,并通過(guò)理論與實(shí)驗(yàn)驗(yàn)證其有效性;②將IGCS-K2方法構(gòu)建的BN應(yīng)用于HCMS中,為其進(jìn)行傳感器故障診斷。
貝葉斯網(wǎng)絡(luò)(Bayes network,BN)也稱可信度網(wǎng)絡(luò),是由因果推理方法的奠基人Pearl在1988年提出的一種基于貝葉斯規(guī)則的不確定概率推理模型,是目前解決不確定性問(wèn)題最有效的理論模型之一[15]。該網(wǎng)絡(luò)的概率推理過(guò)程依托于貝葉斯公式,即
(1)
其中,P(Bi)稱為事件Bi的先驗(yàn)概率,P(Aj)稱為事件Aj的先驗(yàn)概率,貝葉斯公式得到的條件概率P(Bi|Aj)稱為后驗(yàn)概率。
BN模型是一個(gè)有向無(wú)環(huán)圖,是概率圖模型的一種,該模型通過(guò)圖像的形式直觀地描述隨機(jī)變量之間的因果關(guān)系,并通過(guò)計(jì)算每個(gè)變量的條件概率來(lái)進(jìn)行概率推理。具體表現(xiàn)形式如下
B= 〈G,P〉
(2)
其中,G表示的是一個(gè)有向無(wú)環(huán)圖,由節(jié)點(diǎn)和連接各個(gè)節(jié)點(diǎn)的單向弧線組成,網(wǎng)絡(luò)參數(shù)P由G中所有節(jié)點(diǎn)的概率分布組成,描述每個(gè)節(jié)點(diǎn)在其父節(jié)點(diǎn)影響下的條件概率。
BN概率推理的過(guò)程即為在利用給定證據(jù)變量集合E=e后,對(duì)需要計(jì)算的變量集X={X1,>X2,>…,>Xn}在第q種狀態(tài)下的概率分布進(jìn)行估算,其計(jì)算過(guò)程如下

(3)
信息幾何因果推斷(information-geometric causal infe-rence,IGCI)是一種基于因果函數(shù)模型的因果關(guān)系方向推斷方法,該方法以結(jié)構(gòu)方程模型為基礎(chǔ),結(jié)合信息幾何理論,提出了基于信息熵的因果推斷方法[16],該方法利用原因變量分布的獨(dú)立性和基于給出原因的結(jié)果的獨(dú)立性,利用因果之間的不對(duì)稱性來(lái)判斷變量間的因果關(guān)系[17]。當(dāng)我們假定f(x)是[0,1]的嚴(yán)格單調(diào)遞增的可分辨雙射時(shí),我們可以得出下式
(4)
進(jìn)而變量x的概率密度函數(shù)p(x)、變量y的概率密度函數(shù)p(x)與函數(shù)f(x)的關(guān)系如圖1所示。

圖1 IGCI方法變量與函數(shù)關(guān)系圖解
因此,我們可以得出如果p(x)與f的斜率無(wú)關(guān),則在f斜率較低(f-1斜率較高)的區(qū)域p(y)的密度較高。此時(shí),p(y)與f的反函數(shù)f>-1關(guān)系如下

(5)
由于該式當(dāng)且僅當(dāng)法f′是常數(shù)時(shí)成立,因此由下式可知(f-1)′和p(y)是正相關(guān)的
(log(f-1)′·p(y))-(log(f-1)′)·E(p(y))>0
(6)
因此只要變量X的概率分布X不包含Y|X的信息時(shí),就會(huì)存在X|Y,除了f是線性的這種情況。
基于上述方法證明得出的不對(duì)稱性,IGCI方法引入如下表達(dá)式

(7)

(8)
利用海量數(shù)據(jù)進(jìn)行學(xué)習(xí),得到一個(gè)關(guān)系網(wǎng)絡(luò)是BN進(jìn)行后續(xù)工作的基礎(chǔ),然而現(xiàn)有BN結(jié)構(gòu)學(xué)習(xí)方法均存在許多問(wèn)題,特別是在連續(xù)型數(shù)據(jù)的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)生成方面,存在網(wǎng)絡(luò)結(jié)構(gòu)準(zhǔn)確度低、計(jì)算時(shí)間過(guò)長(zhǎng)、結(jié)果方差大等問(wèn)題。因此為了提高針對(duì)連續(xù)數(shù)據(jù)的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)生成準(zhǔn)確度,本文引入信息幾何因果推斷方法(information-geometric causal inference,IGCI),借鑒該方法的思路引入信息幾何因果強(qiáng)度(information-geometric causal,IGCS)的概念,利用IGCS將變量排序后輸入到最有效的結(jié)構(gòu)學(xué)習(xí)方法之一的K2評(píng)分搜索策略[18]中,形成了一種新的BN結(jié)構(gòu)生成方法IGCS-K2,具體流程如圖2所示。

圖2 改進(jìn)的BN結(jié)構(gòu)生成方法流程
下面本文將基于該流程圖詳細(xì)展開(kāi)。首先為了驗(yàn)證該方案的合理性,同時(shí)模擬連續(xù)數(shù)據(jù)在現(xiàn)實(shí)世界中的情況,本節(jié)將利用一個(gè)簡(jiǎn)單的貝葉斯網(wǎng)絡(luò)進(jìn)行說(shuō)明,本節(jié)中使用的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。

圖3 實(shí)驗(yàn)數(shù)據(jù)下的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)

其次,利用上述BN模擬生成的數(shù)據(jù),本文通過(guò)如下算法計(jì)算出各個(gè)變量的IGCS序列:
算法1:IGCS序列算法
輸入:一組變量數(shù)為N,樣本個(gè)數(shù)為任意數(shù)的完整數(shù)據(jù)集data
輸出:根據(jù)IGCS排序后的序列order
步驟1建立一個(gè)N*N的矩陣CRD用于存放變量?jī)蓛芍g的信息幾何因果推斷方法評(píng)分,其中行用i表示,列用j表示;
步驟2設(shè)置IGCI方法的參數(shù)methodpars,為了使由IGCI方法計(jì)算的分?jǐn)?shù)可以在”X→Y”和”Y→X”兩個(gè)方向上應(yīng)用于IGCS的計(jì)算,因此在此處我們選擇基于熵的IGCI估計(jì)器——">org_entropy”,其它參數(shù)采用默認(rèn)參數(shù);
步驟3計(jì)算所有變量?jī)蓛芍g的IGCI分?jǐn)?shù),儲(chǔ)存與矩陣CRD中,其中由于選取基于熵的IGCI方法,其“X→Y”與“Y→X”的值相反,因此可以在計(jì)算出右上三角矩陣后自己通過(guò)加上自身的轉(zhuǎn)置獲得完整的CRD矩陣;
步驟4將矩陣的每一行進(jìn)行相加,并將計(jì)算得出的值進(jìn)行排列,按值的大小將其所代表的變量序號(hào)形成新的序列輸出。
其中,IGCS(i)的值代表了變量i針對(duì)其它變量的信息幾何因果關(guān)系強(qiáng)度的出度,本文將利用其作為K2評(píng)分搜索策略序列輸入K2評(píng)分搜索策略中進(jìn)行BN結(jié)構(gòu)的構(gòu)建。在K2評(píng)分搜索策略中,K2策略將按順序逐個(gè)考察輸入序列中的變量確定其父節(jié)點(diǎn),然后添加相應(yīng)的弧,該策略的目的在于使得BN中層級(jí)越高的節(jié)點(diǎn)在輸入序列中出現(xiàn)的越早,K2策略計(jì)算獲得的BN結(jié)構(gòu)將越接近真實(shí)的BN結(jié)構(gòu)。因此BN相關(guān)學(xué)者普遍認(rèn)為K2策略最佳輸入序列是利用真實(shí)BN獲得的變量之間通過(guò)拓?fù)渑判颢@得的序列。IGCS算法借鑒該思路,利用轉(zhuǎn)移熵值計(jì)算每個(gè)變量與其它變量因果關(guān)系強(qiáng)度,通過(guò)和運(yùn)算得到其作為其它變量“原因”的可能性大小。
為了驗(yàn)證“多個(gè)變量之間的關(guān)系符合IGCS的值越大,其在BN網(wǎng)絡(luò)中作為其它變量的祖先節(jié)點(diǎn)可能性越大”的假設(shè),只需要證明在貝葉斯網(wǎng)絡(luò)中的任意3個(gè)節(jié)點(diǎn)中,處于父節(jié)點(diǎn)位置的IGCS值大于其子孫節(jié)點(diǎn)。
在貝葉斯網(wǎng)絡(luò)中,任意3個(gè)節(jié)點(diǎn)可能存在的關(guān)系如圖4所示。

圖4 任意3個(gè)節(jié)點(diǎn)之間存在的因果關(guān)系
其中A、B、C代表任意3個(gè)節(jié)點(diǎn)所代表的變量,①、②、③代表利用IGCI方法計(jì)算的熵轉(zhuǎn)移值,其中箭頭方向代表正向轉(zhuǎn)移方向。針對(duì)圖4(a),當(dāng)3個(gè)變量之間沒(méi)有因果關(guān)系時(shí),各變量之間不存在父子節(jié)點(diǎn)關(guān)系,無(wú)需證明。針對(duì)圖4(b)、圖4(c)、圖4(d),變量之間的關(guān)系直接由IGCI公式給出,無(wú)需證明。針對(duì)圖4(f),由于假設(shè)討論的情境設(shè)定為貝葉斯網(wǎng)絡(luò)下,該情境下不存在有環(huán)圖,因此不在考慮范圍之內(nèi)。最終,要證明此假設(shè)僅需證明圖4(e)的情況即可。為了證明該情況下的假設(shè)正確性,本文引入如下定理和引理:
定理貝葉斯網(wǎng)絡(luò)是一種信念網(wǎng),是基于有向無(wú)環(huán)圖來(lái)刻畫屬性之間的依賴關(guān)系的一種網(wǎng)絡(luò)結(jié)構(gòu)[15]。
引理如果轉(zhuǎn)移熵Tx→y,Tx→z,Tz→y都大于0,則在這種情況下,我們需要區(qū)分從x到y(tǒng)的因果影響是否只是通過(guò)中間變量z的間接途徑,或者是否存在另一種從x到y(tǒng)的直接途徑[19]。
證明:由于變量A、B、C是貝葉斯網(wǎng)絡(luò)中任取的3個(gè)節(jié)點(diǎn)所代表的變量,因此其符合貝葉斯網(wǎng)絡(luò)的特性,由定理可得,當(dāng)①>0且②>0時(shí),如變量A和變量C之間存在因果關(guān)系,則變量A是變量C的父節(jié)點(diǎn)。
由引理可得,當(dāng)變量A、B、C之間關(guān)系如圖4(e)所示,且熵轉(zhuǎn)移值①、②、③均大于0時(shí),當(dāng)且僅當(dāng)③>①+②時(shí)變量A才是變量C的父節(jié)點(diǎn)。
因此,③>①+②成立。
由IGCS原理可得,變量A的IGCS值IGCS(A)=①+③,變量B的IGCS值IGCS(B)=-①+②,變量C的IGCS值IGCS(C)=-②-③。綜合上式可得
IGCS(A)=①+③>2×①+2>-①+②=
IGCS(B)>2×②-③>-②-③= IGCS(C)
(9)
因此,IGCS(A)>IGCS(B)>IGCS(C),假設(shè)成立,多個(gè)變量之間的關(guān)系符合IGCS的值越大,其在BN網(wǎng)絡(luò)中作為其它變量的祖先節(jié)點(diǎn)可能性越大,IGCS的值作為K2評(píng)分搜索策略的輸入序列具有理論依據(jù),證明成立。
為對(duì)生成的N個(gè)IGCS值進(jìn)行排序形成遞減序列,本文設(shè)定v為原始索引向量,即當(dāng)k1 (10) 在完成IGCS的計(jì)算與排序后,將其輸入K2評(píng)分搜索策略中進(jìn)而生成BN網(wǎng)絡(luò),形成完整的IGCS-K2方法。 最后,為了驗(yàn)證本文所提出的BN結(jié)構(gòu)生成方法優(yōu)于其它常見(jiàn)的BN結(jié)構(gòu)生成方法,在比較各個(gè)BN結(jié)構(gòu)生成方法的過(guò)程中,我們提出基于結(jié)構(gòu)漢明距離(structural hamming distance,SHD)的模型準(zhǔn)確度判別方法“漢明距離結(jié)構(gòu)精確度(hamming distance structural accuracy,HDSA)”,該方法在計(jì)算兩個(gè)BN網(wǎng)絡(luò)漢明距離后,根據(jù)BN網(wǎng)絡(luò)是有向無(wú)環(huán)圖的基本邏輯,計(jì)算正確弧占所有弧的百分比。具體算法如下: 算法2:HDSA算法 輸入:學(xué)習(xí)得到的DAG圖dag1、正確的DAG圖dag2 輸出:兩個(gè)DAG之間的漢明距離結(jié)構(gòu)精確度hdsa 步驟1計(jì)算可能存在的邊數(shù) edg =(輸入DAG變量數(shù)-1)>^2 步驟2計(jì)算學(xué)習(xí)得到的DAG圖與正確的DAG圖的結(jié)構(gòu)漢明距離sdh fori← 1 to 輸入DAG變量數(shù) forj← 1 to 輸入DAG變量數(shù) ifdag1(1,j)=dag2(i,j) dosdh++ 步驟3計(jì)算兩個(gè)DAG之間的漢明距離結(jié)構(gòu)精確度hdsa hdsa=1-(sdh/edg) 為了對(duì)本文IGCS-K2算法進(jìn)行測(cè)試,此次的實(shí)驗(yàn)是在一臺(tái)CPU 是Inter(R) Core(TM) i7-6500U 2.50 GHz,內(nèi)存為8 GB,操作系統(tǒng)為windows7的電腦上進(jìn)行的,使用的編譯器為MATLAB R2018a。 基于上述方法,本文隨機(jī)生成的20組數(shù)據(jù)樣本間隔為1000條,數(shù)據(jù)樣本量由2000條至20 000條,樣本量的選取參考各類BN結(jié)構(gòu)學(xué)習(xí)方法能正確學(xué)習(xí)貝葉斯網(wǎng)絡(luò)的數(shù)據(jù)最低值。通過(guò)IGCS-K2方法、隨機(jī)K2方法、MCMC方法、MMHC方法、PC方法、TPDA方法分別生成BN結(jié)構(gòu),并通過(guò)HDSA 算法計(jì)算其模型準(zhǔn)確度。 為了減少運(yùn)算量的同時(shí)保證BN結(jié)構(gòu)的精確度,各方法的超參數(shù)設(shè)置見(jiàn)表1。 表1 BN結(jié)構(gòu)學(xué)習(xí)超參數(shù)設(shè)置 最終,各BN結(jié)構(gòu)生成方法模型準(zhǔn)確度均值與方差見(jiàn)表2。 表2 BN結(jié)構(gòu)學(xué)習(xí)結(jié)果對(duì)比分析 由上表可知,本文所提出的方法針對(duì)上述假設(shè)形成的BN具有更高的BN結(jié)構(gòu)精確度與穩(wěn)定性,且收斂速度最快,可以為后續(xù)HCMS傳感器故障診斷提供更好的基礎(chǔ)。 在HCMS中,為了對(duì)工業(yè)過(guò)程進(jìn)行更加全面的監(jiān)控,往往采用多個(gè)多源傳感器對(duì)整條工業(yè)流程中各個(gè)裝置及系統(tǒng)進(jìn)行監(jiān)控,同時(shí)由于在整個(gè)工業(yè)流程中,傳感器的值變化代表其監(jiān)測(cè)裝置中物質(zhì)或能量變換,因此本文認(rèn)為在工業(yè)流程下游位置的傳感器變化會(huì)隨著在工業(yè)流程上游位置的傳感器變化而變化,即上游位置的傳感器是下游位置傳感器的“原因”。因此,本文將傳感器在工業(yè)流程中的位置認(rèn)為是其在BN網(wǎng)絡(luò)中的理論實(shí)際位置。 在明確BN的理論結(jié)構(gòu)后,本文通過(guò)如圖5所示方法進(jìn)行傳感器故障診斷。 圖5 HCMS傳感器故障診斷方法流程 由于在實(shí)際的工業(yè)過(guò)程中,每個(gè)傳感器的值代表了其對(duì)應(yīng)裝置所處的狀態(tài),而工業(yè)過(guò)程本身是一個(gè)重復(fù)的生產(chǎn)過(guò)程,因此當(dāng)我們選取傳感器狀態(tài)正常的數(shù)據(jù)進(jìn)行學(xué)習(xí)時(shí),我們可以利用已知的其它傳感器處于某一個(gè)時(shí)刻的數(shù)值,對(duì)該傳感器的理論值進(jìn)行正確估計(jì)。 依照該思路具體展開(kāi),本文首先將已知的正確傳感數(shù)據(jù)進(jìn)行貝葉斯結(jié)構(gòu)學(xué)習(xí),獲得BN結(jié)構(gòu),并利用該數(shù)據(jù)對(duì)學(xué)得的BN進(jìn)行參數(shù)學(xué)習(xí),獲取變量之間的關(guān)系權(quán)重。其次,我們選取滿足數(shù)據(jù)情況的貝葉斯推理引擎,并選取需要判斷傳感器是否存在故障之外的多條傳感器數(shù)據(jù)觀測(cè)值,作為證據(jù)輸入到BN中,生成每組數(shù)據(jù)的后驗(yàn)概率。最后,本文將生成的后驗(yàn)概率作為理論上的正確值,與觀測(cè)得到的傳感器數(shù)據(jù)值進(jìn)行比對(duì),判斷該傳感是否存在故障。 在具體到是否存在傳感器故障的判斷過(guò)程中,本文將傳感器故障分以下4個(gè)大類:完全失效故障(CFF)、固定偏差故障(FBF)、漂移偏差故障(DPF)和精度下降故障(ADF)。當(dāng)存在上述每種故障時(shí),觀測(cè)數(shù)據(jù)與理論數(shù)據(jù)將會(huì)發(fā)生如下圖6所示的偏差,其中實(shí)心點(diǎn)代表觀測(cè)數(shù)據(jù),空心點(diǎn)代表理論數(shù)據(jù)。 圖6 傳感器故障類型 當(dāng)通過(guò)本文方法計(jì)算出該傳感器最近幾次的理論值yt后,通過(guò)其與觀測(cè)值yo的比較,計(jì)算兩者相對(duì)誤差,當(dāng)發(fā)現(xiàn)兩者相對(duì)誤差較大時(shí),則認(rèn)為該傳感器存在故障。確認(rèn)傳感器存在故障后,通過(guò)對(duì)yt、yo與兩者差值Δyt,o呈現(xiàn)出的特征進(jìn)行分析,利用專家經(jīng)驗(yàn)判斷其出現(xiàn)該種類型故障。具體方法如下: (1)如果傳感器觀測(cè)值yo保持不變,則判定傳感器發(fā)生完全失效故障(CFF)。 (2)如果傳感器觀測(cè)值yo變化,且差值Δyt,o為某一恒定常數(shù),則判定傳感器發(fā)生固定偏差故障(FBF)。 (3)如果傳感器觀測(cè)值yo變化,而差值Δyt,o隨時(shí)間發(fā)生線性變化,則判定傳感器發(fā)生漂移偏差故障(DPF)。 (4)如果傳感器觀測(cè)值yo變化,且差值Δyt,o時(shí)正時(shí)負(fù),且平均值趨于零,則判定傳感器發(fā)生精度下降故障(ADF)。 為了驗(yàn)證本文提出的傳感器故障診斷的有效性,本實(shí)驗(yàn)數(shù)據(jù)集選取來(lái)自kaggle的Condition Monitoring of Hydraulic Systems數(shù)據(jù)集,在一臺(tái)CPU 是Inter(R) Core(TM) i7-6500U 2.50 GHz,內(nèi)存為8 GB,操作系統(tǒng)為windows7 的電腦上進(jìn)行實(shí)驗(yàn),使用的編譯器為MATLAB R2018a,部分代碼使用Matlab CausalExplorer_1.5-master工具箱與Matlab Bayes Net Toolbox工具箱。 該數(shù)據(jù)集將Nikolai Helwig論文[20]中的數(shù)據(jù)按傳感器進(jìn)行數(shù)據(jù)分叉,該文中的數(shù)據(jù)集是通過(guò)實(shí)驗(yàn)從液壓實(shí)驗(yàn)裝置獲得,實(shí)驗(yàn)裝置由一級(jí)工作和二級(jí)冷卻-過(guò)濾回路組成,通過(guò)油箱連接,系統(tǒng)周期性地重復(fù)恒定的負(fù)載循環(huán),每個(gè)周期持續(xù)時(shí)間為60 s。分叉后的數(shù)據(jù)集包括各傳感器測(cè)量過(guò)程值(例如壓力、體積流量和溫度)與4個(gè)液壓組件(冷卻器、閥門、泵和蓄能器)的狀態(tài)定量變化情況。 本文的實(shí)驗(yàn)將抽取該數(shù)據(jù)集中的一級(jí)工作臺(tái)中的8個(gè)實(shí)際傳感器數(shù)值進(jìn)行實(shí)驗(yàn),根據(jù)其在系統(tǒng)中所處的上下游位置,我們可以獲得其理論貝葉斯網(wǎng)絡(luò)如圖7所示。 圖7 實(shí)驗(yàn)數(shù)據(jù)理論貝葉斯網(wǎng)絡(luò)結(jié)構(gòu) 在明確所需要選取的數(shù)據(jù)后,由于每種傳感器的屬性不同,本文通過(guò)獲取數(shù)據(jù)的變化均值的預(yù)處理方法得到每個(gè)傳感器的唯一屬性,從而進(jìn)行后續(xù)的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)及參數(shù)學(xué)習(xí)?;跇颖炯旧淼奶匦耘cBN特性,本文認(rèn)為該系統(tǒng)前1000次循環(huán)時(shí)傳感器不存在故障。在此處,為了驗(yàn)證本文提出的IGCS-K2算法在BN結(jié)構(gòu)精度精算上的確優(yōu)于其它傳統(tǒng)方法,選取該方法與第二節(jié)中效果較好的PC方法和MMHC方法分別計(jì)算其HDSA值,并進(jìn)行比較。通過(guò)計(jì)算得出,在樣本選取數(shù)據(jù)集中前1000條數(shù)據(jù)時(shí),結(jié)果見(jiàn)表3。 表3 算法HDSA值比較 由上表可知,傳統(tǒng)方法在該數(shù)據(jù)集下無(wú)法獲取其正確的BN結(jié)構(gòu),而本文所提到的IGCS-K2方法基本可以得到正確的BN結(jié)構(gòu),且較PC、MMHC兩種傳統(tǒng)方法在BN結(jié)構(gòu)精確度上有39.3%的提升。 在完成BN結(jié)構(gòu)學(xué)習(xí)后,針對(duì)數(shù)據(jù)為離散隨機(jī)變量的自身特點(diǎn),BN參數(shù)學(xué)習(xí)方法采用最大似然估計(jì),條件概率分布節(jié)點(diǎn)類型設(shè)置為高斯節(jié)點(diǎn),推理引擎選取gaussian_inf_engine引擎構(gòu)建完整的BN。完成上述步驟后,本文設(shè)定數(shù)據(jù)集最后8個(gè)樣本作為證據(jù)輸入,分8次選取其它傳感器的數(shù)值預(yù)測(cè)需要判斷是否存在故障的傳感器值,利用該模型預(yù)測(cè)每個(gè)傳感器的理論值,同時(shí)與其觀測(cè)值進(jìn)行對(duì)比,具體結(jié)果如圖8所示。 圖8中,每張圖各代表一個(gè)傳感器的理論值與觀測(cè)值的偏差情況,其中X軸代表測(cè)試樣本序號(hào),Y軸代表測(cè)試樣本數(shù)據(jù)均值,實(shí)線代表通過(guò)BN預(yù)測(cè)得出的各傳感器理論值,點(diǎn)劃線代表各傳感器觀測(cè)值。 圖8 實(shí)驗(yàn)數(shù)據(jù)傳感器理論值與觀測(cè)值偏差 同時(shí)通過(guò)計(jì)算可知,該8個(gè)傳感器在其數(shù)據(jù)集的最后8個(gè)樣本的平均相對(duì)誤差見(jiàn)表4。 表4 傳感器相對(duì)誤差 由上表及上圖可知,實(shí)驗(yàn)數(shù)據(jù)中的8個(gè)傳感器相對(duì)誤差均小于1%,且數(shù)據(jù)偏差極小,理論值與觀測(cè)值基本吻合,因此可以判斷上述8個(gè)傳感器不存在傳感器故障,不需要進(jìn)行后續(xù)的傳感器故障種類判斷。 本文通過(guò)結(jié)合信息幾何理論與K2評(píng)分搜索策略,提出了一種BN結(jié)構(gòu)生成方法IGCS-K2算法。該方法針對(duì)BN結(jié)構(gòu)構(gòu)建中較難處理的連續(xù)性數(shù)據(jù)學(xué)習(xí)問(wèn)題,提出通過(guò)計(jì)算變量的因果幾何強(qiáng)度序列作為K2評(píng)分搜索策略的輸入序列的方法,并通過(guò)理論與實(shí)驗(yàn)證明其有效性,隨后通過(guò)實(shí)驗(yàn)驗(yàn)證該方法在BN結(jié)構(gòu)生成的準(zhǔn)確度與方差均優(yōu)于各類傳統(tǒng)方法。 在工業(yè)領(lǐng)域,HCMS作為提高生產(chǎn)過(guò)程的規(guī)劃安全性的系統(tǒng)被廣泛使用,現(xiàn)階段監(jiān)測(cè)系統(tǒng)的監(jiān)控過(guò)程完全依賴傳感器的數(shù)據(jù)反饋,因此可以通過(guò)對(duì)HCMS中的傳感器故障進(jìn)行診斷,進(jìn)而判斷系統(tǒng)是否存在故障。本文基于IGCS-K2算法提出了一種用于HCMS傳感器故障診斷的方案,并通過(guò)實(shí)際數(shù)據(jù)驗(yàn)證了該方案具備用于實(shí)際工業(yè)流程的能力。 在未來(lái)的研究中,希望以該方法為基礎(chǔ)研究可以進(jìn)行處理海量數(shù)據(jù)處理的高性能并行計(jì)算方法,以應(yīng)對(duì)如今大數(shù)據(jù)的浪潮。

3 貝葉斯網(wǎng)絡(luò)在HCMS中的傳感器故障診斷方法


4 計(jì)算實(shí)例




5 結(jié)束語(yǔ)