基于信息熵的液壓狀態(tài)監(jiān)測(cè)系統(tǒng)故障診斷方法

2021-08-23 04:11:30王佳晨張宇來(lái)

計(jì)算機(jī)工程與設(shè)計(jì) 2021年8期

王佳晨，張宇來(lái)，岑崗

(浙江科技學(xué)院信息與電子工程學(xué)院，浙江杭州 310023)

0 引言

液壓狀態(tài)監(jiān)測(cè)系統(tǒng)(hydraulic condition monitoring system，HCMS)作為一種通過(guò)減少機(jī)器停機(jī)時(shí)間來(lái)提高生產(chǎn)過(guò)程的規(guī)劃安全性的系統(tǒng)被廣泛使用[1,2]。在HCMS的使用過(guò)程中，其監(jiān)測(cè)過(guò)程所需數(shù)據(jù)一般通過(guò)各類傳感器獲取[3,4]，然而在實(shí)際應(yīng)用中，HCMS內(nèi)的傳感器所處工況環(huán)境惡劣，傳感器在工作過(guò)程中易于導(dǎo)致自身故障、老化等問(wèn)題[5]，從而對(duì)其監(jiān)控設(shè)備的健康程度進(jìn)行誤判，影響其監(jiān)控設(shè)備本身的工作狀態(tài)，甚至引發(fā)系統(tǒng)故障[6]。同時(shí)隨著系統(tǒng)承載的子系統(tǒng)的增加，系統(tǒng)搭載的傳感器數(shù)量不斷增多[7]，系統(tǒng)由于傳感器發(fā)生問(wèn)題而導(dǎo)致故障的可能性也急劇提高?，F(xiàn)階段針對(duì)監(jiān)測(cè)系統(tǒng)的故障診斷方法一般通過(guò)添加相應(yīng)異常監(jiān)控模塊，在系統(tǒng)出現(xiàn)異常數(shù)據(jù)后進(jìn)行判斷[8,9]，該類方法無(wú)法快速定位具體傳感位置，且無(wú)法在故障產(chǎn)生前預(yù)測(cè)故障，因此實(shí)際應(yīng)用效果較差。當(dāng)前故障監(jiān)測(cè)系統(tǒng)的底層都是由各種傳感器實(shí)現(xiàn)的，液壓監(jiān)測(cè)系統(tǒng)的各種故障也都對(duì)應(yīng)于各類傳感器故障。所以本文計(jì)劃將HCMS故障診斷方法定性為傳感器故障診斷，通過(guò)預(yù)測(cè)系統(tǒng)中傳感器是否出現(xiàn)故障判斷該傳感器所處區(qū)域是否發(fā)生故障，該方法可以在故障發(fā)生前定位并解決故障，解決了傳統(tǒng)方法的不足。

由于貝葉斯網(wǎng)絡(luò)針對(duì)不確定數(shù)據(jù)預(yù)測(cè)具有先天優(yōu)勢(shì)，其針對(duì)傳感器故障預(yù)測(cè)有著極強(qiáng)的適用性，因此本文采用貝葉斯網(wǎng)絡(luò)對(duì)HCMS中的傳感器故障進(jìn)行預(yù)測(cè)。但是傳統(tǒng)的貝葉斯網(wǎng)絡(luò)在進(jìn)行預(yù)測(cè)時(shí)，貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)往往依賴于專家人為給出，缺乏可靠性與準(zhǔn)確性。目前，許多針對(duì)貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)的構(gòu)建方案已被提出，主要可以歸結(jié)為以下兩類：第一類是結(jié)合神經(jīng)網(wǎng)絡(luò)相關(guān)概念生成貝葉斯網(wǎng)絡(luò)[10-12]，第二類方法是將傳統(tǒng)方法與新的數(shù)理方法或者因果推斷技術(shù)相結(jié)合[13,14]?；跁r(shí)間效率與理論的可解釋性考慮，本文提出一種基于結(jié)合信息幾何理論與K2評(píng)分搜索策略優(yōu)化貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)的生成方法，生成高可靠性的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)，從而提高貝葉斯網(wǎng)在HCMS中傳感器故障診斷的準(zhǔn)確率。

本文具體工作如下：①提出一種基于信息幾何理論與K2評(píng)分搜索策略的優(yōu)化BN結(jié)構(gòu)的生成方法IGCS-k2，并通過(guò)理論與實(shí)驗(yàn)驗(yàn)證其有效性；②將IGCS-K2方法構(gòu)建的BN應(yīng)用于HCMS中，為其進(jìn)行傳感器故障診斷。

1 相關(guān)背景知識(shí)

1.1 貝葉斯網(wǎng)絡(luò)模型

貝葉斯網(wǎng)絡(luò)(Bayes network，BN)也稱可信度網(wǎng)絡(luò)，是由因果推理方法的奠基人Pearl在1988年提出的一種基于貝葉斯規(guī)則的不確定概率推理模型，是目前解決不確定性問(wèn)題最有效的理論模型之一[15]。該網(wǎng)絡(luò)的概率推理過(guò)程依托于貝葉斯公式，即

(1)

其中，P(Bi)稱為事件Bi的先驗(yàn)概率，P(Aj)稱為事件Aj的先驗(yàn)概率，貝葉斯公式得到的條件概率P(Bi|Aj)稱為后驗(yàn)概率。

BN模型是一個(gè)有向無(wú)環(huán)圖，是概率圖模型的一種，該模型通過(guò)圖像的形式直觀地描述隨機(jī)變量之間的因果關(guān)系，并通過(guò)計(jì)算每個(gè)變量的條件概率來(lái)進(jìn)行概率推理。具體表現(xiàn)形式如下

B= 〈G,P〉

(2)

其中，G表示的是一個(gè)有向無(wú)環(huán)圖，由節(jié)點(diǎn)和連接各個(gè)節(jié)點(diǎn)的單向弧線組成，網(wǎng)絡(luò)參數(shù)P由G中所有節(jié)點(diǎn)的概率分布組成，描述每個(gè)節(jié)點(diǎn)在其父節(jié)點(diǎn)影響下的條件概率。

BN概率推理的過(guò)程即為在利用給定證據(jù)變量集合E=e后，對(duì)需要計(jì)算的變量集X={X1,>X2,>…,>Xn}在第q種狀態(tài)下的概率分布進(jìn)行估算，其計(jì)算過(guò)程如下

(3)

1.2 信息幾何因果推斷方法

信息幾何因果推斷(information-geometric causal infe-rence，IGCI)是一種基于因果函數(shù)模型的因果關(guān)系方向推斷方法，該方法以結(jié)構(gòu)方程模型為基礎(chǔ)，結(jié)合信息幾何理論，提出了基于信息熵的因果推斷方法[16]，該方法利用原因變量分布的獨(dú)立性和基于給出原因的結(jié)果的獨(dú)立性，利用因果之間的不對(duì)稱性來(lái)判斷變量間的因果關(guān)系[17]。當(dāng)我們假定f(x)是[0,1]的嚴(yán)格單調(diào)遞增的可分辨雙射時(shí)，我們可以得出下式

(4)

進(jìn)而變量x的概率密度函數(shù)p(x)、變量y的概率密度函數(shù)p(x)與函數(shù)f(x)的關(guān)系如圖1所示。

圖1 IGCI方法變量與函數(shù)關(guān)系圖解

因此，我們可以得出如果p(x)與f的斜率無(wú)關(guān)，則在f斜率較低(f-1斜率較高)的區(qū)域p(y)的密度較高。此時(shí)，p(y)與f的反函數(shù)f>-1關(guān)系如下

(5)

由于該式當(dāng)且僅當(dāng)法f′是常數(shù)時(shí)成立，因此由下式可知(f-1)′和p(y)是正相關(guān)的

(log(f-1)′·p(y))-(log(f-1)′)·E(p(y))>0

(6)

因此只要變量X的概率分布X不包含Y|X的信息時(shí)，就會(huì)存在X|Y，除了f是線性的這種情況。

基于上述方法證明得出的不對(duì)稱性，IGCI方法引入如下表達(dá)式

(7)

(8)

2 貝葉斯網(wǎng)絡(luò)優(yōu)化方法

利用海量數(shù)據(jù)進(jìn)行學(xué)習(xí)，得到一個(gè)關(guān)系網(wǎng)絡(luò)是BN進(jìn)行后續(xù)工作的基礎(chǔ)，然而現(xiàn)有BN結(jié)構(gòu)學(xué)習(xí)方法均存在許多問(wèn)題，特別是在連續(xù)型數(shù)據(jù)的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)生成方面，存在網(wǎng)絡(luò)結(jié)構(gòu)準(zhǔn)確度低、計(jì)算時(shí)間過(guò)長(zhǎng)、結(jié)果方差大等問(wèn)題。因此為了提高針對(duì)連續(xù)數(shù)據(jù)的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)生成準(zhǔn)確度，本文引入信息幾何因果推斷方法(information-geometric causal inference，IGCI)，借鑒該方法的思路引入信息幾何因果強(qiáng)度(information-geometric causal，IGCS)的概念，利用IGCS將變量排序后輸入到最有效的結(jié)構(gòu)學(xué)習(xí)方法之一的K2評(píng)分搜索策略[18]中，形成了一種新的BN結(jié)構(gòu)生成方法IGCS-K2，具體流程如圖2所示。

圖2 改進(jìn)的BN結(jié)構(gòu)生成方法流程

下面本文將基于該流程圖詳細(xì)展開(kāi)。首先為了驗(yàn)證該方案的合理性，同時(shí)模擬連續(xù)數(shù)據(jù)在現(xiàn)實(shí)世界中的情況，本節(jié)將利用一個(gè)簡(jiǎn)單的貝葉斯網(wǎng)絡(luò)進(jìn)行說(shuō)明，本節(jié)中使用的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。

圖3 實(shí)驗(yàn)數(shù)據(jù)下的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)

其次，利用上述BN模擬生成的數(shù)據(jù)，本文通過(guò)如下算法計(jì)算出各個(gè)變量的IGCS序列：

算法1：IGCS序列算法

輸入：一組變量數(shù)為N，樣本個(gè)數(shù)為任意數(shù)的完整數(shù)據(jù)集data

輸出：根據(jù)IGCS排序后的序列order

步驟1建立一個(gè)N*N的矩陣CRD用于存放變量?jī)蓛芍g的信息幾何因果推斷方法評(píng)分，其中行用i表示，列用j表示；

步驟2設(shè)置IGCI方法的參數(shù)methodpars，為了使由IGCI方法計(jì)算的分?jǐn)?shù)可以在”X→Y”和”Y→X”兩個(gè)方向上應(yīng)用于IGCS的計(jì)算，因此在此處我們選擇基于熵的IGCI估計(jì)器——">org_entropy”，其它參數(shù)采用默認(rèn)參數(shù)；

步驟3計(jì)算所有變量?jī)蓛芍g的IGCI分?jǐn)?shù)，儲(chǔ)存與矩陣CRD中，其中由于選取基于熵的IGCI方法，其“X→Y”與“Y→X”的值相反，因此可以在計(jì)算出右上三角矩陣后自己通過(guò)加上自身的轉(zhuǎn)置獲得完整的CRD矩陣；

步驟4將矩陣的每一行進(jìn)行相加，并將計(jì)算得出的值進(jìn)行排列，按值的大小將其所代表的變量序號(hào)形成新的序列輸出。

其中，IGCS(i)的值代表了變量i針對(duì)其它變量的信息幾何因果關(guān)系強(qiáng)度的出度，本文將利用其作為K2評(píng)分搜索策略序列輸入K2評(píng)分搜索策略中進(jìn)行BN結(jié)構(gòu)的構(gòu)建。在K2評(píng)分搜索策略中，K2策略將按順序逐個(gè)考察輸入序列中的變量確定其父節(jié)點(diǎn)，然后添加相應(yīng)的弧，該策略的目的在于使得BN中層級(jí)越高的節(jié)點(diǎn)在輸入序列中出現(xiàn)的越早，K2策略計(jì)算獲得的BN結(jié)構(gòu)將越接近真實(shí)的BN結(jié)構(gòu)。因此BN相關(guān)學(xué)者普遍認(rèn)為K2策略最佳輸入序列是利用真實(shí)BN獲得的變量之間通過(guò)拓?fù)渑判颢@得的序列。IGCS算法借鑒該思路，利用轉(zhuǎn)移熵值計(jì)算每個(gè)變量與其它變量因果關(guān)系強(qiáng)度，通過(guò)和運(yùn)算得到其作為其它變量“原因”的可能性大小。

為了驗(yàn)證“多個(gè)變量之間的關(guān)系符合IGCS的值越大，其在BN網(wǎng)絡(luò)中作為其它變量的祖先節(jié)點(diǎn)可能性越大”的假設(shè)，只需要證明在貝葉斯網(wǎng)絡(luò)中的任意3個(gè)節(jié)點(diǎn)中，處于父節(jié)點(diǎn)位置的IGCS值大于其子孫節(jié)點(diǎn)。

在貝葉斯網(wǎng)絡(luò)中，任意3個(gè)節(jié)點(diǎn)可能存在的關(guān)系如圖4所示。

圖4 任意3個(gè)節(jié)點(diǎn)之間存在的因果關(guān)系

其中A、B、C代表任意3個(gè)節(jié)點(diǎn)所代表的變量，①、②、③代表利用IGCI方法計(jì)算的熵轉(zhuǎn)移值，其中箭頭方向代表正向轉(zhuǎn)移方向。針對(duì)圖4(a)，當(dāng)3個(gè)變量之間沒(méi)有因果關(guān)系時(shí)，各變量之間不存在父子節(jié)點(diǎn)關(guān)系，無(wú)需證明。針對(duì)圖4(b)、圖4(c)、圖4(d)，變量之間的關(guān)系直接由IGCI公式給出，無(wú)需證明。針對(duì)圖4(f)，由于假設(shè)討論的情境設(shè)定為貝葉斯網(wǎng)絡(luò)下，該情境下不存在有環(huán)圖，因此不在考慮范圍之內(nèi)。最終，要證明此假設(shè)僅需證明圖4(e)的情況即可。為了證明該情況下的假設(shè)正確性，本文引入如下定理和引理：

定理貝葉斯網(wǎng)絡(luò)是一種信念網(wǎng)，是基于有向無(wú)環(huán)圖來(lái)刻畫(huà)屬性之間的依賴關(guān)系的一種網(wǎng)絡(luò)結(jié)構(gòu)[15]。

引理如果轉(zhuǎn)移熵Tx→y，Tx→z，Tz→y都大于0，則在這種情況下，我們需要區(qū)分從x到y(tǒng)的因果影響是否只是通過(guò)中間變量z的間接途徑，或者是否存在另一種從x到y(tǒng)的直接途徑[19]。

證明：由于變量A、B、C是貝葉斯網(wǎng)絡(luò)中任取的3個(gè)節(jié)點(diǎn)所代表的變量，因此其符合貝葉斯網(wǎng)絡(luò)的特性，由定理可得，當(dāng)①>0且②>0時(shí)，如變量A和變量C之間存在因果關(guān)系，則變量A是變量C的父節(jié)點(diǎn)。

由引理可得，當(dāng)變量A、B、C之間關(guān)系如圖4(e)所示，且熵轉(zhuǎn)移值①、②、③均大于0時(shí)，當(dāng)且僅當(dāng)③>①+②時(shí)變量A才是變量C的父節(jié)點(diǎn)。

因此，③>①+②成立。

由IGCS原理可得，變量A的IGCS值IGCS(A)=①+③，變量B的IGCS值IGCS(B)=-①+②，變量C的IGCS值IGCS(C)=-②-③。綜合上式可得

IGCS(A)=①+③>2×①+2>-①+②=

IGCS(B)>2×②-③>-②-③= IGCS(C)

(9)

因此，IGCS(A)>IGCS(B)>IGCS(C)，假設(shè)成立，多個(gè)變量之間的關(guān)系符合IGCS的值越大，其在BN網(wǎng)絡(luò)中作為其它變量的祖先節(jié)點(diǎn)可能性越大，IGCS的值作為K2評(píng)分搜索策略的輸入序列具有理論依據(jù)，證明成立。

為對(duì)生成的N個(gè)IGCS值進(jìn)行排序形成遞減序列，本文設(shè)定v為原始索引向量，即當(dāng)k1

(10)

在完成IGCS的計(jì)算與排序后，將其輸入K2評(píng)分搜索策略中進(jìn)而生成BN網(wǎng)絡(luò)，形成完整的IGCS-K2方法。

最后，為了驗(yàn)證本文所提出的BN結(jié)構(gòu)生成方法優(yōu)于其它常見(jiàn)的BN結(jié)構(gòu)生成方法，在比較各個(gè)BN結(jié)構(gòu)生成方法的過(guò)程中，我們提出基于結(jié)構(gòu)漢明距離(structural hamming distance，SHD)的模型準(zhǔn)確度判別方法“漢明距離結(jié)構(gòu)精確度(hamming distance structural accuracy，HDSA)”，該方法在計(jì)算兩個(gè)BN網(wǎng)絡(luò)漢明距離后，根據(jù)BN網(wǎng)絡(luò)是有向無(wú)環(huán)圖的基本邏輯，計(jì)算正確弧占所有弧的百分比。具體算法如下：

算法2：HDSA算法

輸入：學(xué)習(xí)得到的DAG圖dag1、正確的DAG圖dag2

輸出：兩個(gè)DAG之間的漢明距離結(jié)構(gòu)精確度hdsa

步驟1計(jì)算可能存在的邊數(shù) edg =(輸入DAG變量數(shù)-1)>^2

步驟2計(jì)算學(xué)習(xí)得到的DAG圖與正確的DAG圖的結(jié)構(gòu)漢明距離sdh

fori← 1 to 輸入DAG變量數(shù)

forj← 1 to 輸入DAG變量數(shù)

ifdag1(1,j)=dag2(i,j) dosdh++

步驟3計(jì)算兩個(gè)DAG之間的漢明距離結(jié)構(gòu)精確度hdsa

hdsa=1-(sdh/edg)

為了對(duì)本文IGCS-K2算法進(jìn)行測(cè)試，此次的實(shí)驗(yàn)是在一臺(tái)CPU 是Inter(R) Core(TM) i7-6500U 2.50 GHz，內(nèi)存為8 GB，操作系統(tǒng)為windows7的電腦上進(jìn)行的，使用的編譯器為MATLAB R2018a。

基于上述方法，本文隨機(jī)生成的20組數(shù)據(jù)樣本間隔為1000條，數(shù)據(jù)樣本量由2000條至20 000條，樣本量的選取參考各類BN結(jié)構(gòu)學(xué)習(xí)方法能正確學(xué)習(xí)貝葉斯網(wǎng)絡(luò)的數(shù)據(jù)最低值。通過(guò)IGCS-K2方法、隨機(jī)K2方法、MCMC方法、MMHC方法、PC方法、TPDA方法分別生成BN結(jié)構(gòu)，并通過(guò)HDSA 算法計(jì)算其模型準(zhǔn)確度。

為了減少運(yùn)算量的同時(shí)保證BN結(jié)構(gòu)的精確度，各方法的超參數(shù)設(shè)置見(jiàn)表1。

表1 BN結(jié)構(gòu)學(xué)習(xí)超參數(shù)設(shè)置

最終，各BN結(jié)構(gòu)生成方法模型準(zhǔn)確度均值與方差見(jiàn)表2。

表2 BN結(jié)構(gòu)學(xué)習(xí)結(jié)果對(duì)比分析

由上表可知，本文所提出的方法針對(duì)上述假設(shè)形成的BN具有更高的BN結(jié)構(gòu)精確度與穩(wěn)定性，且收斂速度最快，可以為后續(xù)HCMS傳感器故障診斷提供更好的基礎(chǔ)。

3 貝葉斯網(wǎng)絡(luò)在HCMS中的傳感器故障診斷方法

在HCMS中，為了對(duì)工業(yè)過(guò)程進(jìn)行更加全面的監(jiān)控，往往采用多個(gè)多源傳感器對(duì)整條工業(yè)流程中各個(gè)裝置及系統(tǒng)進(jìn)行監(jiān)控，同時(shí)由于在整個(gè)工業(yè)流程中，傳感器的值變化代表其監(jiān)測(cè)裝置中物質(zhì)或能量變換，因此本文認(rèn)為在工業(yè)流程下游位置的傳感器變化會(huì)隨著在工業(yè)流程上游位置的傳感器變化而變化，即上游位置的傳感器是下游位置傳感器的“原因”。因此，本文將傳感器在工業(yè)流程中的位置認(rèn)為是其在BN網(wǎng)絡(luò)中的理論實(shí)際位置。

在明確BN的理論結(jié)構(gòu)后，本文通過(guò)如圖5所示方法進(jìn)行傳感器故障診斷。

圖5 HCMS傳感器故障診斷方法流程

由于在實(shí)際的工業(yè)過(guò)程中，每個(gè)傳感器的值代表了其對(duì)應(yīng)裝置所處的狀態(tài)，而工業(yè)過(guò)程本身是一個(gè)重復(fù)的生產(chǎn)過(guò)程，因此當(dāng)我們選取傳感器狀態(tài)正常的數(shù)據(jù)進(jìn)行學(xué)習(xí)時(shí)，我們可以利用已知的其它傳感器處于某一個(gè)時(shí)刻的數(shù)值，對(duì)該傳感器的理論值進(jìn)行正確估計(jì)。

依照該思路具體展開(kāi)，本文首先將已知的正確傳感數(shù)據(jù)進(jìn)行貝葉斯結(jié)構(gòu)學(xué)習(xí)，獲得BN結(jié)構(gòu)，并利用該數(shù)據(jù)對(duì)學(xué)得的BN進(jìn)行參數(shù)學(xué)習(xí)，獲取變量之間的關(guān)系權(quán)重。其次，我們選取滿足數(shù)據(jù)情況的貝葉斯推理引擎，并選取需要判斷傳感器是否存在故障之外的多條傳感器數(shù)據(jù)觀測(cè)值，作為證據(jù)輸入到BN中，生成每組數(shù)據(jù)的后驗(yàn)概率。最后，本文將生成的后驗(yàn)概率作為理論上的正確值，與觀測(cè)得到的傳感器數(shù)據(jù)值進(jìn)行比對(duì)，判斷該傳感是否存在故障。

在具體到是否存在傳感器故障的判斷過(guò)程中，本文將傳感器故障分以下4個(gè)大類：完全失效故障(CFF)、固定偏差故障(FBF)、漂移偏差故障(DPF)和精度下降故障(ADF)。當(dāng)存在上述每種故障時(shí)，觀測(cè)數(shù)據(jù)與理論數(shù)據(jù)將會(huì)發(fā)生如下圖6所示的偏差，其中實(shí)心點(diǎn)代表觀測(cè)數(shù)據(jù)，空心點(diǎn)代表理論數(shù)據(jù)。

圖6 傳感器故障類型

當(dāng)通過(guò)本文方法計(jì)算出該傳感器最近幾次的理論值yt后，通過(guò)其與觀測(cè)值yo的比較，計(jì)算兩者相對(duì)誤差，當(dāng)發(fā)現(xiàn)兩者相對(duì)誤差較大時(shí)，則認(rèn)為該傳感器存在故障。確認(rèn)傳感器存在故障后，通過(guò)對(duì)yt、yo與兩者差值Δyt,o呈現(xiàn)出的特征進(jìn)行分析，利用專家經(jīng)驗(yàn)判斷其出現(xiàn)該種類型故障。具體方法如下：

(1)如果傳感器觀測(cè)值yo保持不變，則判定傳感器發(fā)生完全失效故障(CFF)。

(2)如果傳感器觀測(cè)值yo變化，且差值Δyt,o為某一恒定常數(shù)，則判定傳感器發(fā)生固定偏差故障(FBF)。

(3)如果傳感器觀測(cè)值yo變化，而差值Δyt,o隨時(shí)間發(fā)生線性變化，則判定傳感器發(fā)生漂移偏差故障(DPF)。

(4)如果傳感器觀測(cè)值yo變化，且差值Δyt,o時(shí)正時(shí)負(fù)，且平均值趨于零，則判定傳感器發(fā)生精度下降故障(ADF)。

4 計(jì)算實(shí)例

為了驗(yàn)證本文提出的傳感器故障診斷的有效性，本實(shí)驗(yàn)數(shù)據(jù)集選取來(lái)自kaggle的Condition Monitoring of Hydraulic Systems數(shù)據(jù)集，在一臺(tái)CPU 是Inter(R) Core(TM) i7-6500U 2.50 GHz，內(nèi)存為8 GB，操作系統(tǒng)為windows7 的電腦上進(jìn)行實(shí)驗(yàn)，使用的編譯器為MATLAB R2018a，部分代碼使用Matlab CausalExplorer_1.5-master工具箱與Matlab Bayes Net Toolbox工具箱。

該數(shù)據(jù)集將Nikolai Helwig論文[20]中的數(shù)據(jù)按傳感器進(jìn)行數(shù)據(jù)分叉，該文中的數(shù)據(jù)集是通過(guò)實(shí)驗(yàn)從液壓實(shí)驗(yàn)裝置獲得，實(shí)驗(yàn)裝置由一級(jí)工作和二級(jí)冷卻-過(guò)濾回路組成，通過(guò)油箱連接，系統(tǒng)周期性地重復(fù)恒定的負(fù)載循環(huán)，每個(gè)周期持續(xù)時(shí)間為60 s。分叉后的數(shù)據(jù)集包括各傳感器測(cè)量過(guò)程值(例如壓力、體積流量和溫度)與4個(gè)液壓組件(冷卻器、閥門、泵和蓄能器)的狀態(tài)定量變化情況。

本文的實(shí)驗(yàn)將抽取該數(shù)據(jù)集中的一級(jí)工作臺(tái)中的8個(gè)實(shí)際傳感器數(shù)值進(jìn)行實(shí)驗(yàn)，根據(jù)其在系統(tǒng)中所處的上下游位置，我們可以獲得其理論貝葉斯網(wǎng)絡(luò)如圖7所示。

圖7 實(shí)驗(yàn)數(shù)據(jù)理論貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)

在明確所需要選取的數(shù)據(jù)后，由于每種傳感器的屬性不同，本文通過(guò)獲取數(shù)據(jù)的變化均值的預(yù)處理方法得到每個(gè)傳感器的唯一屬性，從而進(jìn)行后續(xù)的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)及參數(shù)學(xué)習(xí)。基于樣本集本身的特性與BN特性，本文認(rèn)為該系統(tǒng)前1000次循環(huán)時(shí)傳感器不存在故障。在此處，為了驗(yàn)證本文提出的IGCS-K2算法在BN結(jié)構(gòu)精度精算上的確優(yōu)于其它傳統(tǒng)方法，選取該方法與第二節(jié)中效果較好的PC方法和MMHC方法分別計(jì)算其HDSA值，并進(jìn)行比較。通過(guò)計(jì)算得出，在樣本選取數(shù)據(jù)集中前1000條數(shù)據(jù)時(shí)，結(jié)果見(jiàn)表3。

表3 算法HDSA值比較

由上表可知，傳統(tǒng)方法在該數(shù)據(jù)集下無(wú)法獲取其正確的BN結(jié)構(gòu)，而本文所提到的IGCS-K2方法基本可以得到正確的BN結(jié)構(gòu)，且較PC、MMHC兩種傳統(tǒng)方法在BN結(jié)構(gòu)精確度上有39.3%的提升。

在完成BN結(jié)構(gòu)學(xué)習(xí)后，針對(duì)數(shù)據(jù)為離散隨機(jī)變量的自身特點(diǎn)，BN參數(shù)學(xué)習(xí)方法采用最大似然估計(jì)，條件概率分布節(jié)點(diǎn)類型設(shè)置為高斯節(jié)點(diǎn)，推理引擎選取gaussian_inf_engine引擎構(gòu)建完整的BN。完成上述步驟后，本文設(shè)定數(shù)據(jù)集最后8個(gè)樣本作為證據(jù)輸入，分8次選取其它傳感器的數(shù)值預(yù)測(cè)需要判斷是否存在故障的傳感器值，利用該模型預(yù)測(cè)每個(gè)傳感器的理論值，同時(shí)與其觀測(cè)值進(jìn)行對(duì)比，具體結(jié)果如圖8所示。

圖8中，每張圖各代表一個(gè)傳感器的理論值與觀測(cè)值的偏差情況，其中X軸代表測(cè)試樣本序號(hào)，Y軸代表測(cè)試樣本數(shù)據(jù)均值，實(shí)線代表通過(guò)BN預(yù)測(cè)得出的各傳感器理論值，點(diǎn)劃線代表各傳感器觀測(cè)值。

圖8 實(shí)驗(yàn)數(shù)據(jù)傳感器理論值與觀測(cè)值偏差

同時(shí)通過(guò)計(jì)算可知，該8個(gè)傳感器在其數(shù)據(jù)集的最后8個(gè)樣本的平均相對(duì)誤差見(jiàn)表4。

表4 傳感器相對(duì)誤差

由上表及上圖可知，實(shí)驗(yàn)數(shù)據(jù)中的8個(gè)傳感器相對(duì)誤差均小于1%，且數(shù)據(jù)偏差極小，理論值與觀測(cè)值基本吻合，因此可以判斷上述8個(gè)傳感器不存在傳感器故障，不需要進(jìn)行后續(xù)的傳感器故障種類判斷。

5 結(jié)束語(yǔ)

本文通過(guò)結(jié)合信息幾何理論與K2評(píng)分搜索策略，提出了一種BN結(jié)構(gòu)生成方法IGCS-K2算法。該方法針對(duì)BN結(jié)構(gòu)構(gòu)建中較難處理的連續(xù)性數(shù)據(jù)學(xué)習(xí)問(wèn)題，提出通過(guò)計(jì)算變量的因果幾何強(qiáng)度序列作為K2評(píng)分搜索策略的輸入序列的方法，并通過(guò)理論與實(shí)驗(yàn)證明其有效性，隨后通過(guò)實(shí)驗(yàn)驗(yàn)證該方法在BN結(jié)構(gòu)生成的準(zhǔn)確度與方差均優(yōu)于各類傳統(tǒng)方法。

在工業(yè)領(lǐng)域，HCMS作為提高生產(chǎn)過(guò)程的規(guī)劃安全性的系統(tǒng)被廣泛使用，現(xiàn)階段監(jiān)測(cè)系統(tǒng)的監(jiān)控過(guò)程完全依賴傳感器的數(shù)據(jù)反饋，因此可以通過(guò)對(duì)HCMS中的傳感器故障進(jìn)行診斷，進(jìn)而判斷系統(tǒng)是否存在故障。本文基于IGCS-K2算法提出了一種用于HCMS傳感器故障診斷的方案，并通過(guò)實(shí)際數(shù)據(jù)驗(yàn)證了該方案具備用于實(shí)際工業(yè)流程的能力。

在未來(lái)的研究中，希望以該方法為基礎(chǔ)研究可以進(jìn)行處理海量數(shù)據(jù)處理的高性能并行計(jì)算方法，以應(yīng)對(duì)如今大數(shù)據(jù)的浪潮。