999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于孤立森林與KDE-LOF的冷水機組故障檢測

2023-02-17 01:54:06祝紅梅
計算機應用與軟件 2023年1期
關鍵詞:故障效果檢測

熊 坤 丁 強 祝紅梅

(杭州電子科技大學自動化學院 浙江 杭州 310018)

0 引 言

隨著社會的發展,大多商業建筑不僅配備冷水機組,而且配備的數量增多且制冷要求提高。這推動著制冷技術的發展,使得制冷系統更加復雜,給制冷系統的故障檢測提出新的挑戰。相關研究表明[1],制冷系統如果能及時檢測出故障的發生并采取相應處理措施,能節省20%~30%的能耗。就某種程度而言,與故障診斷相比,制冷系統的故障檢測要求更高,因為它通過早期檢測故障來防止能源浪費。所以,快速并準確地檢測出制冷系統可能發生的故障,對系統節約能源和安全運行具有重要意義。

近年來,以大規模數據為基礎的數據驅動故障檢測技術得到了廣泛的研究,包括主元分析、單類支持向量、孤立森林、局部異常因子等。其中主元分析(PCA)作為統計分析中的基本方法,PCA通過基變換將原始數據集劃分為主元空間和殘差空間。主元空間反映了正常數據的變化,殘差空間反映異常或噪聲數據的變化,基于PCA的故障檢測方法通常使用平方預測誤差SPE、T2作為統計量,確定閾值范圍判斷該過程是否發生故障。Hu等[2]采用主元分析的方法,使用SPE統計量為指標,實現了對冷水機組傳感器故障進行檢測;Beghi等[3]主要通過PCA配合SPE統計量區分異常和正常操作。PCA的方法用于非線性、非高斯的制冷系統而言表現較差,對部分故障及微小故障的檢測率較低。單類支持向量機(OCSVM)作為一種異常值檢測算法,確切來講是一種新奇值檢測,OCSVM的原理是將數據集經過核函數映射到高維后,數據具有很高的凝聚性。在高維空間中尋找一個分割超平面實現與原點的最大程度分離。新奇值檢測需要訓練的數據是純凈的正常類,得到的模型再去檢測異常,同支持向量描述(SVDD)一樣是一種單分類的算法,通過獲得的目標數據邊界區分正常和故障來達到故障檢測的目的。Zhao等[4]運用了SVDD的方法實現對冷水機組7類典型故障進行故障檢測,證明效果是優于傳統PCA的方法。Yan等[5]和李冠男等[6]也采用了這種單分類的方法對制冷系統進行故障檢測。

局部異常因子(LOF)算法是既能新奇值檢測,也能離群點檢測,離群點檢測是在給定正常摻雜了異常樣本中檢測出這些異常點,LOF算法通過衡量待檢測數據與其鄰域數據的密度比值來判斷其是否為離群點。LOF在流量異常檢測和過程監控有應用,在冷水機組的故障檢測上應用較少,李元等[7]采用LOF算法實現工業多工況、數據多模態的故障檢測。董澤等[8]提出LOF算法完成熱工過程的異常值檢測。劉廣聰等[9]采用了LOF對未知節點的估計坐標進行分析和篩選進而未知節點位置,提高了定位精度。曾宇柯等[10]采用LOF算法對數據進行異常剔除達到數據清洗的目的,該方法運用屬于離群點檢測。孤立森林(iForest)是一種側重離群點檢測的算法,該算法利用二叉搜索樹結構來孤立異常的樣本,通過對樣本點的孤立實現離群點的檢測,于家傲等[11]和袁藝芳等[12]都使用iForest用于異常值檢測。

本文提出采用LOF-KDE算法對冷水機組典型故障進行檢測,該方法不需要假設數據的分布約束,適合解決制冷系統的故障檢測。首先將LOF值作為統計量訓練離線模型,其次根據核密度估計(KDE)確定控制限,再將檢測的數據與控制限比較,判斷系統是否異常。最后結合iForest算法完成異常值剔除,優化提出的模型,完成冷水機組中典型的7類故障的檢測。

1 基本理論

1.1 孤立森林算法

孤立森林[13]算法主要用于離群點檢測。iForest算法不再是圍繞正常樣本點加以描述,而是描述要孤立異常點。由于該算法的特點,本文將使用該算法對采集的數據樣本加以數據清洗,剔除原始數據中的異常值,來優化檢測模型。iForest由K個iTree組成,每棵樹都是一個二叉樹。該算法首先隨機抽取部分樣本作為根節點,其次隨機選擇某個特征作為切割點產生二叉樹,不斷構建新葉子節點,直到達到二叉樹的最大深度或者最終葉子節點只有一個數據,才生成完成孤立樹。用生成的孤立樹來評估測試數據,即計算異常分數s,公式如下:

式中:c(ψ)為給定樣本數ψ時路徑長度的平均值,用來對樣本x的路徑長度h(x)進行標準化處理,h(x)為x在每棵樹的高度。s越接近1,則其是異常點的可能性越高;s遠小于0.5,則一定不是異常點;s在0.5附近,數據極不可能存在異常點。iForest算法不需要對數據的分布和是否線性作任何假設,適合于處理冷水機組的運行數據,本文通過iForest算法去除原本數據集的噪聲和異常值,使得檢測模型更加精確,提高檢測模型的準確率,一定程度上提高了檢測的速度。

1.2 局部異常因子算法

局部異常因子算法是一種基于密度的異常點檢測算法,主要以計算樣本的離群因子并比較是否遠離密集數據的方法判斷是否異常。具有較大的LOF值的樣本密度較低,被視作異常。LOF算法的過程為:首先找到樣本的K近鄰,并計算每個局部樣本K距離。然后計算出樣本的局部可達距離,進而求得局部可達密度,最后計算樣本的局部異常因子,定義為:

式中:lrd(xk)表示樣本的K鄰域局部可達密度;lrd(x)表示樣本的局部可達密度。如果樣本x不是異常點,lrd(xk)越接近于lrd(x)意味著LOF值越接近1,說明點P的其鄰域點密度差不多,P可能和鄰域同屬一簇;如果LOF值越大于1,說明P的密度小于其鄰域點密度,P越可能是異常點。LOF值可以作為統計量表示測試樣本x與正常操作之間的關系。因此,LOF算法訓練正常樣本,劃定一定控制限,可以識別測試樣本是否在控制限內,判定是否為異常點。

1.3 核密度估計

控制限的選取為檢測的依托標準,以LOF作為統計量,通過核密度估計確定LOF控制限,KDE是一種非參數估計,無須對數據的分布作任何假設,這與假設數據是呈正態分布的PCA方法相比更具有優勢[14]。KDE從樣本數據的自身研究其分布,定義如下:

式中:N表示樣本的數量;K(x)表示核函數;H>0表示平滑參數,稱作帶寬;xi表示某一樣本點。KDE在實際中核函數的選擇并不關鍵,大多選擇高斯核函數。但帶寬H的選取對KDE的好壞直接相關,它的選取也影響到檢測的準確率。

2 iForest的KDE-LOF故障檢測模型

基于iForest的KDE-LOF算法主要包括兩部分:離線建模和在線測試,如圖1所示。

圖1 KDE-LOF故障檢測流程

2.1 離線建模

(1) 從數據庫中導出若干冷水機組正常運行的測量數據,將數據進行預處理,主要包括濾掉瞬態數據、iForest異常值剔除、數據標準化處理。

(2) 預處理的數據后經LOF算法計算每個樣本的LOF值。

(3) 利用核密度估計來計算LOF的控制限,本文確定95%的控制限。

2.2 在線檢測

(1) 將系統實時采集的數據按照離線建模中的方式進行數據預處理。

(2) 將測試數據放入模型計算LOF值,超過控制限,判定為異常數據,否則,數據為正常數據。

3 實驗仿真

3.1 樣本數據

本文選用樣本數據源自ASHRAE RP-1043[15]冷水機組系統故障模擬實驗。該實驗對象為一臺90t的離心式冷水機組,通過人為調整手段模擬了冷水機組常見的7個單發故障,并對每個故障進行了4個不同劣化程度的模擬,故障類型和相關故障產生的具體說明見表1,其中:CF表示冷凝器結垢故障;EO表示壓縮機潤滑油過量;FWC表示冷凝器水流量減少;FWE表示蒸發器水流量減少;NC表示制冷劑回路中含不凝性氣體;RL表示制冷劑泄漏;RO表示制冷劑填充過量;SL1-SL4表示故障的四個劣化水平,以CF故障為例,-12%表示的是以封堵管路的百分比來減少冷凝器的換熱面積的12%,該類故障等級標識為SL1,即等級為1的劣化故障。其他故障均按照一定比例或一定量施加故障程度,故障產生的方法和施加故障程度可見表1。

表1 RP-1043故障信息

實驗運行工況有27種,總計特征參數為64維,其中采集冷水機組運行參數48種,計算參數16種,大多特征存在冗余和自身對故障不敏感的。Zhao等[4]已經驗證其中16個特征對故障的敏感且易于現場測量,具體特征見表2。

3.2 數據預處理

在實驗原始數據基礎上,先剔除系統的啟停數據和瞬態數據獲得最終的穩態數據,再使用iForest算法對原始數據的異常值進行剔除。異常值剔除后數據純凈度更高,LOF模型較高容易得出較好的模型效果,圖2為使用iForest計算正常數據(4 000組)的異常分數,最大值為0.65。異常分數s超過0.5越多,值越接近于1,異常值的可能性越大,采取剔除10%的正常數據可能存在的異常數據,閾值為0.55。剩余數據中隨機抽取3 000組作為訓練,另外1 000組隨機抽取200條校驗。獲取故障數據集每個等級故障樣本4 000條,同樣以隨機的方式每個等級抽取200組用于故障檢測。

圖2 正常數據的異常分數圖

3.3 仿真結果及分析

3.3.1LOF-KDE模型和PCA-SPE的對比分析

正常樣本作為訓練,Zhao等[4]和Li等[16]在PR1043數據集中CF、EO、NC故障檢測效果較理想,對其他的檢測效果欠佳。以正常數據、FWC故障為例同PCA對比,給出它們的統計量檢測圖。PCA以SPE作為統計量設置95%的控制限,LOF算法通過KDE選取95%控制限。本文以積分均方誤差(MISE)為標準確定核密度估計的核帶寬[17],得到的帶寬H為0.2,確定K的區間[2,20],并使用網格搜索算法,得到LOF的最優的K值為4,兩者均做iForest算法的異常值剔除。

正常工況下LOF-KDE模型和PCA-SPE模型檢測效果分別如圖3和圖4所示,SPE進行檢測結果誤報率為3%,而LOF進行的誤報率為4.5%,LOF模型效果要優于PCA模型。故障FWC的檢測結果如圖5、圖6所示,每200個樣本由低到高分別對應該4個等級的故障樣本。PCA模型下4個級別的故障檢測率為33%、41%、91.5%、94%,LOF模型下檢測率分別為94.5%、97%、99.5%、100%。

圖3 LOF-KDE模型正常工況檢測圖

圖4 PCA-SPE模型正常工況檢測圖

圖5 PCA-SPE模型FWC故障檢測圖

圖6 KDE-LOF模型FWC故障檢測圖

可以看出SPE和LOF統計量隨著故障等級增高,等級越高越偏離控制限,檢測效果也得到提高。PCA模型在故障等級為1和2的檢測率較低,檢測率均在50%以下,無法區分微小故障。LOF模型能夠較好地檢測出,正確率都在90%以上。分析可知:PCA是假設數據的分布為正態分布,且方法適用于線性系統。而制冷系統的非線性和非高斯的特點使得該方法的檢測效果并不理想。而核密度估計的LOF模型能夠很好地檢測這些故障,更是不需要對數據分布作任何假設,因此在檢測效果上明顯優于PCA。

3.3.2LOF_KDE模型和OCSVM的對比分析

使用高斯核函數時,OCSVM與Zhao等[4]提出的SVDD的數據描述方式具有同等的效果[18]。為了統一,將誤差系數設為5%(這與95%的置信水平相似),并調整超參數gamma值,采用網格搜索算法在區間[0,100]下上搜索到最優的gamma值為29.3,通過計算樣本到決策平面的距離D來判斷是否異常,D大于0為正常,D小于0為故障。

本次選擇FWE故障為例進行比較,圖7顯示了200個正常樣本誤報的個數有12個,誤報率達6%,誤報率要高于LOF-KDE模型。圖8、圖9分別是OCSVM和LOF_KDE模型下FWE四層故障檢測結果圖,OCSVM模型下4個級別的故障檢測率分別為53%、71.5%、94.5%、100%,在低等級的故障下的大部分點落在了決策平面的上方,被誤認為是正常點;LOF模型4個級別的故障檢測率分別為87%、96%、96.5%、98.0%,僅少量的點被誤診為正常點,雖然在故障等級高的情況下檢測率都接近100%,稍遜色于OCSVM,但足夠滿足檢測能力。在微小故障下LOF模型比OCSVM的檢測能力更強。

圖7 OCSVM模型正常工況檢測圖

圖8 OCSVM模型FWE故障檢測圖

圖9 LOF-KDE模型FWE故障檢測圖

3.3.3KDE-LOF在不同故障等級的檢測結果

iForest在不同故障等級下異常處理和不做任何處理的檢測結果分別見表3和表4。可以看出,在故障等級為1時,PCA的效果較差,OCSVM和LOF模型的檢測效果較好,LOF檢測效果要優于OCSVM,說明KDE-LOF模型能夠較準確檢測出微小故障。在典型的7類故障檢測中,幾種算法對CF、NC故障檢測效果都能達到或接近100%。在故障程度為2、3和4的情況下OCSVM和LOF的效果較好,都能達到90%以上。PCA整體表現較差。分析可知:PCA適用于線性系統,OCSVM和LOF不受數據的分布約束,檢測效果更適合制冷系統。表3的數據普遍優于表4對應位置上的檢測率,這是因為異常值容易干擾PCA和LOF模型的閾值和影響OCSVM的決策邊界,去除異常值有利于優化模型。

表3 iForest異常值處理下三種模型的故障檢測結果(%)

表4 未異常處理下三種模型的故障檢測結果Fault(%)

為了比較這三種模型在微小故障下的檢測效果,選取了FWC、FWE、RL、RO這幾種故障,這幾類故障檢測效果不明顯,其他CF、EO、NC故障檢測效果都比較理想,不參與比較。圖10顯示了這4個故障在故障等級為1和2情況下各個模型檢測率的平均值的結果,可以看出iForest-LOF算法在level1故障下效果最優,故障等級越高,越容易檢測出。從表3看出,在輕微故障下,LOF依然效果最佳,能夠在故障等級為1的情況下檢測率達到80%以上。通過圖10也可以說明,使用iForest異常值剔除對模型有優化作用,因此在實驗數據上剔除異常值是很有必要的。

圖10 3種模型下FWC、FWE、RL、RO微小故障檢測

4 結 語

本文提出一種LOF-KDE結合iForest故障檢測用于冷水機組故障檢測的方法,通過iForest實現異常值剔除,計算數據的LOF值,結合KDE確定控制限,以LOF作為統計量對數據進行監控來檢測故障。選取典型的ASHRAE-RP1043數據集驗證該模型的有效性,選取的故障數據按照劣化程度逐漸加深。該方法采用iForest算法對異常值剔除的數據清洗策略能夠獲得更加良好的模型,提高了故障檢測率,使得冷水機組微小程度故障檢測率達到80%以上,在故障程度高的情況下檢測率能達到90%。此外,將提出的方法與PCA和OCSVM進行對比分析,結果表明LOF-KDE方法在漏報率和檢測率表現均為最佳,該故障檢測方法無須對數據的分布做出任何假設,只研究樣本本身。今后的工作會將該模型運用到實際的制冷系統的故障檢測上,進一步驗證它的有效性和可拓展性。

猜你喜歡
故障效果檢測
按摩效果確有理論依據
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
故障一點通
迅速制造慢門虛化效果
抓住“瞬間性”效果
中華詩詞(2018年11期)2018-03-26 06:41:34
模擬百種唇妝效果
Coco薇(2016年8期)2016-10-09 02:11:50
奔馳R320車ABS、ESP故障燈異常點亮
小波變換在PCB缺陷檢測中的應用
主站蜘蛛池模板: 亚洲婷婷丁香| 国产最新无码专区在线| 九九热在线视频| 久久77777| 欧美亚洲一二三区| 久久毛片免费基地| 婷婷五月在线| 在线va视频| 波多野结衣中文字幕久久| 欧美亚洲国产精品第一页| AV老司机AV天堂| 热久久综合这里只有精品电影| 四虎精品国产AV二区| 亚洲香蕉久久| 日韩 欧美 小说 综合网 另类| 日韩无码视频播放| 小说 亚洲 无码 精品| 欧美日韩国产精品va| 亚洲国产综合精品中文第一| 久久毛片网| 国产在线无码一区二区三区| 无码福利日韩神码福利片| 免费激情网址| 国产精品hd在线播放| 99热国产这里只有精品9九| 欧美va亚洲va香蕉在线| 毛片在线播放网址| 四虎成人在线视频| 亚洲精品制服丝袜二区| 国产精品成人AⅤ在线一二三四| 91精品情国产情侣高潮对白蜜| 91口爆吞精国产对白第三集| 久久黄色毛片| 亚洲精品国产成人7777| 国产黑丝一区| 久久久久国产一级毛片高清板| 色老二精品视频在线观看| 青青草一区二区免费精品| 国产精品人人做人人爽人人添| 4虎影视国产在线观看精品| 中日韩一区二区三区中文免费视频 | 欧美啪啪一区| 国产av无码日韩av无码网站| 久久婷婷五月综合97色| 国产欧美日韩91| 亚洲男人天堂久久| 99这里只有精品免费视频| 亚洲精品日产AⅤ| 亚洲欧美一区在线| 国产第一页亚洲| 国产成人无码AV在线播放动漫 | 久久福利片| 亚洲精品麻豆| 欧美日韩激情在线| 激情国产精品一区| 在线a网站| 亚洲美女久久| 老司机久久精品视频| 97视频免费看| 天堂成人av| av大片在线无码免费| 青青操国产| 日本亚洲欧美在线| 免费福利视频网站| 女人天堂av免费| 在线欧美一区| 国产无人区一区二区三区| 欧美一级在线看| 欧美狠狠干| 亚洲美女操| 日本在线免费网站| 97人人做人人爽香蕉精品| 国产女主播一区| 日韩精品免费在线视频| 伊人色天堂| 乱人伦99久久| 国产欧美精品午夜在线播放| 欧美一级大片在线观看| 青青青亚洲精品国产| 国产在线视频导航| 色老头综合网| 国产精品久久自在自2021|