閆會玉,鄭澤宇,宋 宏,高 原
(1.中國科學院沈陽自動化研究所,遼寧 沈陽 110016;2.中國科學院機器人與智能制造創新研究院,遼寧 沈陽 110016;3.中國科學院大學,北京100049)
隨著工業自動化、智能化進程的不斷發展,變頻器被廣泛應用于鋼鐵、化工、石油、冶金、水處理等各行業中,已成為當今節電、提高生產過程自動化水平、改造傳統工業、推動技術進步的主要手段之一[1]。然而,在復雜的自然環境(結露、腐蝕、粉塵、高低溫等)和電磁環境(EMI、過電壓、過電流等)下,變頻器極易發生故障,嚴重危害操作人員安全[2-3]。異常檢測是故障診斷的第一步,在整個故障診斷過程中是最為關鍵的一步,因此變頻器異常檢測研究具有重要的意義。目前,異常檢測在變頻器方面的研究還不夠成熟。主要的檢測方法有基于分析模型的方法,基于定性經驗知識的方法和基于數據驅動的方法。參數估計、狀態估計、分析冗余法都是常用的分析模型[4-5]方法,但隨著系統復雜度的不斷提升,該方法難以獲取足夠多的系統復雜原理的每一個細節,無法建立精確的數學模型,雖然這種不精確性能夠使模型的魯棒性變好,但同時也容忍了故障的發生。基于定性經驗知識的方法,主要有專家系統[6]、符號有向圖等,該方法需要領域專家提供深厚的專業知識和長期積累的經驗知識,現實操作性較難。數據驅動的方法是結合先進的人工智能技術、信號處理技術以及一些數理統計方法,通過監測設備運行,提取設備運行異常特征,根據特征變化識別異常。常用的數據驅動方法,如模糊控制[7-8]、小波變換[9-10]、神經網絡[11]等,這些方法的診斷需要大量的正常、異常運行數據來訓練模型。而在現實生產中的變頻器數據量很大,但大部分都是正常數據,異常樣本非常少,降低了以上方法的現實可行性。
針對以上問題,提出一種基于密度峰值聚類與概率統計分析的方法,該方法屬于數據驅動的方法,但該方法不需要大量的異常數據樣本,適用于長期處于在同一種工作條件下的設備進行異常檢測。該方法通過對特定條件下的設備正常運行數據進行分析,構建該條件下的正常運行模式,利用該模式來識別異常行為。首先對設備海量歷史運行數據進行密度峰值聚類,然后計算不同類簇之間的轉移概率,基于歷史類簇及其相互間的轉移概率并結合滑動時間窗口模型提出異常檢測框架,對新的設備運行數據運行情況進行異常判別,最后通過變頻器異常數據案例驗證了該方法用于異常檢測的有效性。該方法通過密度峰值聚類能夠簡化多維參量的復雜關系;同時通過聚類識別異常來代替閾值限定識別異常,可以解決傳統閾值限定方法中閾值設定無參考的問題;最后通過分析類簇轉移規律,用概率表示不同類簇間的轉移特點,能夠從時間維度上發現設備運行的異常狀況。

表示當點i為局部密度最大點時,求與i距離最遠點的距離。否則,求比i點密度大的點距i點的距離的最小值。
步驟2 確定聚類中心
(1)根據決策圖,設置密度閾值ρth和距離閾值δth。(2)當xi的最小距離δi>ρth,且ρi>ρth時,xi為聚類中心,并賦予類別標簽。(3)按照(2)遍歷所有數據點,找到所有的聚類中心。
步驟3 為非聚類中心點歸類
將非聚類中心點的比其局部密度大的鄰居點的類別標簽,作為該點的類別標簽。若其所有高密度鄰居同為無類別屬性,繼續迭代,直至找到為聚類中心的高密度鄰居點。
2.1.2 密度峰值聚類方法優化
從前文可知,在密度峰值聚類算法中,超參數截斷距離dc,對聚類結果有較大的影響。截斷距離dc過大,導致數據點的局部密度值差別太小,降低聚類的差異性;若dc過小,又會使簇類結果變多,降低聚類的內聚性。因此,找到一個合適的截斷距離,對密度峰值聚類方法非常重要。參考文獻[13]中的方法,該方法引入了K近鄰的思想,提出確定dc的新方案。

通過密度峰值聚類,得到類簇時序數據S={S1,S2,…,St,…,Sn},其中St表示t時刻運行數據所屬類簇編號,S∈{1,2,…,M}。設備的整個運行過程就是在不同類簇之間進行轉移的過程,通過分析類簇時序的轉移概率Pij能夠找到設備正常運行時的變化規律。Pij表示從類簇i向類簇j轉移的概率。

假設聚類結果共M簇,那么類簇轉移概率分布,如表1 所示。

表1 類簇轉移概率分布表Tab.1 Cluster Transfer Probability Distribution Table
根據類簇轉移概率分布,得到概率轉移時序P={PS1S2,PS2S3,…,PSn-1Sn}
由于概率值是在正常運行模式下計算得到,那么概率值越大說明這兩種類簇之間的轉移更頻繁,那么這種轉移情況便更符合正常運行模式。但是設備的運行隨時隨地都會有噪聲的存在,正常數據向噪聲數據轉移的概率較低,影響異常判別。通過滑動時間窗口取平均的方法利用正常數據轉移的大概率,來補償噪聲數據出現時的小概率問題,能夠提高判別的準確率。同時實時異常檢測作業,本質上屬于短小批處理作業過程,利用滑動時間窗口模型,能夠快速找到非正常的運行模式,實時處理監測數據。


圖1 時間滑動窗口模型Fig.1 Time Sliding Window Model
異常檢測整體框架圖,如圖2 所示。首先利用大量的正常運行時的歷史監測數據進行密度峰值聚類,并計算滑動窗口下的平均轉移概率;然后對新的監測數據進行類簇匹配,并計算新數據的平均轉移概率;當數據頻繁出現與現有類簇均不匹配或者平均轉移概率值低于正常概率值時,判定設備出現異常;根據出現類簇不匹配的時間和概率值開始下降的時間,判斷設備異常發生的時間。

圖2 異常檢測框架圖Fig.2 Framework for Abnormal Detection
利用某油田變頻器的運行數據來驗證文章中提出的方法,該油田變頻器長期工作在一種不變工況下,數據采樣周期為1s,數據標簽有時間、母線電壓、輸出電壓、輸出電流、輸出轉矩、運行頻率。模型訓練環境:python3.6,win10 操作系統。利用120 天的正常運行數據訓練正常運行模式。油田變頻器前5 條數據,如表2 所示。

表2 變頻器運行數據Tab.2 Inverter Operation Data

表3 類簇轉移概率分布矩陣Tab.3 Cluster Transfer Probability Distribution Matrix
在密度峰值聚類中,K值取15,計算得到dc=0.27。通過密度峰值聚類,最后得到10 個正常類簇,并將離群點作為異常類簇0,類簇間的轉移概率分布,如表3 所示。取滑動時間窗口大小W=30,經過滑動窗口模型處理后的狀態轉移序列,如圖3 所示。

圖3 正常模式下平均轉移概率Fig.3 Average Transfer Probability in Normal Mode
從圖3 中可以看出,正常運行情況下,滑動窗口下的平均轉移概率集中在(0.45~0.55)之間,該變頻器在該工況下的正常運行模式需要符合(0.45~0.55)之間的概率變化,反之,若小于該概率,說明設備運行有異與以往的運行規律,可能是異常的出現所導致。
案例1:電磁環境干擾,變頻器內部工作機制紊亂。
從第153 點開始變頻器運行紊亂,如圖4(a),圖4(b)所示。輸出電壓、輸出電流有別于正常運行情況下的波動規律,但并未超出閾值限值,單純依靠內部閾值檢測電路并不能發現異常。通過分析其各個狀態轉移概率的變化,如圖4(d)所示。發現從第153 個數據點開始滑動窗口下的平均轉移概率迅速下滑,概率值低于正常模式水平,判斷是一種異常現象。


圖4 故障1 數據及分析圖Fig.4 Fault-1 Data and Analysis Chart
案例2:制動單元故障。

圖5 故障2 數據及分析圖Fig.5 Fault-2 Data and Analysis Chart
油田變頻器在下行過程中,電機在高速運轉時突然制動,但電動機的轉子帶著負載有較大的機械慣性,不可能很快的停止,這樣就產生反電勢,電動機處于發電狀態,其產生反向電壓轉矩與原電動狀態轉矩相反,而使電動機具有較強的制動力矩,迫使轉子較快停下來。但由于通常變頻器中的整流電路是不可逆的,因此無法回饋到電網上去,能量將在濾波電容上累積,產生泵升電壓,它對變頻器有極大的破壞力。但在工作過程中這種現象無法避免,因此通常會在直流母線之間接通一個能耗電阻,當母線電壓超過一定值時,通過電阻將多余的能量吸收。圖5(b)從第100 個點開始,變頻器輸出電流出現過高數據點,圖5(a)從126個數據點開始輸出電壓有明顯的沖高現象,同時變頻器報過壓警告,如圖5 所示。根據前文提出的異常檢測方法,如圖5(d)所示。雖然經滑動平均后的轉移概率并沒有明顯的低概率出現,但在圖5(c)聚類結果中,從113 個數據點開始頻繁出現一些不屬于任何現有類簇的數據點,所以該方法仍能夠提前識別出異常。
變頻器設備原理復雜,監測數據量大,基于模型與基于經驗的方法實現困難,而普通的神經網絡、模糊控制等方法又因為異常樣本不足問題仍無法實現。針對以上問題,提出一種基于密度峰值聚類和概率統計分析的異常檢測方法,充分了利用變頻器監測數據量大的特點,找到了一種工況不變情況下的設備正常運行模式,并通過對比正常模式,識別出了設備異常行為。但該方法只適用于同一設備在固定工況下工作時的異常識別,不能識別在多變工況下工作的設備異常行為,下一步將在這方面進行深入的研究。