印四華,楊海東,徐康康,朱成就,王亞利,金 熹
(廣東工業(yè)大學(xué)機(jī)電工程學(xué)院,廣州 510006)
高耗能機(jī)器的生產(chǎn)條件復(fù)雜,且長期滿負(fù)荷運(yùn)行,能耗異常的概率很高。典型的高能耗機(jī)器主要包括液壓機(jī)、工業(yè)窯爐等[1]。在生產(chǎn)過程中,這些高能耗機(jī)器的能耗數(shù)據(jù)具有階躍式、交變性和周期性的特點(diǎn)。機(jī)器的異常能耗通常伴隨著大量的能量損失和能源效率的降低,甚至?xí)?dǎo)致停機(jī)和不可估量的安全事故,從而影響整個(gè)生產(chǎn)線的正常生產(chǎn)。隨著時(shí)間的推移,機(jī)器的磨損程度會(huì)逐漸增加,從而導(dǎo)致機(jī)器的能耗增加[2]。早期發(fā)現(xiàn)異常能耗是優(yōu)化能效的關(guān)鍵。中國宣布的目標(biāo)是到2030年達(dá)到碳排放的峰值,并到2060 年進(jìn)一步實(shí)現(xiàn)碳中和。工業(yè)排放在國家排放清單中發(fā)揮著主導(dǎo)作用,而能源密集型工業(yè)中與能源相關(guān)的排放需要更快地達(dá)到峰值[3]。解決減少排放的問題需要努力優(yōu)化能耗行為。隨著不斷上漲的電價(jià),以及對溫室氣體效應(yīng)的擔(dān)憂,人們越來越關(guān)注能效問題[4]。因此,開發(fā)一種可靠、快速和自動(dòng)的能耗異常檢測技術(shù)具有重要意義。有了這些新方法,生產(chǎn)企業(yè)可以對高能耗機(jī)器進(jìn)行監(jiān)控和處理,避免能源損失,優(yōu)化能源效率。
異常檢測主要用于檢測數(shù)據(jù)集中偏離正常模式的異常數(shù)據(jù),是數(shù)據(jù)挖掘領(lǐng)域中最受歡迎的研究領(lǐng)域之一。被廣泛應(yīng)用于能耗、機(jī)械設(shè)備中的故障、網(wǎng)絡(luò)入侵檢測等領(lǐng)域[5]。所研究的能耗數(shù)據(jù)屬于一種時(shí)間序列數(shù)據(jù)。而時(shí)間序列異常檢測是計(jì)算機(jī)科學(xué)的研究熱點(diǎn),它已成為制造和能源領(lǐng)域的重要問題[6]。時(shí)間序列數(shù)據(jù)異常檢測方法主要包括:基于距離的異常檢測、基于預(yù)測的異常檢測、基于聚類的異常檢測等方法[7]。關(guān)于基于距離的異常檢測方法,Huo 等[8]提出了一種基于距離的時(shí)間序列數(shù)據(jù)在線異常檢測算法。該方法采用K-均值和時(shí)空權(quán)衡機(jī)制來降低時(shí)間復(fù)雜度,具有良好的有效性和通用性。對于基于預(yù)測的異常檢測方法,需要大量的數(shù)據(jù)訓(xùn)練來建立模型。因此,當(dāng)數(shù)據(jù)和模型本身存在問題時(shí),該方法的檢測性能就會(huì)很差[9]。對于基于聚類的異常檢測方法,“聚類算法”是指將原始數(shù)據(jù)分類為相應(yīng)的近似類,使類之間的相似性低,類內(nèi)相似性高。李熙等[10]采用K-means 聚類方法對牽引能耗模式進(jìn)行了識別,然后提出了一種針對牽引能耗時(shí)間序列的異常分析方法。Li 等[11]采用模糊C-Means 聚類的擴(kuò)展版本對數(shù)據(jù)集進(jìn)行了聚類,在此基礎(chǔ)上提出了一種基于聚類的異常檢測方法。其目的是檢測多元時(shí)間序列中的振幅異常和形狀異常。一些學(xué)者也提出了其他的異常檢測方法。Liang 等[12]提出了一種基于約束超圖的方法,該方法利用子序列上的約束來檢測異常,其目的是用于工業(yè)時(shí)間序列異常檢測。
傳統(tǒng)的異常檢測方法分為基于局部的異常檢測方法和基于全局的異常檢測方法。由于缺乏適當(dāng)?shù)膬?yōu)化,它們的檢測效率低,適應(yīng)性差。綜上所述,現(xiàn)有的異常檢測方法各有不足:(1)局部異常檢測方法假設(shè)異常數(shù)據(jù)可以在局部明顯顯示,可以通過一維時(shí)間信號分析進(jìn)行檢測,然而,這種方法過于注重局部的小變化,導(dǎo)致誤報(bào)率較高,可擴(kuò)展性差;(2)全局異常檢測方法的前提是某些異常數(shù)據(jù)不能在局部清楚地顯示,因此需要在全局范圍內(nèi)進(jìn)行檢測,但因忽視局部輕微異常,漏報(bào)率高。傳統(tǒng)的異常檢測方法不能準(zhǔn)確地檢測具有階躍式和交變性特征的能耗數(shù)據(jù),存在漏報(bào)率、誤報(bào)率高等缺點(diǎn)。本文致力于解決階躍式和交變性能耗數(shù)據(jù)的異常檢測所面臨的挑戰(zhàn)。所提出的方法可以提供節(jié)能決策的依據(jù),其目的是指導(dǎo)能源管理工程師實(shí)現(xiàn)能效優(yōu)化。
典型的高能耗機(jī)器主要包括液壓機(jī)和工業(yè)窯爐等。在生產(chǎn)過程中,這些機(jī)器的能耗數(shù)據(jù)具有階躍式、交變性和周期性等特點(diǎn)。該能耗數(shù)據(jù)的一個(gè)正常周期可分為3 個(gè)階段:空載前進(jìn)、負(fù)載前進(jìn)和空載后退。在一個(gè)周期中的一個(gè)特定位置,數(shù)據(jù)通常會(huì)有一個(gè)跳躍式的增加。該位置位于空載前進(jìn)數(shù)據(jù)段的末端,同時(shí)也就是爬升數(shù)據(jù)段的前端。該數(shù)據(jù)通常是由正常預(yù)操作引起的。如圖1中的第3個(gè)周期所示。
圖1 階躍式和交變性能耗數(shù)據(jù)中的點(diǎn)異常特征
各種不確定的工況通常會(huì)導(dǎo)致能耗數(shù)據(jù)異常,從而降低機(jī)器的能源效率。在能耗數(shù)據(jù)的時(shí)間序列中,經(jīng)常會(huì)出現(xiàn)瞬態(tài)低功率和瞬態(tài)高功率等異常能耗數(shù)據(jù)。這主要是由于不穩(wěn)定的電流/電壓負(fù)載、傳感器損壞和異常通信造成的。數(shù)據(jù)的瞬時(shí)增加通常發(fā)生在空載后退數(shù)據(jù)段中,它通常是由短時(shí)誤操作造成的。一種典型的異常能耗數(shù)據(jù)通常發(fā)生在空載前進(jìn)數(shù)據(jù)段中。也就是說,數(shù)據(jù)在正常預(yù)操作前就會(huì)瞬間增加,稱之為瞬時(shí)阻塞。它通常是由于高能耗機(jī)器運(yùn)行過程中硬質(zhì)材料堵塞引起的,也可能是由加工坯料中的材料異常引起的。個(gè)別能耗數(shù)據(jù)偏離正常范圍較大,但鄰域內(nèi)數(shù)據(jù)正常,這稱為點(diǎn)異常,如圖1所示。
本文將雨流(RF)計(jì)數(shù)方法與局部離群因子(LOF)算法相結(jié)合,提出了一種基于雨流計(jì)數(shù)的局部離群因子(RF-LOF)的異常檢測方法。該方法能夠正確檢測能耗數(shù)據(jù)的點(diǎn)異常。
本研究采用雨流計(jì)數(shù)法對能耗數(shù)據(jù)時(shí)間序列進(jìn)行預(yù)處理,其目的是刪除爬坡和下坡位置的干擾數(shù)據(jù)。利用雨流計(jì)數(shù)法的數(shù)據(jù)壓縮環(huán)節(jié),將長度M的能耗數(shù)據(jù)處理成由局部極大值和極小值組成的峰谷序列。點(diǎn)Xi被識別為非峰谷點(diǎn),如果:
式中:Xi為現(xiàn)場采集的能耗數(shù)據(jù)點(diǎn),對于數(shù)據(jù)段的端點(diǎn),它直接被認(rèn)為是峰谷點(diǎn)。
在本研究中,使用高斯混合模型聚類算法將雨流計(jì)數(shù)法處理后的數(shù)據(jù)劃分為兩個(gè)子空間。對于經(jīng)過雨流計(jì)數(shù)法處理后的能耗數(shù)據(jù),假定它的空間概率分布可以近似地用多個(gè)高斯分布概率函數(shù)表示。根據(jù)高斯混合模型聚類的理論,能耗數(shù)據(jù)x服從高斯分布:
能耗數(shù)據(jù)x的高斯混合模型的表達(dá)式為:
根據(jù)貝葉斯定理,能耗數(shù)據(jù)xj屬于i類的后驗(yàn)概率為:
式中:1 ≤i≤k。
給每個(gè)能耗數(shù)據(jù)分類都分配一個(gè)系數(shù)。那么,能耗數(shù)據(jù)xj的分類公式為:
在上述方程中,分別對∑和μ求導(dǎo),并且令導(dǎo)數(shù)為0。計(jì)算得到的均值向量和協(xié)方差矩陣分別為:
式中:λ為拉格朗日乘子。
在上述方程中,對αi進(jìn)行求導(dǎo),并且令導(dǎo)數(shù)為0。計(jì)算得到的混合系數(shù)為:
局部離群因子算法屬于一種基于密度的方法。該方法為每個(gè)數(shù)據(jù)分配一個(gè)局部離群因子,并根據(jù)局部離群值確定離群值。
2.3.1K-近鄰可達(dá)距離
從點(diǎn)q到點(diǎn)o的K-近鄰可達(dá)距離可表示為:
式中:d(q,o)為點(diǎn)q到點(diǎn)o之間的歐氏距離。
2.3.2 局部可達(dá)性密度
點(diǎn)q的局部可達(dá)密度可以表示為:
該公式表示從點(diǎn)q的K-近鄰鄰域中的所有點(diǎn)到點(diǎn)q的平均可達(dá)距離的倒數(shù)。局部可達(dá)密度代表一個(gè)密度,密度越高,就越有可能屬于同一簇,當(dāng)密度越低,就越有可能是離群點(diǎn)。
2.3.3 局部異常因子
點(diǎn)q的局部異常因子LOF(q)表示為:
采用局部異常因子LOF(q)作為判斷點(diǎn)q是否異常的指標(biāo),當(dāng)LOF(q)值接近1 時(shí),表明q點(diǎn)是正常點(diǎn),當(dāng)LOF(q)值遠(yuǎn)大于1時(shí),這表明q點(diǎn)更有可能是異常點(diǎn)。
在點(diǎn)異常檢測過程中,所涉及的特征值的范圍是不同的,因此需要對其進(jìn)行歸一化。本文對向量進(jìn)行L2范數(shù)歸一化處理,建立一個(gè)從c到c′的映射,使得c′的L2范數(shù)為1,也就是:
為了判斷某個(gè)能耗數(shù)據(jù)是否是點(diǎn)異常,本節(jié)提出了點(diǎn)異常的閾值δ如下:
式中:α為根據(jù)實(shí)際情況設(shè)定的點(diǎn)異常系數(shù),如果LOF>δ,那么將該點(diǎn)判斷為點(diǎn)異常。
所提出的基于RF-LOF的點(diǎn)異常檢測算法的綜合框架如表1所示。
表1 基于RF-LOF的點(diǎn)異常檢測算法
為了驗(yàn)證所提出的基于雨流計(jì)數(shù)的異常檢測方法的性能,本文采用了鋁型材擠壓機(jī)的實(shí)時(shí)能耗數(shù)據(jù)。這些數(shù)據(jù)來自華南某大型鋁型材擠壓制造企業(yè)的能源管理系統(tǒng),采集頻率為1 Hz。此外,為了商業(yè)保密,對數(shù)據(jù)進(jìn)行了加密處理。能耗監(jiān)測和控制終端如圖2 所示。實(shí)驗(yàn)是在64 位,3.60G Hz 英特爾?核心TMi7 計(jì)算機(jī)上運(yùn)行的,微軟Windows10 和8 GB 內(nèi)存。該方法是在MATLAB R2018a中執(zhí)行的。
圖2 鋁型材擠壓機(jī)能耗監(jiān)測與優(yōu)化平臺
在仿真實(shí)驗(yàn)中,利用6 個(gè)周期的鋁型材擠壓機(jī)的能耗數(shù)據(jù)對點(diǎn)異常進(jìn)行了檢測。每個(gè)周期的長度為100 s。采用橢圓標(biāo)記了6個(gè)點(diǎn)異常,如圖3(a)所示。點(diǎn)線表示整個(gè)周期的點(diǎn)異常閾值δ。若LOF值高于此點(diǎn)線,則判定對應(yīng)點(diǎn)為點(diǎn)異常。仿真結(jié)果表明,本文提出的點(diǎn)異常檢測方法(RF-LOF)是有效的。能自動(dòng)準(zhǔn)確判斷該點(diǎn)是否為點(diǎn)異常,因此能夠滿足實(shí)際應(yīng)用的要求。
在這里,使用所提出的方法(RF-LOF)和LOF方法進(jìn)行比較實(shí)驗(yàn)。利用LOF方法直接對5 個(gè)周期的能耗數(shù)據(jù)進(jìn)行點(diǎn)異常檢測,仿真結(jié)果如圖3(d)所示。明顯觀察到異常數(shù)據(jù)不能用LOF方法明確區(qū)分,正常數(shù)據(jù)點(diǎn)出現(xiàn)了一些誤判,這是因?yàn)闆]有考慮能耗數(shù)據(jù)階躍特性的影響。相反,基于RF-LOF的方法使點(diǎn)異常檢測更加合理和可行。
本文中仿真所涉及的參數(shù)設(shè)置如表2 所示。初始簇中心數(shù)n設(shè)置為2。然后,高斯混合模型聚類算法可以正確地將“負(fù)載前進(jìn)”和“空載前進(jìn)和空載后退”分為兩類。
為了分析該方法中的k值對檢測結(jié)果的影響,對鋁型材擠壓機(jī)的連續(xù)能耗數(shù)據(jù)進(jìn)行了采樣和驗(yàn)證。分別利用k的不同值獲得計(jì)算時(shí)間和檢測率,如表3 所示。本文將檢測率定義為檢測到的異常數(shù)據(jù)與異常數(shù)據(jù)總數(shù)的比值。當(dāng)k=6~10 時(shí),檢測結(jié)果良好,當(dāng)k=8 時(shí),檢測結(jié)果最好。此外,當(dāng)k≥11 時(shí),所提出的檢測算法不能收斂,這主要是由于空載前進(jìn)和空載后退的數(shù)據(jù)段較短。在計(jì)算時(shí)間方面,當(dāng)處理500 個(gè)能耗數(shù)據(jù)時(shí),該方法的整個(gè)檢測過程可以在0.3 s 內(nèi)完成,這表明所提出的基于RF-LOF的點(diǎn)異常檢測方法適用于在線使用。
表3 不同k值的計(jì)算時(shí)間和檢測率
在這里,采用來自機(jī)器狀態(tài)嚴(yán)重惡化的鋁型材擠壓機(jī)的能耗數(shù)據(jù)進(jìn)行了仿真實(shí)驗(yàn),結(jié)果如圖4 所示。在本實(shí)驗(yàn)中,計(jì)算得到的LOF值的時(shí)間序列在較大的范圍內(nèi)波動(dòng),這意味著點(diǎn)異常檢測結(jié)果的變化更劇烈。我們將點(diǎn)異常的閾值系數(shù)α提高到1.85,其目的是為了自動(dòng)而準(zhǔn)確地判斷能耗數(shù)據(jù)是否為點(diǎn)異常。
圖4 惡化能耗數(shù)據(jù)的點(diǎn)異常檢測結(jié)果
在此,采用所提出的方法對正常能耗數(shù)據(jù)進(jìn)行了異常檢測,如圖5 所示。在模擬實(shí)驗(yàn)中,沒有發(fā)生誤檢測。雨流計(jì)數(shù)法將連續(xù)上升或者連續(xù)下降的3 個(gè)以上的點(diǎn)的中間的點(diǎn)刪除。據(jù)此,可以及時(shí)發(fā)現(xiàn)不符合交變性特征的數(shù)據(jù)段,并且能夠在時(shí)間維度上精確定位它們。如圖5(b)所示,所提方法有助于及時(shí)發(fā)現(xiàn)傳感器的潛在異常。
圖5 正常能耗數(shù)據(jù)的點(diǎn)異常檢測結(jié)果
在華南某大型鋁型材擠壓制造企業(yè)的800 USt擠壓車間中,初步測試了所提出的點(diǎn)異常檢測方法,于2021年9—12月進(jìn)行了對比實(shí)驗(yàn)。首先,在9月份對能源管理系統(tǒng)中的異常能耗進(jìn)行檢測。然后,組織能源管理專家對能耗異常的原因進(jìn)行討論和分析,其目的是制定節(jié)能策略。所采取的能效優(yōu)化措施主要包括3個(gè)方面:(1)相關(guān)的設(shè)備維護(hù)、保養(yǎng)和更換;(2)加強(qiáng)生產(chǎn)工人的技能培訓(xùn),其目的是提高生產(chǎn)技能、減少誤操作;(3)加強(qiáng)對生產(chǎn)材料的質(zhì)量檢測與篩選。最后,在10月份,再次對異常能耗進(jìn)行了檢測,以驗(yàn)證所采取措施的結(jié)果。結(jié)果如表4所示。
表4 實(shí)驗(yàn)月異常能耗的檢測結(jié)果
在2021年9月,所提出的檢測模型檢測出了288個(gè)點(diǎn)異常。其中35個(gè)點(diǎn)異常是由短時(shí)誤操作引起的。75個(gè)點(diǎn)異常是由瞬時(shí)阻塞引起的。剩下的178 個(gè)點(diǎn)異常可能是由于儀表損壞和異常通信造成的。在9 月底,現(xiàn)場工程師對數(shù)據(jù)采集系統(tǒng)的傳感器和通信線路進(jìn)行了檢查確認(rèn)。并更換了相應(yīng)的元器件。根據(jù)10月份的異常檢測結(jié)果,知道瞬態(tài)低功率和瞬態(tài)高功率的次數(shù)都大大減少了。可以看出,采取的措施達(dá)到了預(yù)期的目的。這樣就實(shí)現(xiàn)了能耗的精確測量,避免了數(shù)據(jù)采集系統(tǒng)帶來的數(shù)據(jù)不確定性。然后,培訓(xùn)生產(chǎn)工人的技能,旨在提高他們的操作技能和節(jié)能意識。結(jié)果表明,這大大減少了短時(shí)誤操作的次數(shù)。技能培訓(xùn)可以減少不必要的能源損失,并優(yōu)化能源效率。最后,對鋁型材擠壓機(jī)進(jìn)行了主動(dòng)維護(hù),并且對鋁錠進(jìn)行了嚴(yán)格的質(zhì)量檢測與篩選。其目的是消除瞬時(shí)阻塞所導(dǎo)致的能耗損失。研究結(jié)果表明,在9月底采取的這些措施取得了良好的節(jié)能效果。短時(shí)誤操作和瞬時(shí)阻塞的次數(shù)都大大減少了。截至10 月底的統(tǒng)計(jì)數(shù)據(jù)表明,所提出的方法將機(jī)器的能源效率提高了2.9%。
考慮到能耗數(shù)據(jù)的階躍式和交變性特征,本文提出了一種基于雨流計(jì)數(shù)的局部離群因子算法,其目的是應(yīng)用于能耗數(shù)據(jù)中的點(diǎn)異常檢測。實(shí)際生產(chǎn)數(shù)據(jù)的仿真實(shí)驗(yàn)表明,本研究提出的異常檢測方法是有效的,具有較高的檢測精度和檢測效率,適合在線使用。雨流計(jì)數(shù)法可以處理爬坡和下坡數(shù)據(jù),以減少它們對異常檢測的影響。該方法的處理結(jié)果有利于及時(shí)發(fā)現(xiàn)異常的交變性數(shù)據(jù)。混合高斯模型可以正確地將一個(gè)周期的能耗數(shù)據(jù)劃分成兩個(gè)子空間,并且具有很好的魯棒性。局部離群因子算法可以準(zhǔn)確地發(fā)現(xiàn)子空間的點(diǎn)異常,這也是一種有效的異常特征提取方法。實(shí)踐證明,該方法還可以完成實(shí)際生產(chǎn)環(huán)境中能耗的異常檢測任務(wù),幫助能源管理工程師實(shí)時(shí)優(yōu)化能效。