李福興,李璐爔,彭 友
(1.東南大學 教育技術中心,江蘇 南京 210036;2.江蘇經貿職業技術學院 貿易與物流學院,江蘇 南京 211168)
智能設備是傳統電氣設備與計算機技術、控制理論、數據處理技術、傳感器技術、網絡通信技術、電力電子技術等相結合的產物,其結構復雜、自動化程度高,具備智能感知、自我檢測與診斷、健康維護等功能[1]。很多大型企業擁有大量智能化設備和系統,例如風電場有成千上萬套風電機組分布在野外惡劣環境中,目前其智能化程度不高,無法預測設備失效產生的后果,預測性維護還處于早期開發階段[2]。企業智能設備數量龐大,系統維護量巨大,檢修人員多[3]。日常檢修僅憑經驗判斷,難度大、效率低,亟需實現對智能設備故障類型、故障點、處理方法的自動診斷[4]。基于以上需求,筆者提出智能設備預測性維護[5-7]理念。預測性維護技術由來已久,國內外一些學者對數據驅動、故障檢測、診斷與預測、機器學習、預測模型和框架[8-9]等方面進行了研究,還有一些學者研究了國外故障預測與健康管理軟件、系統建模、模型評價方法、標準體系、故障診斷方法[10-11]等。這些研究大多局限于單臺設備和系統,借助于互聯網、物聯網、大數據技術、云計算技術展開企業級智能設備預測性維護方面的研究較少。為此,筆者從邊云協同計算模式出發,分析研究企業大量分散的智能設備和系統的預測性維護框架和模式,認為可充分利用邊緣計算廣泛的連接性等實現實時采集異種智能設備工況數據等;利用云計算高效處理大數據的能力對企業離散式智能設備運行的歷史數據進行分析、設計,形成對各類設備或系統有針對性的診斷模型,從而可綜合分析和識別故障隱患,并完成設備健康度檢查等,最后將預測模式和算法下沉至智能邊緣終端,預先判定設備發展趨勢和可能的故障,提前制定預測性維護計劃。同時,利用云計算技術可針對企業中不同種類設備應用不同預測模式,避免用一個模式預測所有設備的問題,為企業智能設備的維護工作提供了有益的借鑒。
預測性維護是利用現場連續收集的測量數據和相應的評估數據進行的基于需求導向的維護操作,可記錄機器、系統和設備的振動或變化噪音,而這些可能在實際損壞發生前的很長一段時間內就已給出機器運行存在問題的提示[12]。設備預測性維護包含設備故障預測與診斷和設備健康管理這兩個方面。故障預測與診斷是指根據設備歷史數據、設備或系統現在工況預測性地診斷部件或者設備功能狀態。健康管理是根據設備診斷、預測數據,基于維修資源、使用要求等對設備維修工作做出適當安排的能力,它通常具備故障的檢測、隔離、診斷、預測、健康管理和壽命追蹤等功能。智能設備預測性維護是指通過傳感器獲取設備或系統各關鍵部件的在線監測數據,結合自檢數據、歷史數據分析處理后得出故障預測與診斷結果,同時給出剩余使用壽命、故障發生概率、性能老化程度等。
參考邊緣計算[13]聯盟提出的邊緣計算參考架構3.0,筆者以風力發電企業為例構建邊云協同企業級智能設備預測性維護框架,如圖1所示,其主要包括云計算層、邊緣計算層和現場設備層三層。其中,邊緣計算層在云計算層與現場設備層之間,向下支持各種現場設備的接入,向上可以與云計算層銜接。

圖1 企業級智能設備預測性維護框架
現場設備層是企業中分散的各類智能設備的集合。例如,風電機組的現場設備有智能控制柜、網絡設備、傳動系統、發電機、葉片和變槳系統等設備[14]。這些設備中如果缺少實時運行工況數據的輸出接口,可在這些設備需要預測的位置上安裝相應的傳感器來實時采集數據。例如,如果有條件連接到設備或機器,就可以通過安裝沖擊和振動傳感器、加速度傳感器檢測結構噪聲;如果安裝傳感器敷設線路不方便,還可安裝無線傳感器,組成無線傳感網,實時采集和傳輸數據至智能邊緣設備中,由于實行了就近計算的原則,無線傳感數據實現了近距離傳輸,提高了傳輸質量。目前有些風電機組帶有監控和數據采集系統[15],可以充分利用這些數據進行預測。
企業中各種智能設備有各種各樣的工業總線以及接口、協議,因此預測性維護系統應具備設備和數據泛在的連接性,且應具有豐富的連接功能,能連接各種流行的網絡接口、網絡協議、網絡拓撲、因特網部署與配置、系統管理與保護等,能充分利用并吸收互聯網領域的先進技術,例如TSN(Time Sensitive Network)、SDN(Software Defined Network)、NFV(Network Function Virtualization)、NaaS(Network as a Service)、WLAN(Wireless Local Area Networks)、NB-IoT(Narrow Band Internet of Things)、5G等,還可與現有CAN、RS485、RS232等各種工業總線互聯互通。智能設備分布地域廣闊,邊緣計算是在接近物或者數據源頭的網絡邊緣側,融合網絡、計算、存儲、應用核心能力于一體的開放平臺,還能對分布的資源實現動態運維與統一管理。
邊緣計算層由具有計算機功能的智能設備組成邊緣管理器、邊緣節點。邊緣節點由邊緣網關、邊緣控制器、邊緣云、邊緣傳感器等硬件構成,具有控制功能模塊、分析功能模塊、優化功能模塊、計算網絡存儲調用接口、各種計算能力、網絡資源、存儲資源等,它是基于邊緣計算的預測性維護的業務核心,負責網絡協議處理及轉換,支持實時閉環控制業務、邊緣云計算、信息內容采集及處理為重點的邊緣傳感器等,同時負責接收云計算建立的智能設備診斷模型、專家庫及規則,從而實現智能設備的邊緣預測性維護。風電機組工作現場設備由控制計算機、風葉、電機等設備構成,這些設備已經組成了物聯網,邊緣計算則充分利用了這些設備的計算能力。
邊緣層中的邊緣傳感器由設備工況、各類傳感器數據采集終端等組成,負責對邊緣設備進行數據采集,還可實時采集場景數據等,并通過現場總線、設備網絡、無線網絡、4G/5G等將采集的數據送入邊緣層。計算資源由各邊緣智能節點設備的CPU、內存和讀寫接口資源組成。當單獨一個邊緣節點的計算能力有限時,邊緣計算可根據規則調用其他邊緣節點的CPU、內存等以滿足需要,計算結束后卸載該任務,釋放CPU和內存資源。網絡資源主要涉及移動通信、寬帶互聯網、物聯網、多源共享數據庫等,負責傳輸和處理來自邊緣設備的源數據,把存儲計算的結果同時傳輸至應用層并通過網絡將云計算結果反饋至感知層,將數據通過物聯網網關及互聯網或現場專網傳輸至網絡層的后臺云層,或將云計算的結果傳輸到現場節點,給現場的執行機構設備下達執行指令。存儲資源負責把邊緣設備采集、產生和接收的數據按照一定的規則分別存儲到邊緣智能設備的內存和磁盤存儲器中。調用API模塊、控制模塊、分析模塊和優化模塊都是優化故障預測的功能模塊。
邊緣管理器由基于預測性維護的業務編排和直接資源調用模塊組成,用于對邊緣節點上的智能設備進行統一的管理。邊緣計算節點一般有計算、網絡平臺及存儲資源,邊緣計算系統對資源的使用有兩種方法:① 直接將計算、網絡平臺以及存儲資源進行封裝,提供調用接口,邊緣管理器完成代碼上傳、配置網絡策略和數據庫操作;② 進一步將邊緣結點的資源根據基本功能領域封裝成功能模塊。邊緣管理器經由軟件驅動進行業務編排組合和調用功能模塊,實現了對預測性維護軟件的一體化開發和快捷部署。
云計算層在智能設備預測性維護框架中可以讓工作人員實時獲得有關生產、設備工況、異常報警等信息,并通過終端設備及時掌握設備運行狀況。云計算層利用云計算能力實時更新交互的設備信息數據庫,進行數據分析、故障特征提取、數據融合、故障診斷和預測,把有價值的診斷結論、決策信息展示給用戶,從而滿足設備或系統預測性維護的功能要求。
在同類智能設備采集的海量運行特征值的基礎上,用數據挖掘算法對智能設備運行數據進行清洗、聚類、挖掘,建立故障診斷專家知識庫[16],并對專家知識庫不斷更新,獲得與故障有關的診斷規則。將數據驅動判別、專家知識庫、設備技術參數判別相結合,再結合對失效模式、機理的分析,綜合形成故障診斷記錄,作為故障解決方案的基礎[17],并可將專家知識庫及診斷規則下載至智能邊緣終端,提高設備診斷速度。另外,還可安裝運行一些成熟的預測性維護軟件,例如Impact Technologies公司的PHM DesignTM等,從而節約軟件開發成本和時間。
智能設備預測性維護需完成在線監測、故障預測與診斷和健康維護。其中,在線監測可充分利用智能設備自檢功能實現,例如風電機組目前配有數據采集與控制系統(Supervisory Control and Data Acquisition,SCADA),外加現場各類傳感器即可實現在線檢測。故障預測與診斷可以分為零部件、子系統和整體3個層次,其中零部件故障可能會引起子系統故障,子系統故障則可能會引起設備整體故障。不同層次的故障預測與診斷預測模式也會有所不同,對于可采集到大量實時運行數據類的智能設備,常用數據驅動模式進行預測,但本文的構思是將這些智能設備全部納入邊云協同云計算框架中,在增強系統處理能力的同時,也增加了預測模式及其算法。本文簡單闡述了基于模型的驅動模式、基于概率統計的驅動模式、基于數字孿生(Digital Twin)和概率數字孿生的驅動模式,著重討論了數據驅動模式。
基于模型的驅動模式是指采用動態模型或過程的預測性維護方法。物理模型方法、卡爾曼濾波、擴展卡爾曼濾波、粒子濾波和基于專家經驗模型等均屬于基于模型驅動的故障預測技術[18]。基于模型的驅動模式通常要求被預測對象有已知數學模型,在其工作狀態下結合該數學模型計算評估設備關鍵零部件損耗程度,在設備有效壽命周期內評估設備或系統部件使用的故障狀態、剩余壽命。但由于缺乏設備故障狀態數據,物理建模有一定的困難,且會影響預測效果。
基于概率統計的驅動模式適用于利用歷史數據對概率統計結果進行故障預測。相比于基于模型的驅動模式,這種預測模式所需信息包含在一系列概率密度函數中,因此,僅需少量的細節信息就可進行預測。其優勢是所需的概率密度函數可以通過對設備運行數據統計分析獲得,并對預測提供足夠的支撐。該模式得出的置信度能較好地表征預測結果的準確度。
這種模式的方法有貝葉斯方法、Dempster-Shafer理論、模糊邏輯等,這些方法通常基于貝葉斯定理估計故障的概率密度函數。通過對大量設備和系統的可靠性分析可知,一般設備或系統的失效與時間數據趨勢服從威布爾分布[19],因此,該模型被常用于設備或系統剩余壽命的預測。
由此可見,該模式的前提條件是要有發生故障的歷史數據,否則無法做出預測或導致預測偏差較大,但設備發生故障的概率較小,獲得歷史數據比較困難。
數字孿生是創建物理實體的虛擬模型的同步映射與實時交互,借助數據模擬物理實體在現實環境中的行為,通過虛實交互反饋、數據融合分析、決策迭代優化等手段,為物理實體增加或擴展新的能力以及精準的設備狀態預測服務[20]。數字孿生面向產品全生命周期過程,提供更加實時、高效、智能的服務[21-22],成為設備管理新模式,可快速捕捉故障現象、準確定位故障原因、合理設計并驗證維修策略。基于數字孿生的驅動模式如圖2所示,物理設備和虛擬設備在孿生數據的驅動下與物理設備同步運行,并產生設備評估、故障預測及維修驗證等數據[23-25]。但這種模式需要事先構建設備虛擬化,實施時有一定的難度。

圖2 基于數字孿生驅動模式
概率數字孿生模型如圖3所示,引入了決策風險分析,為現有的數字孿生模式增加了一層概率分析,捕捉設備的不確定性因素、新技術以及實際因素對設備性能與安全性的影響。概率數字孿生是數字孿生的進化版而非替代版,它把數字孿生機制引入風險分析領域,可以依靠可靠性和退化模型來預測設備組件的剩余壽命。

圖3 概率數字孿生驅動模型
這兩者主要區別在于:① 概率退化與故障模型:反映出影響性能并導致故障的不確定及可變條件和過程;② 邏輯與關系模型:將性能變量與故障和損失事件聯系起來;③ 代理模型:即快速近似模型,可快速查詢,并實現不確定性和模型耦合的傳播。
基于測試數據或傳感器數據進行預測的模式稱為數據驅動模式。其前置條件是目前的智能設備都具有預測、感知、分析、推理、決策、控制功能,智能設備具有部件或者系統設計、仿真、運行和維護等各個階段的測試,這些數據都會存儲在設備或系統中。有些設備自帶故障診斷系統并提供數據,對其按照數據融合規則進行多級數據融合后得到預測模式。典型的基于數據驅動的故障預測算法有:神經網絡、模糊系統、機器學習和統計分析等[26]。在大數據、云計算技術的支撐下,筆者提出采取多層級數據融合故障預測模式,其模式流程如圖4所示。

圖4 多層級數據融合
該模式的構思是基于目前智能設備可以獲取多項數據,對這些數據的融合可分為4層。
第1層:單項數據融合。智能設備有些數據項是關鍵項,根據該數據項就可以達到故障預測的基本目標,但數據也會存在各種干擾,從而產生誤差。為了消除誤差,對同一傳感器在不同時間段內所采集的數據可用時序數據分析、神經網絡、灰色理論、支持向量機等算法進行故障預測與診斷。例如根據智能機電設備震動數據用某一種預測算法進行故障預測,這是一種線性預測模式。
第2層:多項數據特征融合。當前智能設備運行狀態數據由多項數據構成,這些可被實時采集的數據是故障預測與診斷的基礎資源。經過第一層級單項數據融合,可得到該設備同類傳感器所采集的各項數據特征,例如風電機組的電氣特征、機械特征、溫度特征、震動特征、聲音特征等,對這些特征用特征融合算法進行融合即為多項數據特征融合,可以解決故障預測僅依賴某一數據項導致的預測偏差問題。有些設備在得到數據特征后即可進行故障預測決策。但對于復雜智能設備,僅根據特征數據還不能對故障做出準確預測,還需要各項特征進一步數據融合,得到智能設備各狀態的發展趨勢。
第3層:趨勢融合。利用設備中安裝的多種傳感器采集的數據集以及第2層多項數據特征融合的結果,采用算法得到智能設備各項指標的趨勢特征。趨勢融合目前常用深度學習模式,其常用算法是神經網絡算法,其中卷積神經網絡(Convolutional Neural Networks,CNN)可有效降低網絡的復雜度,并減少訓練參數的數量,具有強魯棒性和容錯能力,便于訓練和優化。針對根據實時數據特征融合這類時序特性明顯的特征趨勢融合算法,Cui等[27]提出了一種基于多尺度 CNN 的時間序列分類模型(稱為MCNN 模型),MCNN在卷積層中將多通道的數據進行整合,可以處理多源時間序列,通過將原始數據下采樣到不同的時間尺度使其不僅能夠提取不同尺度的低級特征,而且能夠提取更高級的特征。
第4層:決策融合。根據智能設備的狀態的發展趨勢,采用專家知識庫、黑板理論等數據融合算法,也可采用基于決策樹與擴展D矩陣的故障隔離方法[28]等對智能設備的電子器件進行故障預測與診斷,并得到設備故障預測與診斷結果。
需要指出是,數據驅動模式對設備或系統進行故障預測并非每次都要遍歷這4個層次,如果故障特征十分明顯,則可以直接做出判斷。
復雜設備采集的數據會有若干項,而每項數據對故障的影響權重不同。在進行故障預測時,為數據項賦予不同權重并組合進行預測的模式稱為組合預測模式。例如,機電設備故障預測時除了根據設備震動數據外,還可結合設備的工作時發出的聲音預測故障。數據驅動預測模式的關鍵是數據的準確性與數據處理算法及流程的合理性。
設備的剩余使用壽命(Remaining Useful Life,RUL)是在設備需要維修或更換之前的預期壽命或剩余使用時間。根據系統數據預測剩余使用壽命是預測維護算法的主要目標。在整機壽命管理方面,Manuel、Smarsly等[29-31]分別采用統計法和集成監測法進行風電機組使用壽命預測與管理。由此可見,對于不同智能設備的壽命預測有不同的方法。在壽命預測的基礎上,應制定設備維護計劃。利用邊云協同中的云分布式儲存技術,同步更新并保存所有在線設備在使用期間的歷史數據,確保數據可追溯,并為設備的正常運行實時提供數據對比,從而及時發現設備隱患。另一方面,不同廠商設備運行積累的數據在做壽命預測時可相互借鑒。通過互聯網將獲得的設備數據發布到云計算平臺,與設備供應鏈的各節點企業共享,通過人機交互界面可以讓企業內外部供應鏈相關人員實時與數字孿生系統進行信息交互,及時獲取設備工作狀態,協同設備生產企業進行產品升級換代。
數據驅動模式是從以往積累的數據中識別或學習設備的健康/非健康行為,將原始監測數據轉作為檢測或建模的基礎,結合當前運行狀態,對設備的未來狀態進行預測。數據驅動模式,尤其是結合大數據技術、云計算技術后,以其靈活的適應性和易用性獲得了廣泛的應用。但也存在因獲取精確數據難而影響預測效果的問題,以及不同類型設備感知數據對設備狀態影響權重無法精確認定等問題。在采用邊云協同機制建立企業內設備故障預測系統后,企業除可建立統一設備故障預測系統外,還可以借助于云計算有針對性地為設備建立不同的預測模式,從而提高預測有效性。
智能設備或系統預測性維護目前處于探索階段,筆者基于預測性維護技術、邊云協同技術、大數據處理技術,對智能設備或系統預測性維護做了探討。
由于智能設備具有企業地域廣、設備分散、設備種類多而雜的特點,采用邊緣計算與云計算協同框架進行智能設備預測性維護工作比較合適。預測驅動模式選用基于多層級數據融合故障預測模式,但不能完全依賴某一種模式,在大數據和云計算技術的支撐下,可以采用多種驅動模式相結合的方式,以適應企業中不同智能設備的故障預測與診斷。這是邊云協同的優勢,也突破了設備故障預測與診斷研究慣性思維。
雖然數字孿生和概率數字孿生模式是一種比較新的驅動模式,但還存在虛實一致,孿生數據的故障特征提取及融合,故障過程建模及傳播機理,自組織、自學習、自優化機制,需求的捕捉與精準解析,基于虛擬驗證的服務精準執行等方面的問題,有待進一步研究。