秦大力 于德介
1.湖南大學汽車車身先進設計制造國家重點實驗室,長沙,410082 2.湖南農業大學,長沙,410128
機械設備預知維護與故障診斷是提高制造業運營管理水平和生產效率的有效手段[1]。但由于對設備維護診斷機理的認識不充分,往往會產生大量不確定性因素[2],主要表現在:①診斷知識的來源與結構各異,既有實時監測運行數據,也有根據經驗得出的設備運行狀態主觀判斷;②故障的劃分邊界比較模糊,導致故障征兆定義以及診斷行為建模存在一定程度的模糊性與隨意性;③復雜動態診斷維護環境本身存在不可預知性,使得由故障征兆推斷故障成因的反向推理成為一種不確定性的過程。如何減小上述不確定性因素的影響是機械設備維護與診斷過程中亟需研究解決的重要問題。
基于本體的智能診斷技術可以減小設備維護診斷過程中不確定性因素影響,其重要基礎是維護診斷知識的表示。本體已廣泛應用于制造領域中的產品生命周期管理[3]、制造過程管理[4]、產品知識集成[5]等方面,而基于本體的制造過程語義模型通過對診斷行為、工況狀態和維護決策等進行建模,實現了協同制造環境下的維護診斷知識共享[6]。但這些應用忽略了本體自身邏輯推理的局限性,模型推理能力僅限于本體語義規則推理,很難進一步對故障原因做出恰當的推理解釋。
作為一種不確定性建模與推理工具,貝葉斯網絡(Bayesian networks,BNs)可以實現設備維護決策與故障機理分析過程中的診斷推理[7-8]。Gilabert等[9]利用BNs來解決預知維護過程中的不確定性,但診斷維護經驗以先驗概率的形式表示,設備狀態與故障征兆之間的映射對先驗概率依賴性很強。姜萬錄等[10]引入貝葉斯參數估計算法進行了多特征信息融合,然后通過最大后驗概率估計值的計算進行故障識別,但診斷結構模型定義不清晰,診斷過程知識缺乏合理的表達形式。
本文將基于本體的維護診斷知識表示與BNs概率推理方法相結合,構建了基于本體的故障診斷貝葉斯網絡(ontology-based diagnostic Bayesian networks,OntoDBN)。OntoDBN 對診斷語義模型進行概率擴展,實現了診斷貝葉斯網絡的概率推理。針對故障知識、診斷證據以及維護診斷過程的不確定性,重點研究了設備工況狀態識別與故障成因概率推理算法,根據算法產生的可能故障的概率解釋,制訂出相應的維修方案和決策。
基于診斷知識表達、故障成因分析、因果關系推理等方面不確定性因素的分析,結合本體論與貝葉斯網絡,本文提出以本體語義為基礎的故障診斷貝葉斯網絡模型,其體系結構如圖1所示。圖中本體語義模型包括狀態層、征兆層、故障層和決策層,分別對應了從數據到智能的4個知識加工層次,涵蓋了工況識別、特征提取、模式分類以及維護決策等基本診斷步驟所涉及的數據信息;BNs推理引擎以概率形式逐步給出各個層次的診斷實體主觀信度,構建出完整的故障診斷貝葉斯網絡模型。此外,在保持診斷語義模型及其描述邏輯兼容性的前提下,OntoDBN對本體模型中的關鍵概念及關系進行擴展,以支持后續的故障概率推理。

圖1 OntoDBN的體系結構

OntoDBN使用本體作為故障知識的表示形式,通過增加本體語義并添加概率信息,將帶有概率信息的故障本體轉換為貝葉斯網絡,以貝葉斯網絡作為底層推理機制,實現對故障診斷知識的不確定性推理研究。將本體語義描述和貝葉斯網絡概率推理相結合,既實現了診斷領域知識的形式化描述與共享,又能在一定程度上消除診斷過程中不確定性因素的影響。
設備維護與故障診斷涉及設備制造、投運到最終報廢的整個過程,關鍵維護與診斷要素隱藏于海量的生產環境信息流中。因此,首先要過濾這些異構多源的信息并使信息結構化和形式化,然后從多方面擴展設備維護與故障診斷方法,在有效地獲取、使用并存儲語義知識的基礎上建立一個可靠、完備的維護診斷知識本體模型。
本體建模的首要任務是理清應用領域中的核心概念,并針對應用實體與行為構造出可擴展的語義模型(即核心本體)。核心本體是定義維護對象、診斷行為、實體關系及維護方法論的頂層本體,且獨立于任何特定設備或應用。OntoDBN核心本體包括設備域本體、過程域本體和診斷域本體,見圖2。
(1)設備域本體用于描述維護診斷對象實體的功能、結構和依存關系,依照類別、設備、部件、特征4個層次對設備實體進行信息分解,Component和Characterization為設備域本體的核心類(圖2中使用灰色標識的類)。
(2)過程域本體是維護過程的知識表示,包括維護行為、工況狀態(Condion)、過程步驟(ProcessStep)及測試方法等。過程域本體一方面要與設備域本體建立聯系,另一方面還關聯到后續的診斷分析與維護決策。
(3)作為故障診斷和維護決策知識的語義描述,診斷域本體給出了設備動態性能的變化規律和故障征兆的識別方法。設備故障(Fault)及其征兆(Symptom)是診斷域本體的核心概念。故障征兆本質上是設備運行狀態的另一種表現形式,可劃分為數值型征兆(NumericSym)、語義型征兆(DescriptiveSym)和圖形征兆(GraphicSym)三類。

圖2 OntoDBN維護與診斷本體概念之間的關聯
為了實現故障的概率推理,需要對OntoDBN核心本體進行概率擴展,在本體實例中加入概率信息。在OntoDBN核心本體模型基礎上,實現本體結構向BNs結構的轉換,具體包括:本體概念與BNs節點的轉換、本體關系與BNs有向邊的轉換、屬性值的轉換以及建立合適的CPT。診斷的本質是故障模式識別,因此可以從設備狀態、故障征兆以及故障本身的相互關系出發,全面考慮維護診斷過程中涉及的相關因素,建立圍繞狀態、征兆、故障三者的BNs概率基本模型,見圖3。

圖3 維護診斷過程的BNs概率模型
故障診斷過程中,先要進行設備異常狀態的識別(如圖3中的轉換②),識別的結果表示為故障征兆;而設備的正常運行狀態或數據與故障征兆同樣重要,故障推理的過程可能會需要參考設備正常運行時的狀態數據(如圖3中的有向邊①);故障模式識別則涉及故障征兆與故障成因的概率推理(如圖3中的③)。因此,OntoDBN診斷推理可以分為兩個緊密相連的步驟:其一,使用Bayes決策方法從設備運行狀態數據中找出異常狀態(即故障征兆);其二,根據設備狀態或特征值、故障征兆的概率推理出故障發生的概率。此外,診斷過程中的其他相關信息也需要以恰當的方式在診斷知識模型中表現出來,如維護人員與診斷專家的經驗、設備運行歷史狀態等。以下給出了OntoDBN故障本體及其屬性集的定義。
定義1 OntoDBN故障本體OF={F,I,PF,finst},其中,F為故障類集合,I為故障實例集合,PF為屬性集,finst為故障類實例化函數:F→2I。
定義2 屬性集PF={hasCause,hasCondition,hasSym,isObserved,hasPriorPr,has-CondPr}。其中,hasCause表示故障原因,has-Condition表示故障發生時設備的運行狀態,has-Sym表示故障征兆,isObserved表示故障是否被觀察到。先驗概率與條件概率是表示BNs節點不確定性程度的重要特征,這里我們利用了本體實例的屬性hasPrior Pr和hasCond Pr來分別表示這兩種概率值。例如,S表示故障征兆“潤滑油溫度超限”,F表示“減速箱齒輪故障”,那么P(S=true)=0.7可表示為


貝葉斯網絡概率推理問題分為三類:后驗概率、最大后驗假設(MAP)和最大可能解釋(MPE)[11]。本文選取部分觀測變量組成一個征兆集合,利用Bayes分類器進行工況異常狀態識別,然后采用MPE方式通過概率推理計算出某種故障發生時相關的概率分布。
故障診斷通常需要考慮目標設備在異常工況狀態和正常工況狀態下的運行趨勢,因此正確區分工況正常與異常狀態十分重要。某些情況下,由設備工況狀態可以直接判定故障的發生(如轉子出現斷裂情形),而大部分工況狀態需要利用各種數據采集設備獲取運行數據,再進行數據分析來確定該狀態是否為故障征兆。在OntoDBN本體模型中,異常工況狀態識別實質上是設備工況狀態空間到故障特征空間的本體映射。例如,轉軸不平衡引起的振動是旋轉機械的常見多發故障,一般需要實時監測轉軸的振動頻率以獲取軸振動方向上的頻譜特征,當設備出現異常且進行頻譜分析時,這些振動特征量就表現為故障征兆。異常工況狀態識別主要依靠設備運行狀態類(Condition)、監測特征類(Characterization)、故障征兆類(Symptom)、設備部件類(Component)以及這些類之間的相互關聯關系來完成。
根據先驗知識對工況狀態出現的概率(即先驗概率)進行估計時,若設備工況狀態空間Ωj=(ω1,ω2,…,ωi,…,ωc),其中ωi(i=1,2,…,c)表示狀態空間的一個模式點,那么正常和異常工況狀 態 可 以 分 別 用P(ω1)和P(ω2)表 示,且P(ω1)+P(ω2)=1。再假定x是表示工況狀態的離散隨機變量,結合工況狀態為ωi時x的概率分布函數P(x|ωi)和Bayes公式可以得出:

設{α1,α2,…,αk}表示有限的k種可能判定行為集,風險函數λ(αi|ωj)表示工況狀態為ωj時判定行為αi的風險,那么條件風險定義為

根據Bayes決策規則,異常工況狀態識別問題就是選取合適的異常狀態判定行為αi,使得條件風險最小,即

設工況狀態特征向量x= (x1,x2,…,xd),為簡化問題,我們僅考慮工況狀態特征相互獨立的情形,即針對獨立的二值離散特征量進行分類。由于只考慮正常狀態ω1和異常狀態ω2兩類模式,因此可以采用線性二分分類器[12]來判定工況狀態,其判別函數為

其中,pi和qi分別是設備處于正常狀態ω1與異常狀態ω2時(xi=1)的條件概率值。當g(x)>0時,工況狀態判為ω1;否則判為ω2。
判定目標設備的正常與異常狀態之后,就可以采用MPE推理方式進行故障概率分析,即根據已有證據找出所有可能的假設中后驗概率最大的假設,即

其中,P(H|C,S)表示在給定設備運行狀態C和故障征兆S的條件下,故障假設子集H中故障發生的概率。3.1節給出了故障征兆的判定方法(即工況異常狀態識別),根據貝葉斯定理可知:

則式(5)可簡化為

式(6)中P(H)為H中故障發生的概率,P(C|H)和P(S|H)為H中故障出現時的工況狀態和故障征兆的條件概率。設某種故障f的先驗故障概率為P(f),且f∈ {0,1},那么:


盡管OntoDBN對貝葉斯網絡結構進行了簡化,但上述精確推理過程依然是NP-hard問題[13]。為了降低推理的復雜度,可以在每次推理循環中選擇最有可能發生的故障(即故障信度值最大)加入故障假設子集,并刪除該故障所對應的征兆。當故障征兆集為空時,就認為所有可能的故障都已加入故障假設子集中,此時退出推理循環并獲得最大可能的故障解釋。
為了驗證本文提出的OntoDBN模型,選取某化工企業涼水塔風機機組為診斷對象(圖4),并以減速器振動位移、減速器潤滑油溫度和電機電流作為狀態監測特征量。為了簡化研究過程,不考慮風機的啟停升降速狀態,僅研究設備穩定運行過程中的故障診斷分析。

圖4 涼水塔風機結構與診斷維護測點
首先,借助Protégé本體建模工具[14]和本體描述語言 OWL(web ontology language)建立OntoDBN診斷本體模型,實現OntoDBN診斷本體的主要類、數據屬性、對象屬性以及實例成員。本體結構與實例存儲于關系數據庫中,通過Jena[15]提供的應用編程接口進行訪問。最后,采用貝葉斯網絡開發環境Ge NIe[16]實現故障診斷的概率推理計算。主要的推理過程包括風機故障征兆判定和可能故障的概率計算,分析結果用來指導后續的設備維護決策與實施。
風機的主要部件包括葉片、轉軸、減速器和電機,其中轉軸故障是風機的多發故障。故障征兆的判定過程是在設備工況狀態監測的基礎上,根據專家及現場操作人員經驗給出各類故障發生的主觀信度。我們利用實時監測數據和式(4)所給出的征兆特征判決函數,可以區分出風機運行過程中出現的故障征兆,即某種工況狀態屬于故障征兆的主觀判定。
以風機轉軸工頻振動為例,基頻幅值增速過快一般視為轉軸不平衡或熱彎曲故障的征兆,那么可將實時監測到的轉軸基頻振動幅值作為工況特征量,根據預先設定閾值和二值特征線性分類器來判斷該工況特征量是否屬于故障征兆。例如,某化工企業4號涼水塔風機轉軸的徑向振動出現不斷增長趨勢,需要對設備狀態進行診斷與評估。圖5所示為4號風機基頻幅值增速異常征兆的判定結果。根據最近15次監測到的轉軸基頻幅值變化,計算出工況狀態ωi下幅值x的概率分布函數P(x|ωi),再由式(1)得出條件概率P(ωi|x),最后結合設備狀況和專家經驗劃分出風機正常狀態ω1和異常狀態ω2。由圖5可以看出,新觀測到的證據A應視為基頻幅值增速異常征兆。

圖5 4號風機基頻幅值增速異常征兆的判定結果
診斷對象的異常征兆判定之后,正常工況狀態和故障征兆以先驗概率值的形式與設備故障聯系起來,結合診斷對象常見故障的先驗概率就可以進行故障概率推理計算。表1給出了風機常見故障與工況狀態或征兆之間的部分概率關系。在OntoDBN故障推理過程中,先利用GeNIe建立診斷貝葉斯網絡結構并導入表1中的概率值,然后輸入實時狀態監測數據作為推理證據,根據式(8)~式(10)計算出概率推理結果。除了判斷最大可能發生的故障之外,還可以利用OntoDBN模型進行其他診斷或預測推理。例如某故障發生時,會出現哪些故障征兆以及這些征兆出現的可能性定量分析等。

表1 風機常見故障的先驗概率與條件概率(部分)%
圖6給出了4號風機故障概率推理實例,由于篇幅原因,這里只列出了在設定證據前后“轉子不平衡”與“轉子彎曲”兩種故障的推理結果。圖6a表示在輸入推理證據前各節點的先驗概率和條件概率值,圖6b則表示某次推理過程中輸入證據之后目標節點的概率變化。由圖6b可以看出,在診斷BNs中輸入狀態數據后,“轉子不平衡”故障發生的概率較大(99%)。設備停機大修結果證明,設備狀況與前述診斷分析結論一致,4號風機轉軸由于設備老化及葉片結垢等原因而出現了不平衡量的增大,經過現場動平衡校驗后,設備運轉恢復正常。

圖6 4號風機故障概率計算
為了減小設備維護與故障診斷過程中不確定性因素的影響,本文設計了一種本體驅動的診斷貝葉斯網絡(OntoDBN),用于智能故障診斷應用中的知識表示與故障推理。OntoDBN包括診斷語義知識表示模型和故障診斷概率推理算法,用貝葉斯決策理論和概率精確推理方法對設備工況狀態、故障征兆以及故障成因進行了定量分析。OntoDBN中的知識表示模型與概率推理算法相互關聯且相對獨立,在促進知識共享的同時提高了故障診斷推理效率。故障診斷概率推理過程還集成了專家的主觀診斷經驗,與設備運行狀態證據相結合,共同完成基于概率的嚴格推理過程。某涼水塔風機的故障診斷實例分析表明,基于本體的故障診斷貝葉斯網絡適用性較強,在一定程度上消解了故障診斷過程各種不確定性因素的影響。本文所采用的精確推理算法計算復雜度高,當診斷網絡結構復雜且連接稠密時難以滿足工程應用要求,因此,采用近似推理算法與本體模型結合的方式展開診斷貝葉斯網絡研究是今后需進一步研究的重要問題。
[1]Lu Bin,Durocher D B,Stemper P.Predictive Maintenance Techniques[J].Industry Applications Magazine,IEEE,2009,15(6):52-60.
[2]Laskey K B.Model Uncertainty:Theory and Practical Implications[J].Systems,Man and Cybernetics,Part A:Systems and Humans,1996,26(3):340-348.
[3]Matsokis A,Kiritsis D.An Ontology-based Approach for Product Lifecycle Management[J].Computers in Industry,2010,61(8):787-797.
[4]Garcia-Crespo A,Ruiz-Mezcua B,Lopez-Cuadrado J L,et al.Conceptual Model for Semantic Representation of Industrial Manufacturing Processes[J].Computers in Industry,2010,61(7):595-612.
[5]Yang S C,Patil L,Dutta D.Function Semantic Representation(FSR):a Rule-Based Ontology for Product Functions[J].Journal of Computing and Information Science in Engineering,2010,10(3):031001-8.
[6]雷琦,劉飛,王琦峰.基于語義的協同制造執行平臺集成框架研究[J].中國機械工程,2008,19(17):2050-2054.
Lei Qi,Liu Fei,Wang Qifeng.Semantic-based Integration Framework for Collaborative Manufacturing Execution Platform[J].China Mechanical Engineering,2008,19(17):2050-2054.
[7]Mc Naught K,Chan A.Bayesian Networks in Manufacturing[J].Journal of Manufacturing Technology Management,2011,22(6):734-747.
[8]Agre G.Diagnostic Bayesian Networks[J].Computers and Artificial Intelligence,1996,16(1):1-21.
[9]Gilabert E,Arnaiz A.Intelligent Automation Systems for Predictive Maintenance:a Case Study[J].Robotics and Computer-integrated Manufacturing,2006,22(5/6):543-549.
[10]姜萬錄,劉思遠.多特征信息融合的貝葉斯網絡故障診斷方法研究[J].中國機械工程,2010,21(8):940-945.
Jiang Wanlu,Liu Siyuan.Fault Diagnosis Approach Study of Bayesian Networks Based on Multi-characteristic Information Fusion[J].China Mechanical Engineering,2010,21(8):940-945.
[11]Darwiche A.Bayesian Networks[J].Communications of the ACM,2010,53(12):80-90.
[12]Duda R O,Hart P E,Stork D G.Pattern Classification[M].New York:John Wiley &Sons,2001.
[13]Cooper G F.The Computational Complexity of Probabilistic Inference Using Bayesian Belief Networks[J].Artificial Intelligence,1990,42(2/3):393-405.
[14]Gennari J H,Musen M A,Fergerson R W,et al.The Evolution of Protege:an Environment for Knowledge-based Systems Development[J].International Journal of Human-computer Studies,2003,58(1):89-123.
[15]Carroll J J,Dickinson I,Dollin C.Jena:Implementing the Semantic Web Recommendations[C]//Association for Computing Machinery.Proceedings of the 13th International WWW Conference on Alternate Track Papers and Posters.New York:ACM,2004:74-83.
[16]Decision Systems Laboratory.GeNIe Documentation[EB/OL].Pittsburgh,DSL:University of Pittsburgh,[2012-02-16].http://genie.sis.pitt.edu/wiki/GeNIe_Documentation.