劉達新+裘樂淼+王志平
摘要:認為通過從復雜裝備運行特征大數據中挖掘出故障信息,實現運行故障的智能診斷,對保證復雜裝備的安全和穩定運行具有重要意義。結合復雜裝備運行大數據的特點與機器學習理論,提出了基于運行大數據學習的復雜裝備故障預測診斷方法,實現了復雜裝備運行特征大數據與運行故障的分層關聯,基于大數據分析的復雜裝備運行故障特征提取以及基于模糊反向傳播(BP)神經網絡的復雜裝備運行故障診斷。此外,還將此技術應用到高速電梯的運行監測中,開發了高速電梯急停故障大數據分析與診斷系統,很好地驗證了該方法的有效性。
關鍵詞: 大數據;機器學習;故障診斷;復雜裝備
故障診斷技術是保證復雜裝備安全、穩定運行的重要技術之一。故障診斷技術通過對裝備運行狀態的監測及其相應數據的分析處理,實現對裝備運行故障的預測和診斷,判斷裝備的狀態是否處于異常狀態,或故障狀態、劣化狀態發生的部位或零部件,預測狀態劣化的發展趨勢等,已廣泛應用于大型空分裝備、汽輪機組、航空發動機、高速電梯等復雜裝備的運行監測控制,被列為中國智能裝備產業重點發展的九大關鍵智能基礎共性技術之一。
隨著裝備復雜程度的增加,對于裝備運行的監測往往存在裝備監測點多、監測點的采樣頻率高、數據收集時間長等特點,使得復雜裝備故障診斷系統需要處理的運行數據量呈現爆炸性增長,數百太比特級甚至拍比特級規模的大數據已經屢見不鮮。海量運行數據的產生,意味著復雜裝備故障預測診斷技術迎來了它的大數據時代[1],也對故障診斷技術的發展提出了新的挑戰。由于大數據往往隱含著很多在小數據量時不具備的深度知識和價值,只有通過大數據的智能化分析和挖掘,才能將其價值顯露出來,因此將大數據分析與機器學習技術應用于裝備運行過程的故障預測診斷,通過從復雜裝備運行特征大數據中挖掘出故障信息,實現運行故障的快速診斷,是近年大數據在裝備領域的重要應用之一。
國際上在利用大數據技術進行產品性能監測、故障診斷和提升產品性能方面已經有了較為成功的應用案例。例如:美國GE公司應用2萬臺飛機引擎上的各種傳感器收集飛行數據,精確檢測飛機的運行狀況,甚至預測故障,并及時進行預防性維保,其對于某些型號的引擎能夠提前1個月預測維護需求,預測準確率達到70%;英國Rolls-Royce公司通過對服役于新加坡航空的137 臺飛機發動機使用大數據分析技術,成功降低了燃油消耗;美國特斯拉汽車公司利用大數據技術,采集和分析用戶在駕駛時產生的加速度、剎車、轉彎、電池充電和位置信息,以及用戶駕駛習慣等大量數據,結合市場數據和企業生產、管理數據,進行產品及生產協同創新。
1 大數據與機器學習
狹義的大數據是指不能裝載進計算機內存的數據。因此,對于每臺電腦來說,當數據量增長到不能裝載進內存的時候,此時形成的數據集合便成了大數據。學術界對于大數據進行了更為科學的定義[2]:大數據是指無法在可接受的時間內用傳統軟硬件技術和工具對其進行感知、捕捉、管理、處理和服務的數據集合。針對大數據的特點,專家學者們相繼提出了3V、4V甚至5V模型來進行描述,包括:Volume(體積大)、Velocity(速度高)、Variety(多樣性)、Value(價值)、Veracity(真實性)等。
大數據分析主要分為簡單分析和智能化復雜分析兩大類[3]。簡單分析主要采用類似于傳統數據庫聯機分析處理(OLAP)的技術和方法,用結構化查詢語言(SQL)完成各種常規的查詢統計分析;而大數據的深度知識和價值僅通過簡單分析是難以發現的,通常需要使用基于機器學習和數據挖掘的智能化復雜分析技術才能實現。機器學習作為人工智能的核心,是獲取大數據所隱含深度知識的關鍵技術,而且處理的數據規模越大,機器學習模型的效果一般來說會越好[4]。
但是,由于大數據的海量、多維、多樣、變化快等特性,使得小數據環境下基于內存處理的傳統機器學習算法基本已不再適用于大數據下的應用問題。如何適應大數據處理的需求,這對機器學習的研究提出了新的挑戰。大數據環境下的機器學習算法研究主要是從以下6個方面開展的[5]:
(1)大數據分治策略與抽樣。數據分治與并行處理策略是大數據處理的基本策略,如何學習大數據的分布知識,將其用于優化負載均衡是一個亟待解決的問題。同時,需要依據一定的性能標準對樣本空間進行篩選,剔除冗余和噪音數據,在不降低甚至提高某方面性能的基礎上,最大限度地降低計算時間和空間的消耗。
(2)大數據特征選擇。大數據包含的屬性數和記錄數巨大,導致處理算法的執行效率低下。如何采用降維和特征選擇技術以降低大數據處理難度,是大數據特征選擇技術迫切需要解決的問題。
(3)大數據分類。針對不同分類算法研究并行或改進策略成為大數據環境下分類學習算法研究的主要方向,諸如支持向量機分類、決策樹分類、神經網絡分類等方法。近些年,在人工神經網絡基礎上發展起來的深度學習技術[6],逐漸展現出其在處理大數據方面的獨特優勢。由于增加了隱層單元,多層神經網絡比感知機具有更靈活且更豐富的表達力,可以用于建立更復雜的數學模型,能夠深刻揭示海量數據里所隱含的復雜而豐富的信息,從而做出更為精準的預測。
(4)大數據聚類。聚類學習是最早被用于模式識別及數據挖掘任務的方法之一,并被用來研究各種應用中的大數據庫。但是經典聚類算法在大數據環境下面臨著數據量大、數據體積大、數據維度高等諸多挑戰,改進現有聚類算法,提出新的聚類算法是大數據聚類研究急需解決的關鍵問題。
(5)大數據關聯分析。大數據的關聯分析主要有并行和增量兩種途徑。并行關聯分析算法通過將產生候選項集的過程并行化來提高運行效率,具有良好的加速比和伸縮性;增量方面則主要體現在序列模式挖掘上。
(6)大數據并行算法。將傳統機器學習算法運用到大數據環境中的一個典型策略,便是對現有的學習算法并行化。目前大數據并行算法的研究已在一定范圍內取得了一些進展,能實現對一定量級大數據的分析處理,如何建立更為高效的并行策略,實現大數據的高效處理仍將是當今的研究熱點。
大數據環境下的機器學習,既不是單純的機器學習,也不是單純的大數據處理技術所能解決的問題,而是一個同時涉及機器學習和大數據處理的交叉性研究課題。
2 基于大數據學習的故障診斷方法
復雜裝備運行過程中產生的海量特征數據蘊含了大量的故障信息,如何從復雜裝備運行特征大數據中挖掘出故障信息,實現運行故障的快速診斷,對提高復雜裝備的安全性,實現穩定運行具有重要意義。基于大數據分析的故障診斷可以在收集到復雜裝備運行特征數據的基礎上,應用聚類、決策樹等機器學習算法對大數據進行知識挖掘,獲得與故障有關的診斷規則,從而實現對復雜裝備的故障預測和診斷。
目前,復雜裝備故障診斷方法主要分為3類:基于數學模型的故障診斷、基于數字信號處理的故障診斷、基于知識的故障診斷[7]。基于數學模型的故障診斷方法簡單直觀且易于理解,但需要深入分析復雜裝備的結構、運行原理,對內部結構和運行原理過于復雜的裝備難以建立數學模型;基于信號處理的診斷方法不需要構建數學模型,容易實現,但只在復雜裝備有明顯的外部特征時才有效,不適用于那些沒有明顯外部特征的故障;基于知識的故障診斷具有良好的診斷效果和廣泛的適用性,對復雜裝備的智能化要求較高,是目前實現復雜裝備智能故障診斷與健康維護的主要研究方向。
結合復雜裝備運行大數據的特點與機器學習理論,我們提出了基于運行大數據學習的復雜裝備故障預測診斷方法,包括復雜裝備運行特征大數據與運行故障的分層關聯,基于大數據分析的復雜裝備運行故障特征提取以及基于模糊反向傳播(BP)神經網絡的復雜裝備運行故障診斷3個方面。
(1)復雜裝備運行特征大數據與運行故障的分層關聯。
通過詳細分析復雜裝備運行故障出現的原因,建立運行故障原因的層次結構模型,分析和采集復雜裝備運行特征大數據,建立復雜裝備運行特征參數與運行故障原因的關聯映射關系。
(2)基于大數據分析的復雜裝備運行故障特征提取。
針對復雜裝備運行特征大數據有較多噪聲的問題,提出基于小波模極大值的復雜裝備信號降噪方法,對特征大數據進行處理,提高復雜裝備運行數據的信噪比。針對復雜裝備運行特征大數據維數多、規模大等問題,提出基于粗糙集屬性約簡的運行故障特征提取方法,篩選運行特征大數據中的冗余屬性,獲取與復雜裝備運行故障相關的特征參數。
(3)基于模糊BP神經網絡的復雜裝備運行故障診斷。
基于復雜裝備運行故障診斷的模糊BP神經網絡構建,基于神經網絡的復雜裝備運行故障診斷方法和診斷過程的研究,建立復雜裝備運行故障診斷模型,實現復雜裝備運行特征大數據分析與基于知識的運行故障智能診斷。
3 典型應用案例
以高速電梯為研究對象,通過將研究成果應用到高速電梯急停故障的數據分析和智能診斷,結合高速電梯急停故障大數據分析與診斷系統的開發,驗證所提方法的有效性。如圖1,診斷系統通過收集高速電梯運行特征大數據,建立如圖2所示的運行特征參數與急停原因的分層關聯映射。采用基于小波模極大值的高速電梯運行信號降噪算法去除運行特征大數據中的冗余信息,采用基于屬性約簡的高速電梯故障特征提取方法對運行大數據進行特征提取,獲取高速電梯急停故障的特征參數,基于模糊BP神經網絡構建了高速電梯急停故障診斷模型,如圖3。
如圖4所示,系統在江蘇康力電梯企業額定速度7 m/s 的KWG型高速電梯急停故障診斷中得到了應用驗證,可在系統中查看KWG型高速電梯所有與急停故障相關的信息,有助于維修人員根據診斷結果對故障進行快速修復。
4 結束語
目前,中國在將大數據、人工智能等技術應用于復雜裝備故障診斷方面還處于理論研究階段,在實際中主要以基于數學模型和基于信號處理的故障診斷方法為主。由于復雜裝備的結構復雜,運行工況惡劣多變,難以建立精確的解析模型,運行信號也不能直觀地反映裝備運行故障的情況,因此傳統的基于模型和信號處理的故障診斷方法已經不能適用于復雜裝備的故障診斷。而隨著物聯網技術的發展,越來越多的裝備制造商都會通過傳感器收集裝備的運行數據,迅猛增長的裝備運行特征數據對于分析其故障具有重要價值。因此,我們結合復雜裝備運行大數據的特點,提出了基于運行大數據學習的復雜裝備故障預測診斷方法,實現了復雜裝備運行特征大數據與運行故障的分層關聯,基于大數據分析的復雜裝備運行故障特征提取以及基于模糊BP神經網絡的復雜裝備運行故障診斷,應用于高速電梯故障預測與診斷,有效提高了復雜裝備故障診斷的效率和準確性,取得了很好的應用效果。
參考文獻
[1] GRAHAM R D, GOLDSTON D, DOCTOROW C, et al. Big Data: Science in the Petabyte Era[J]. Nature, 2008, 455(7209):8-9. DOI:10.1038/455001a
[2] 李國杰, 程學旗. 大數據研究:未來科技及經濟社會發展的重大戰略領域——大數據的研究現狀與科學思考[J]. 中國科學院院刊, 2012, 27(6):647-657
[3] 黃宜華. 大數據機器學習系統研究進展[J]. 大數據, 2015, 1(1): 28-47
[4] WANG Y, ZHAO X, SUN Z, et al. Peacock: Learning Long-Tail Topic Features for Industrial Applications[J]. Acm Transactions on Intelligent Systems & Technology, 2015, 6(4):1-23. DOI:10.1145/2700497
[5] 何清, 李寧, 羅文娟, 等. 大數據下的機器學習算法綜述[J]. 模式識別與人工智能, 2014, 27(4): 327-336. DOI:10.3969/j.issn.1003-6059.2014.04.007
[6] HINTON G E, SALAKHUTDINOV R R. Reducing the Dimensionality of Data with Neural Networks[J]. Science,2006,313(5786):504-507. DOI:10.1126/science.1127647
[7] 王宏力, 侯青劍. 故障診斷方法現狀與展望[J]. 傳感器與微系統, 2008, 27(5):1-4. DOI:10.3969/j.issn.1000-9787.2008.05.001