胡 彬,馬 越,張 健,王浩宇
(國能大渡河檢修安裝有限公司,四川 成都 610000)
在互聯網及移動互聯網技術快速發展的背景下,智能城市、智能醫療、智能社區和智能企業都在全力以赴。水電企業的智慧檢修、狀態檢修也開始了不斷的研究和探索,特別是以國家能源集團大渡河公司為代表的大型水電中央企業,從2017年開始已經大力發展和探索智慧企業和智慧檢修建設。
“基于檢修要素感知的檢修方案智能生成模型研究”課題的提出,即考慮到在日常工作中遇到的實際問題,如檢修資源不足、專家力量緊張等。隨著越來越多信息系統的部署,在制定檢修方案時,所需要權衡考量的因素也越來越多,此時,如果能將制定檢修方案的工作交由大數據分析工具來輔助完成,將顯著提高人員效率,降低成本。
本文的設計是依托于歷年的檢修數據,以及水電站諸多信息管理系統和生產管理系統中,每天生成的大量的設備運行信息、檢修維護信息。
因此在本文中,將借助NLP自然語言處理技術、深度神經網絡算法對已有的大量歷年檢修數據進行收集、歸納、整理,形成與設備運行狀態、檢修狀態相關聯的檢修要素,納入到知識庫中,再通過大數據機器學習算法,對轉化的檢修信息數據進行關聯匹配,將歷史檢修方案與檢修需求建立關聯模型,實現檢修方案智能生成模型,模型如圖1所示。

圖1 檢修方案智能生成模型
本文中嘗試將歷史檢修信息、現場檢修需求、檢修知識庫利用NLP自然語言處理算法及大數據機器學習算法進行歸納、建模,給出檢修方案制定建議,并根據檢修完成后的評價功能,對前述功能進行反饋,形成迭代優化。
首先將其用于對沒有納入模型學習的設備歷史故障信息進行驗證,將模型的檢修方案計算結果與歷史檢修工單記錄進行比對。通過驗證后,在檢修工作開展的同時,用模型根據設備故障信息和運行狀態進行檢修方案推薦,形成檢修方案參考建議。模型具備以下技術要求。
檢修詞條的自然語言處理技術,對檢修需求、檢修要素進行處理識別,包括圖表類、文本類的信息,轉化為計算機能夠識別和查詢的結構化知識。
檢修知識庫自動匹配識別算法,依托大數據機器學習算法,包括模糊聚類以及基于深度學習的KBQA(Knowledge Base Question Answering)技術,快速為其進行畫像,并匹配已有檢修知識庫中對應的檢修詞條,生成初步的檢修建議方案。
檢修方案優化算法,系統能根據不同的檢修任務關注維度,生成有差異性的檢修優化方案,比如安全優先、經濟性優先、工期優先等。
檢修績效指標自動評價體系,系統能夠根據檢修目標,自動為檢修任務的完成進行評判。
構建模型所需要的數據來源于歷年生產管理數據,大部分工作數據每月形成電子表格匯總得到,主要是人身風險預控活動、檢修工序卡活動數據、風險預控活動數據、項目管理數據。各個數據源來源不同,人身風險預控活動將采集檢修工作的人員姓名、工種、消耗性材料、工器具、工期、防范措施等信息,檢修工序卡將采集工藝標準、檢修質量等信息,風險預控活動將采集項目風險、風險等級預估等信息,項目管理數據將采集人員、工種工期、檢修成本等信息,初步建立智慧檢修知識庫。
檢修需求畫像:檢修需求畫像的主要工作包括短語挖掘、學習預測和關系分析3部分。
通過實現短語挖掘、關系分析和學習預測的功能,將對新生成的檢修需求自動匹配識別算法,系統將根據檢修需求中關鍵字如“瀑布溝”“3號水輪發電機組”“推力軸承”“外循環冷卻器”“管路”“滲漏”,快速為檢修需求進行畫像,并匹配已有檢修知識庫中對應的檢修詞條。
在本文中,短語挖掘方法將采用基于有監督學習的短語挖掘算法實現(圖2)。

圖2 基于有監督學習的檢修需求短語挖掘流程
如圖2所示,短語挖掘算法主要通過計算候選短語的統計指標特征來挖掘,其中:
(1)學習預測:在深度神經網絡模型中,“發電機組”、“推力軸承”、“外循環冷卻器”、“管路”、“滲漏”等詞或字符將被表示為一個低維稠密空間中的向量。基于這些向量表示,可使用典型的網絡結構(如卷積神經網絡CNN、循環神經網絡RNN)抽取字詞之間的組合特征及關聯關系。與傳統方法相比,深度神經網絡能捕捉到更多隱性的語義特征,能取得更優異的性能。
(2)關系分析,檢修要素尋優:系統能根據不同的檢修任務關注維度,包括人員姓名、工種、消耗性材料、工器具、工期、防范措施、工藝標準、檢修質量、風險因素、風險等級10個維度,通過粒子群PSO尋優算法,生成有差異性的檢修優化方案,比如安全優先、經濟性優先、工期優先等可以作為檢修方案的優先項,自動生成與之對應的檢修優化方案。
(3)檢修績效指標自動評價:系統為檢修任務的完成進行評判,比如量化目標檢修工期與實際檢修工期差異、人工消耗差異、工器具使用差異、消耗性材料差異、風險因素差異,并作為反饋,指導后續同類型檢修任務優化的生成。
檢修要素與檢修需求匹配關聯的構建,是語義識別、自然語言處理與數據挖掘技術的綜合應用,核心在于建立起自然語言形式的需求與計算機知識之間的映射關系。在本課題方案中,將把建立映射關系的過程分為兩個子過程,即實體鏈接和屬性理解。其中,實體鏈接是指識別檢修需求所提及的內容,并將其鏈接到構建的數據庫中。屬性理解則是指識別檢修需求提及內容,其對應關聯的檢修詞條和檢修要素,這其中便要應用到模糊聚類算法以及基于深度學習的KBQA技術進行匹配計算。本文方案中,知識應用部分的工作流程如圖3所示。

圖3 檢修需求與檢修要素匹配以及檢修方案智能生成
以某容量63 MW混流式機組A修為例,通過其他類似機組檢修歷史數據建立模型,模型包含人員姓名、工種、成本、工期、檢修質量、風險等因素,通過粒子群PSO尋優算法繪制的工期、質量、成本兩兩之間的關系圖,擬合了相應的函數。

圖4 項目工期——質量——成本關系曲線
然后以最高進度要求、最低預算成本、質量達標要求為約束條件,以工期——質量——成本最優化為目標函數,優化生成檢修方案,其中包含檢修順序、持續工期優化調整等。
本文提出,在應用大數據機器學習算法、自然語言處理技術、深度神經網絡算法等先進技術的同時,也充分考慮到公司日常工作中遇到的實際問題與技術需求,如檢修資源不足、專家力量緊張,檢修方案的確定與實施存在滯后;此外,隨著越來越多信息系統的部署,在制定檢修方案時,所需要權衡考量的因素也越來越多。通過本課題方案的實現,把制定檢修方案的工作交由大數據分析工具來輔助完成,此舉將顯著提高人員效率,降低成本,切實推動數字化轉型。
本文依托NLP自然語言處理技術對檢修需求、檢修要素進行處理,將圖表類、文本類的信息,以及已有的各類檢修數據,轉化為計算機能夠識別和查詢的結構化知識。而利用大數據機器學習算法,包括模糊聚類算法以及基于深度學習的KBQA技術,對轉化的檢修信息數據進行關聯匹配,從而建立檢修方案智能生成模型,形成檢修建議。除此之外,系統還通過粒子群PSO尋優算法,根據不同的檢修任務關注維度,完成檢修方案自動尋優。在檢修任務完成后,系統還可根據目標檢修工期與實際檢修工期差異、人工消耗差異、工器具使用差異、消耗性材料差異、風險因素差異作為考量維度,對檢修任務進行評價,生成反饋并指導后續同類型的檢修任務的優化生成。