曹 潔,祝令凱,張元正,李洪海,劉守剛
(1.國家電投集團河南電力有限公司沁陽發電分公司,河南 焦作 454150;2.國網山東省電力公司電力科學研究院,山東 濟南 250003;3.山東魯能軟件技術有限公司,山東 濟南 250002;)
近年來,隨著GPU、云計算等技術的快速發展,計算機計算速度與計算能力得到大幅提高,有力推動了工業大數據技術和神經網絡算法的發展應用[1-3],為推動國家新一代人工智能技術的發展奠定基礎。人工智能技術在商業互聯網行業應用廣泛而且技術成熟,工業行業由于積累了龐大數據量,為響應國家新一代人工智能技術的發展,轉變工業生產制造模式,我國工業正在積極探尋人工智能技術與大數據在工業設備智能診斷、預警以及工業生產指標尋優等方向的運用。其中,設備智能診斷技術在工業領域得到很大重視,生產設備的安全運行關系著企業的安全責任和經濟效益。
設備故障往往是宏觀的、系統的,而設備故障原因卻是部件級、材料級的。近幾年來在設備故障診斷方面的技術層出不窮,如基于故障樹、基于規則、基于案例推理、基于神經網絡、基于粗糙集理論、基于Petri 網絡等,由于上述理論技術均脫離業務邏輯,難以實現行業通用,尤其面對復雜的設備系統時,現有算法在準確性和穩定性方面存在諸多問題,因此,大型設備的故障原因查找還需要依賴專家進行問題推導和定位。
基于業務邏輯和推薦算法結合的思想,通過修正關聯分析值,構造設備故障診斷邏輯,進行設備故障相似因素的推薦。以某核電站冷卻劑泵為例,進行實例分析,分析結果表明該算法在故障定位方面具有較高準確性。
推薦算法主要分為3 類:經典推薦算法、特定推薦算法和混合推薦算法。其中,經典推薦算法包含協同過濾推薦算法和基于內容的推薦算法[4-6],設備故障診斷邏輯主要采用經典推薦算法。在工業生產中,基于內容的相關設備故障推薦算法需要故障設備大量歷史數據作為挖掘對象,由于生產實踐過程中積累的正樣本與負樣本數據往往是不平衡的,單個設備的故障數據量少,在實際使用故障推薦算法時優先使用基于協同過濾的故障相關設備推薦算法。
協同過濾推薦算法的基本假設是:為用戶推薦感興趣的內容,找到與該用戶偏好相似的其他用戶,將他們感興趣的內容推薦給該用戶。文獻[7]將協同過濾方法分為基于記憶方法和基于模型方法。
基于記憶方法采用所有的設備歷史數據或1 個樣本集來生成預測。每個設備都有1 個與其有著關聯性較強的設備,被稱為鄰居,通過識別設備的鄰居狀態,可以預測設備在該狀態下的發展趨勢。
基于模型方法采用統計、機器學習和數據挖掘等方法,根據設備歷史數據構造狀態模型,并據此進行推薦,適合樣本量較大的場景。
協同過濾推薦算法的核心是計算目標設備與評分矩陣中各設備的相似度,然后將各個相似度進行排序,較高相似度的設備作為目標設備的近鄰集。計算關聯度時,僅從算法方面解決或僅從業務邏輯方面解決都難免顧此失彼,結合相關系數計算的關聯度與業務邏輯分析的關聯度,使用加權平均的方法將兩種關聯度計算結果結合,得到最終的關聯度,可彌補業務和算法在關聯分析中的不足。
使用相似度指標計算方法如相關系數、互信息以及相關距離公式等[8],依托歷史大數據計算參數兩兩之間的關聯度,進一步計算關聯設備各指標之間關聯度的均值,得到設備之間的關聯度。取Pearson 相關系數作為相似度度量,其計算公式為

式中:Iuv為設備u 與設備v 共同評分的項目集合;Ru,i與Rv,i分別為設備u和設備v對項目i的評分;分別為設備u 和v 設備對已評價項目的評分均值。
基于算法計算出的設備關聯度需要由具體業務邏輯支撐和修正。以核反應堆冷卻劑泵業務邏輯為例,其邏輯關聯情況如圖1 所示。主泵設置的冷水入口流量直接影響主泵設置的冷水出口流量,而主泵設置的冷水流量差值也間接影響了設置的冷水溫差,從而影響對溫度敏感的主泵定子線圈以及主泵振動等相關部件與參數。實際分析中,需要業務人員根據業務邏輯中各相關因素相關強度賦予相應關聯度值。

圖1 冷卻劑泵冷水流量與主泵狀態關聯示例
通過業務專家對設備關聯性分析,并賦予相應的關聯度值D(u,v),結合式(1),進行加權,修正算法相似度計算的不足,其修正公式為

式中:σ 為調節參數,取值范圍為(0,1),可通過歷史數據交叉驗證,當專家推理結果可靠性較大時,增大σ 值,反之減小。
計算出設備之間的關聯度之后,還應挖掘設備之間歷史故障的頻繁項。以故障類型作為分組依據,找出導致設備故障發生的指標作為頻繁項集,計算相關概率作為該頻繁項集對于該故障發生的支持度。以主泵振動和設備冷卻水系統熱交換器異常為例,各頻繁項支持度值如表1 所示。
通過關聯度值找到異常設備的鄰近設備,由關聯度值和支持度的乘積得到各設備的推薦評分矩陣,取最佳推薦評分對應的設備作為推薦結果。
根據上述理論,提出協同過濾推薦算法與業務邏輯相結合的設備故障診斷方法,該方法以協同過濾推薦算法為核心,結合業務邏輯修正關聯度分析值,實現業務和算法相結合,提高故障診斷的效率和準確性。協同過濾推薦打分流程如圖2 所示。

表1 頻繁項集支持度

圖2 協同過濾推薦打分流程
通過上述流程,關聯分析找到異常設備相關的近鄰設備,并結合頻繁項集,獲得鄰居設備推薦評分。當頻繁項集的支持度為0,則支持度不參與推薦評分計算,取最佳推薦評分作為設備故障診斷的最終結果。當某個故障設備的歷史數據較少,無法挖掘出故障頻繁項時,系統基于設備關聯度值,找出與故障設備關聯度高的相似設備,即同類型設備?;趨f同過濾的故障相關設備推薦邏輯如圖3 所示。
以冷卻劑泵為例,使用協同過濾推薦算法與業務邏輯相結合的設備故障推薦方法進行故障診斷推進分析,并通過準確率ra和推薦率rr進行指標評價。

圖3 基于協同過濾的故障相關設備推薦
準確率越高表明冷卻劑泵故障診斷推薦系統的推薦質量越高。準確率計算公式為

式中:N 為故障診斷推薦系統正確預測的故障頻繁項集數;M 為頻繁項集總數。
項目推薦率rr主要用于衡量同類型設備的查找效率,在相同準確率下,項目推薦率的數值越大說明算法的推薦效率越高。項目推薦率在項目推薦時,設一個故障設備的故障頻繁項目集為W={w1,w2,…,wP},P 表示故障頻繁項目集合的數量,wi(i=1,…,Q)為待推薦的故障頻繁項目集,Q 為待推薦的故障頻繁項目集數量,由于該故障設備同類型設備中沒有發現關于wi的頻繁項目集,而導致wi無法被推薦,故不能被推薦的項目總數為Q(Q≤P),則稱比值為關于該故障設備的推薦率。
考慮到反應堆冷卻劑泵涉及核安全,因此核電站所使用的冷卻劑泵質量要求高,故在收集數據進行試驗時,考慮到算法對數據量的需求,選取的反應堆冷卻劑泵歷史數據集來自同類型的設備數據,使其盡可能反映大數據規律。選取數據集中75%的數據作為訓練樣本,對其采用業務邏輯與算法結合的方式進行挖掘以生產推薦的關聯度,其余25%的數據集作為測試集進行測試,與只使用業務邏輯和只使用算法挖掘關聯度推薦相比較,試驗結果如圖4和圖5 所示。
由此可知,隨著同類型設備樣本的數據逐漸增多,協同過濾推薦算法與業務邏輯相結合的故障設備診斷系統的準確率相比于只使用業務邏輯或只使用協同過濾推薦算法的故障推薦系統要高得多。而且基于業務邏輯與算法結合的故障設備診斷系統相應的推薦率隨著樣本的數量增多相比其他兩種推薦系統也更有優勢。

圖4 不同分析方法對應的設備故障診斷準確率

圖5 不同分析方法對應的設備故障診斷推薦率
采用基于協同過濾的故障推薦方法,通過引入業務邏輯,將專家經驗和算法相結合,改進了傳統協同過濾算法關聯度計算的方法,在樣本量充足的條件下,該方法表現出了較高的推薦精度,可為生產過程中的設備故障診斷提供理論參考。