崔策,賀石中,李秋秋,康鑫碩
(廣州機械科學研究院有限公司設備潤滑與檢測研究所, 廣東 廣州 510700)
油液監測技術是通過潤滑劑的性能變化、污染狀況及油中攜帶的磨損顆粒等信息,并結合工程師對現場工況的了解,綜合評價設備運行狀態的監測技術[1]。該技術不僅對潛在故障、避免災難性損壞導致的設備停機停產狀況的預報具有及時性,同時減少了設備不必要的維修時間,增加隱性產值和效益[2]。神經網絡在數據分類及回歸等方面已有廣泛應用,其特點主要包括;①充分逼近并求解復雜的非線性問題;②自適應特征提取及學習能力;③具有一定容錯性和魯棒性;④適用于處理多維數學問題。
本文首先通過主成分分析進行數據降維,后將降維后的數據集訓練BP神經網絡,在關聯專家知識后,結合模糊綜合評價理論,對數據集進行分類,建立PCA-BP神經網絡分類模型。結果表明,基于PCA-BP神經網絡的油液監測評價模型的準確率較高,相比人工識別分類,消除了數據模糊性,且效率明顯提升。

素等共12個項目,其中黏度是表征潤滑劑的油膜強度的主要指標;水分、元素Si及Al通常來源于外部污染;酸值主要表征潤滑油的氧化程度及添加劑消耗程度;添加劑元素Ca、Zn及P是油中極壓抗磨添加劑的主要成分,如烷基水楊酸鈣、 二烷基二硫代磷酸鋅(ZDDP)等;金屬元素Fe、Cu、Cr、Sn主要來源于系統中的摩擦副材料,如齒輪、軸承材料及液壓系統中的鍍層等。

表1 測試樣本集
潤滑狀態評價集合是檢測數據集及專家知識的綜合內容,其內容主要依據診斷人員的專家經驗,監測數據的狀態,部分項目的評價指標參考石化行業標準SH/T 0467,如40 ℃運動黏度值的變化率超出10%時,說明油質明顯氧化變質,需要換油;水分超過0.1%則可能引起油品乳化等,表2列舉了評價結論集U={u1、u2、u3、u4}及其特征矢量。

表2 評價集及特征矢量
圖1是協方差矩陣的特征值累計曲線,為了消除指標之間的量綱影響,本文先對原數據進行歸一化處理,不僅能加快梯度下降求最優解的速度,同時也降低了奇異樣本對誤差梯度無法收斂的影響[4]。由圖1可知,前8個成分的累計特征值貢獻率達到90%,因此本文選取8個特征作為原數據的主成分,圖2列舉了部分主成分特征向量。

圖1 主成分特征值累計貢獻率

圖2 累計貢獻率90%的主成分矩陣
BP神經網絡是一種多層前饋神經網絡,其主要過程包括數據前向傳播及誤差反向傳播,是目前應用最廣泛的神經網絡之一[5-6]。

圖3 神經元模型

圖4 最佳迭代次數及均方誤差
由圖4可知,在誤差梯度迭代至316次時,訓練誤差已然達到目標誤差,此時為防止過擬合,網絡停止訓練,模型已達到最優。ROC曲線是一種常見的分類器模型評估方法,其原理是將單一樣本類別分類看成二分類問題,即對于類別yj,xm本屬于該類別即為正樣本,若不屬于即為負樣本。圖5表示ROC曲線圖中4個頂點分別表示的含義。

圖5 ROC曲線中坐標頂點的含義
對于優質模型,單一類別的ROC曲線應盡量靠近(0,1)點,ROC曲線常用于解決由于樣本不均衡導致訓練模型對單一類別敏感的評價問題。
對比圖4結果發現,采用PCA-BP的各類別ROC曲線ROC值較BP平均ROC值更高,說明模型對分類樣本集合的識別率更高,表明模型更優,見圖6。

圖6 BP及PCA-BP模型ROC曲線
本文采用BP神經網絡建立油液監測評價模型,并首先對樣本集合進行PCA降維,選取成分貢獻率90%的8個維度訓練神經網絡,并通過ROC曲線分別評價了4分類的模型識別率,通過對比發現,相比未降維樣本訓練的BP神經網絡,采用PCA-BP神經網絡的識別結果較高,且能夠在一定程度消除人為評估的模糊性及主觀性。由于樣本數據較少,且維數較多,因此采用主成分分析對數據集進行降維,減少了訓練集中存在相關冗余的屬性,提升了神經網絡的計算效率。考慮數據集合的評價內容可擴展性,后期也可通過擴充樣本數量或串聯其他機器學習算法進一步增加模型的魯棒性。