李玉吉,曹旭輝,王江宏,趙 欣
(陜西國防工業職業技術學院,陜西 西安 710300)
煤炭是我國當前較為重要的資源之一[1],能夠順利進行煤礦生產,是現階段社會中所要研究的關鍵方向[2]。順利運行的煤礦汽車機械設備能夠使為煤炭生產提供重要保障,并且是煤炭企業的核心技術[3]。在煤炭生產環節,生產環境較為惡劣[4],煤礦汽車機械設備的安全性能也時常無法保障,因此,通過有效方式保障煤礦汽車機械設備的順利運行[5-6],能夠順利提升煤炭生產的質量。許多學者對檢測故障問題進行研究,如徐青青等[7]研究診斷煤礦機械軸承故障方法,劉永亮[8]研究診斷煤礦機械齒輪箱故障方法,但當故障發生率較高時,依然存在泛化錯誤等問題,并且隨著故障的增加還會發生檢測精度降低等事件。低秩鑒別投影算法能夠有效判別結構,還能有效進行泛化,采用低秩鑒別投影算法,能夠有效提取故障特征[9]。神經網絡方法能夠基于人腦的思維想法,診斷噪聲較強等存在問題的信息[10-11]。因此本文設計基于機器學習算法的煤礦汽車機械設備故障診斷模型,通過低秩鑒別投影算法提取故障特征,再根據特征,采用ART神經網絡學習算法進行故障診斷。
采用基于低秩鑒別投影算法,提取煤礦汽車機械設備故障特征,該算法判別結構描述功能較強,并且還擁有全局資源描述功能,可以改善新樣本的提取速度[12],獲取明顯的投影矩陣。
1.1.1 低秩鑒別投影算法
該算法的主要過程是:首先獲取低秩表示模型的系數矩陣L,并將其劃分為噪聲、類內、類間,并使類間與類內散度分別保持夠大以及夠小,之后賦予經線性投影資源恒定的低秩結構,并維持較強的數據低維空間聚類能力[13]。通過L表示系數矩陣,由式(1)描述低秩表示模型:
(1)
式中,λ>0;E為噪聲;E2,1為l2,1范數,其定義了噪聲的規范。

(2)

若低秩矩陣經式(3)變化后未發生改變:
y=PT
(3)
式中,P為投影矩陣。
yi,j的計算公式為:
(4)
(5)

同時,依據式(6)表示類間散度:
(6)

為達到資源劃分合理,同時投影后噪聲保持最低,所以需要最小化PTei,j的范數,計算公式為:
(7)

通過式(8)判斷最優投影的過程:
(8)
式中,類內與噪聲散度被r所維持。

1.1.2 低秩鑒別投影算法步驟
(1)以數據集X為基礎,定義其為c類,求出最優相似矩陣L,對L的獲取采用非精確增廣拉格朗日乘子法。

ART神經網絡是由兩層神經元構成,分別是比較層與識別層,其通過識別層中的一個單一神經元進行類別判決。并且能夠在線學習,自適應性較好。通過什么方式解決逐步削弱神經網絡的學習率和鄰域,對于學習的聚類精度和收斂速度非常重要,因此通過墨西哥草帽函數改進ART神經網絡學習算法。通過逐漸削弱冪函數,可以提升收斂效果,提供較好的聚類條件,因此,通過式(9)削弱學習速率η:
(9)
式中,a1通常值為0.05。
鄰域函數通過墨西哥草帽函數描述,在鄰域中,獲勝神經元和內神經元i的間距與側反饋的強度存在關系,具體為:
(10)
式中,rij為競爭層神經元的間距;δ(t)為鄰域的可用水平方向的長度。rij的計算公式為:
rij=‖wi-wj‖
(11)
式中,wi和wj為關聯競爭性神經元的權值,并通過冪函數逐步削弱,具體為:
(12)
式中,a2通常取0.5。因此得出調整權值方式為:
(13)
經迭代后,計算過程趨弱了鄰域區域外劃分故障的作用,提升了鄰域內劃分類的作用,并通過非線性函數,提升收斂效果。由式(14)、式(15)計算神經網絡識別層的發送:
(14)
(15)
式中,ξ為神經網絡的門限值,在開始過程中通常取值0.6,ξ∈[0,1],而操作過程中與操作完成時期取值0.8,通過在0~1區域內逐次0.05添加ξ的值,以改善診斷效果,研究分類程度,使ξ每個周期的值都能被監測到,最終獲取矢量輸出。
(1)學習階段1。①獲取輸入最優投影矩陣的列向量;②開始運行ART網絡權值,向其中導入最優投影矩陣的列向量;③與競爭層相關聯的神經元,在獲取某一類樣本時被啟動,之后樣本輸出值高于其他所有值,各類競爭神經元與神經元的間隔由歐氏距離描述;④估量鄰域函數值和調整權系數;⑤逐步削弱學習率和鄰域水平方向的長度;⑥循環操作步驟③,一直到總體樣本都經過操作;⑦迭代次數增加,當迭代次數大于最大迭代次數情況下完成。
(2)學習階段2。循環操作步驟②—⑥,T2=200,η0=0.04,δ0=1,ξ=0.8,逐步削弱學習率和鄰域水平方向的長度,向所選樣本添加網絡,選取另一組最優投影矩陣的列向量提供網絡輸入,并折返,在樣本平穩地與興奮神經元鏈接時結束。T=t+1,在t>T2情況下完成操作。將神經元的相關權系數發送并保存,即完成ART神經網絡的操作過程,最終實現煤礦汽車機械設備故障診斷。
將本文模型應用于某煤礦企業中,分析該企業煤礦汽車設備的故障發生情況。并選取文獻[7]一種煤礦汽車機械軸承故障診斷模型、文獻[8] 煤礦汽車機械齒輪箱故障診斷模型作為本文模型的對比模型,通過以下實驗驗證故障診斷效果。隨機選取25個故障進行分析,分析不同診斷模型的故障識別能力,分析結果如圖1所示。根據圖1可知,隨著故障樣本數量的提升,3種模型的故障識別能力逐漸下降,文獻[7]模型的故障識別能力始終保持最低,并且隨著故障數量增加識別率迅速下降,而文獻[8]模型的故障識別率要高于文獻[7]模型,但依然低于本文模型,本文模型在故障數量增加時,故障識別率保持緩慢下降的形式,從最高96%逐漸降低至87%,并且一直高于其他2種模型,本文模型的故障識別效果較好。

圖1 故障識別能力Fig.1 Fault recognition capability
對故障診斷模型進行分析,選取所存在的10個故障,分析3種模型故障診斷的泛化性能,分析結果如圖2所示。根據圖2可知,隨著故障的提升,不同模型設備故障診斷的泛化錯誤逐漸較高,文獻[7]模型的泛化錯誤最高要達到4.88%,而文獻[6]模型的泛化錯誤最高也要達到4.71%,并且2種模型的泛化錯誤都要同時高于本文模型,因此,本文模型在設備故障診斷過程中,存在較少的泛化錯誤。

圖2 不同模型的泛化錯誤Fig.2 Generalization error of different models
測試數據選取4 000個正常設備數據,5 000個異常樣本,分析訓練后不同模型的ROC曲線對比,分析結果如圖3所示。根據圖3可知,在誤檢率為0.03時,3種模型的診斷進度較為接近,但誤檢率達到0.15時,3種模型出現較大差距,并且本文模型的診斷精度始終高于另外2種模型,因此,本文模型具有較好的泛化能力。

圖3 不同模型的ROC曲線Fig.3 ROC curves of different models
對比3種模型,分析在信噪比不同的情況下故障診斷的程度,分析結果如圖4所示。根據圖4可知,由于信噪比逐漸下降,不同模型的故障診斷準確率也隨之降低,文獻[8]模型的診斷準確率在信噪比為5、0、-5、-10 dB時,要高于文獻[7]模型,但信噪比為20、15、10 dB的情況下,文獻[8]模型診斷準確率低于文獻[7]模型,并且文獻[8]模型的最高故障診斷準確率為80%,文獻[7]模型最高只達到82%,而本文模型的最高診斷準確率為92%,且在信噪比不同的情況下,本文模型的診斷準確率始終高于另外2種算法。因此,本文模型的診斷準確率較高,并且擁有較好的抗噪聲能力。

圖4 不同模型故障診斷結果Fig.4 Fault diagnosis results of different models
設定最高診斷煤礦汽車機械設備故障次數為50次,分析3種模型在不同診斷次數下的均方根誤差,分析結果如圖5所示。根據圖5可知,隨著診斷次數的上升,不同模型的均方根誤差均有所下降,文獻[7]模型與文獻[8]模型在診斷次數為50次時均方根誤差分別為0.032與0.037,而本文模型在診斷次數為20次時,診斷均方根誤差下降至0.02,說明此時本文模型可以完成煤礦機械設備全部故障診斷,故障診斷效率高,優勢顯著。

圖5 不同模型的均方根誤差Fig.5 Root mean square error of different models
本文有效結合低秩鑒別投影算法和改進ART神經網絡學習算法,構建基于機器學習算法的煤礦汽車機械設備故障診斷模型,根據低秩鑒別投影算法,提取故障特征,之后采用改進ART神經網絡學習算法,通過兩階段的學習,實現煤礦汽車機械設備故障診斷。在未來階段,可在此基礎上加深研究,細化設備故障的類型,提升故障診斷的效率。