梁紹東,陳彰怡
(東蘭縣中等職業技術學校,廣西河池 547000)
機電設備運行識別的精準化,一直是機電設備需要考慮的主要因素之一。正常且高效的機電設備可以為優化產品帶來更多的便利,機電設備運行狀態的識別包括對有無故障以及故障類型等設備運行狀態的識別。目前,識別的方式的主要流程是在前期通過信號采集得到機電設備的運行狀態信息,對信息做處理,根據處理的信號進行特征的選擇,最后將提取處理的機電設備的異常運行狀態信息做智能識別。在這個過程中,特征的選擇與提取主要是根據信號分析的結果。傳統的機電設備異常運行狀態的識別過程,在特征的選擇和提取上,嚴重依賴以往的經驗知識,很容易出現不熟悉識別情況,并且在剔除和分揀原始信息的過程中,很容易造成丟失有效信息[1]。
機電設備異常運行狀態的識別有很多方法,例如經驗模式分解法等,但普遍存在特征選擇困難的問題,只能以高維信息為直接對象,在現有程序的基礎上,設計運行數據上傳至上機位的通信流程,通過對機電設備運行信息的特征進行提取并分析。對機電設備異常運行過程中的故障問題進行直接診斷,才能從根本上解決原始信息特征選擇的問題。隨機森林算法作為一種監督學習算法,主要通過對算法數據的輸入進行大量的模擬計算,并通過迭代處理完成算法的優化。目前的隨機森林算法主要分為分類和回歸兩種類型,通過對訓練數據的二次處理,對數據進行回歸擬合,同時,通過隨機選取森林的變量,將分類的節點生成多種分類樹,從而產生不同的分類結果。
為了實現機電設備異常運行狀態的識別,對機電設備異常運行狀態特征進行提取。對信息的較高的維度進行學習機器的訓練,用較小的維度表示機電設備異常的運行狀態,以此獲取機電設備異常運行信息的特征子向量[2]。根據特征的子向量,可以得到機電設備運行信息訓練子集的矩陣模型,用函數公式表示為:
其中,Am為類別機電設備運行信息的散度矩陣,Cm為類別機電設備運行信息的維特征向量,m 為類別數值,n 為機電設備運行的特征的維度。根據機電設備的訓練子集的矩陣模型函數模型,可以得到機電設備運行的散度的矩陣計算式,利用高維信息進行學習機器的訓練,對數據進行降維處理,將散度的比值進行處理,可以根據機電設備異常運行的訓練子集均值向量數值,得到散度的矩陣模型,用公式表示為:
其中,Bm為類別機電設備運行信息的樣本集矩陣,g 為運行的維特征均值向量,l 為類別的樣本個數。根據散度的矩陣模型,可以得到評價特征子集辨別力的標注函數:
其中,d 為機電設備異常狀態的評價特征子集類特征辨別力,根據評價特征子集辨別力,對于特征的子向量,若樣本的方差很小并且相似性不大,則說明機電設備異常運行的特征子向量的辨別力強,根據標注函數的判斷,將樣本的類型分為較純的子集以及相關性較小的子集,根據子集的特征,完成對機電設備異常運行狀態的特征提取[3]。
在機電設備異常運行狀態提取特征的基礎上,根據隨機森林算法,將提取的特征進行狀態分類,提取的機電設備異常運行的狀態特征信息分為多個維度,主要是信息的數量以及樣本內變量的信息,生成多個分類的參數閾值,從而根據閾值生成決策樹模型[4]。根據決策樹的模型,使用改進的隨機森林算法,從機電設備的運行數據中隨機選取不同的樣本數的參數,將參數進行組合,形成眾多的隨機決策樹,在決策樹的分類節點上,對數據集的信息熵進行計算,從邏輯關系的角度,根據信息熵得出機電設備異常運行狀態的信息熵計算模型,用公式表示為:
其中,hi表示數據集的節點的信息熵,ei表示數據集的節點的機電設備運行的數據集的熵值,f 表示機電設備運行數據集節點之間的信息熵值。根據節點之間的信息熵的數值,得出機電設備異常運行之間聯合的熵值。根據聯合的熵值,以下降率為主要標準生成下降值最大數值模型,在這樣隨機選取樣本變量的組合下,生成可以并行處理的機電設備異常運行狀態信息的決策模型。通過決策模型構建機電設備運行信息識別流程(圖1)。

圖1 機電設備狀態信息識別流程
根據狀態信息的識別流程,在隨機算法的基礎上,對初始參數較小的參數閾值,通過逐次遞增選出最優的參數組合閾值,利用機電設備狀態的信息訓練數值進行隨機數值的變量重要性的度量,包括機電設備群點的剔除,以及對訓練數據的構建[5]。使用平均算法對機電設備狀態運行的權重系數進行選擇提取。同時,在此基礎上根據采樣的節點,得到不同加權系數下的提取函數模型,其函數表達為:
其中,t 為節點機電設備的平滑數值,u(k)表示為滑動加權處理參數,r 為機電設備的平滑采樣點。根據得到的加權系數提取函數,得出機電設備的平滑數值參數,將平滑數值參數設置為固定采樣點的參數數值,進行統一的歸一化處理,得到歸一化后的機電設備異常運行信息的數據信息。為了減少數據與節點之間的相互影響,對數據進行預處理,作為算法的輸入數據,根據最后的輸入數值,得到最后的機電設備運行信息歸一公式:
其中,o 表示機電設備異常運行加權參數。通過式(6)得到平均濾波的數據處理數值,通過數據處理數值得到最終的數值,從而完成對機電設備運行數據的識別。
為了驗證本文設計的機電設備異常狀態識別方法的有效性,進行實驗論證。在相同的訓練樣本條件下,采用機電設備中的一個重要斷面安全裕度作為指標的歷史數據進行實驗分析。
將訓練樣本的數據進行統計,實驗采用全體機電設備的數據作為模型的輸入數據,為了保證實驗的適用性,使用隨機取樣來選擇實驗的主要樣本,并將主要樣本分為6 個編碼類別,在6個編碼類別分別設置對應的樣本比例(表1)。

表1 機電設備運行的樣本比例
選取合適的初始參數,根據初始參數的不同,將樣本數據分為不同的分類結果,采用初始參數值的最小的值為初始值,并篩選出訓練誤差最小的數值來組合參數。為保證本文提出的基于隨機森林算法的機電設備異常運行識別方法的有效性,從訓練樣本的數據集中隨機挑選機電設備運行的數據信息進行深度的特征提取,不同卷積層下的輸入與輸出特征如圖2 所示。

圖2 卷積層機電設備的輸入特征
從輸入特征圖中可以清晰地看清機電設備卷積層的輪廓,區分性的局部信息明顯,抽象的程度較高,滿足實驗的基本要求。使用隨機森林的分類器,對單獨的連接層的輸出特征進行測試,在測試中實驗的隨機個數為200。對200 個參數進行特征組合,得到特征提取的結果如圖3 所示。

圖3 數據特征提取結果
根據提取的數據特征,使用森林算法識別技術以及其他兩種方法進行機電設備異常運行精準度的識別。
采用相同的訓練樣本,引入不同的識別方法,在6 個編碼類別下進行精度測試實驗,用UA 表示輸入端的節點的精度,PA表示輸出端節點的精度,則不同方法下的機電設備運行的異常運行識別精度對比如表2 所示。

表2 不同方法的異常樣本識別精度
通過三種方法異常運行識別精度的比較,可以看出,隨機森林算法的識別精度明顯高于其他方法,不論是在輸入區域的精準識別還是在輸出的精準識別方面,其精準度都高于其他兩種方法。隨機森林算法下的識別方法對運行數據做了精準分類并進行了異常數據特征的提取,能夠實現機電設備異常運行狀態的精準識別。
本文以機電設備的運行狀態識別作為研究內容,在改進隨機森林算法的基礎上,分析了自動化的機電設備的典型工作流程。使用隨機森林算法完善數據的識別功能,通過集中存儲機電設備的正常運行狀態信息,并對異常可疑狀態進行簡單分析,實現設備故障自動化識別以及軟件的故障引導識別,從而實現了機電設備的高精度運行識別。