侯 濤
為了確保經編機在生產中維持正常運轉,可以通過經編機的歷史運行數據、實時運行數據和已經設置的織機運行參數來預測織機的運行狀況。傳統的預測分析是在歷史資料基礎上得到客觀規律,結合相關領域專家的專業經驗,預先對各種可能發生的運行狀態先驗地預測其概率。但是先驗分布具有一定的局限性,先驗分布和許多決策問題的準確性易受到先驗信息充分與否的影響,同時決策人預先對狀態可能發生的概率做出的主觀判斷與客觀真實情況存在一定的差距。
近年來人工智能技術發展迅速,為提高紡織機械設備故障預測技術的可靠性和有效性,將人工智能相關技術引入到紡織機械設備故障預測中來很有必要。本文通過分析經編機故障的性質、分類與影響經編機故障預測的各類指標,構建了經編機故障預測框架;通過使用主成分分析法對影響經編織機故障預測的各類指標降維處理,構建了基于距離判別法的經編織機故障預測模型,從而實現了經編織機的故障預測。
對影響經編機故障預測指標進行分析,以獲得反應經編機生產狀態的特征量,從而采用基于主成分分析和距離判別法理論進行經編機故障預測模型的建立。在對紡織廠進行了實地調查基礎上,通過對經編機生產運行過程的分析,對經編機故障預測指標的建立從離散型數據和連續性數據兩方面入手,其結構如圖1所示。

圖1 影響經編機故障預測指標體系
經編機的故障是一個從正常狀態到故障的逐步演化的多狀態過程,將經編機運行狀態分為正常、停機、換盤、故障、維修。在停機狀態下不可能向故障狀態轉變,當經編機發生故障時運行狀態從正常狀態向故障狀態轉變,當經編機換盤后品種不合適可能會造成經編機故障。
主成分分析(PCA)是一種較為成熟的多元統計監測方法。應用PCA的方法將顯式變量作一定的線性轉化產生數量較少的隱式變量,降低原始數據空間的維數,再從新的隱式變量中提取主要變化信息及特征[1]。這樣既保留了原有數據信息的特征,又消除了變量間的關聯、簡化分析復雜度;從新的數據空間中提取符合相應要求的主元數,同時也消除了部分的系統噪聲干擾。特征或屬性太多會增加問題的復雜程度與難度,主成分分析就是把原來多個特征化為少數幾個特征指標的一種統計分析方法,從數學角度看這是一種降維處理[2]。
為了消除量綱的影響,將變量標準化后再計算其協方差矩陣。任何隨機變量對其作標準化變化之后,其協方差與其相關系數是一回事,即標準化后的變量協方差矩陣就是其相關系數矩陣。根據協方差的公式可以推得標準化后的協方差就是原變量的相關系數,即標準化后的變量的協方差矩陣就是原變量的相關系數矩陣。也就是說,在標準化前后變量的相關系數矩陣不變。
主成分分析的計算步驟如下:
(1)將變量進行標準化處理;
(2)計算相關系數矩陣;
(3)求出相關系數矩陣的特征值及相應的正交化單位特征向量;
(4)選擇主成分;
(5)計算主成分得分。
距離判別法的基本思想是根據已分類的樣本空間的樣本數據,計算出每個分類的重心即分類均值。若待檢樣本與某類的重心距離最近,就認為它是來自于該類。距離判定方式有歐氏距離、曼哈頓距離、切比雪夫距離及馬氏距離等。
馬氏距離的計算與原始數據測量單位沒有關系,不受指標單位不統一的影響,故本文選取馬氏距離作為距離度量公式。馬氏距離能夠有效計算兩個未知樣本集的相似度,表示協方差的距離。其物理意義就是在規范化的主成分空間中的歐式距離,即首先利用主成分分析將樣本分布改變到另一個空間,而馬氏距離就是樣本在新空間中分布的歐氏距離。
圖2所示為基于PCA與距離判別法的經編機故障預測框架,對歷史樣本進行主元分析,確定模型的主元及提取經編機故障特征信息形成模型的訓練集,并由此得到主成分分析-距離判別法經編機故障預測模型[3]。對經編機實時采集的數據進行相應的預處理,得到經編機實時數據的特征信息,并將其輸入預測模型中完成經編機故障預測。
使用主成分分析與距離判別法進行經編機故障預測的基本流程見圖3,整個流程圖由三部分組成,即經編機故障預測模型的建立與利用經編機故障預測模型進行故障預測,其中數據預處理包括數據的整理和數據標準化處理兩部分。

圖2 經編機故障預測模型

圖3 經編機故障預測的基本流程圖
2.2.1 數據預處理
本文結合本領域專家的知識和經編機生產歷史數據統計表,選取影響經編機故障預測指標中的8個特征參數作為條件屬性,分別為轉速、經編機運行情況、故障代碼、生產時間、停機次數、停機時間、維修次數、維修時間;采取經編機運行8個特征參數作為判別依據,對各屬性值按連續數據和離散數據進行如下劃分:
(1)連續數據 主要包括轉速、生產時間、停機時間、維修時間,這些連續數據都屬于連續值。為了更好地利用主成分分析理論對經編機故障預測指標進行降維處理,必須對樣本空間中存在缺失值的樣本點進行缺失值插入處理。為保持樣本空間原有的分布,本文采用的是均值插入方法。
(2)離散數據 主要包括經編機運行情況、故障代碼、停機次數等。對離散數據進行缺失值處理時依然采用的是均值插入方法,但缺失值的替補值不再是平均值,而是用該樣本點所在的樣本空間中其他所有樣本點存在值的眾數來代替該缺失值。
2.2.2 主成分分析
主成分分析是經編機故障預測模型中不可或缺的模型,因為在原始數據集中屬性與屬性之間可能存在相互關系,而這種相互關系會造成模型的預測效果不好,可能會產生過擬合現象。本文采用主成分分析進行降維處理,其基本計算方法是:將訓練樣本集進行標準化處理,計算樣本空間樣本點的相關系數矩陣,求出相關系數矩陣的特征值及相應的特征向量,然后計算主成分貢獻率及累計貢獻率,再計算主成分載荷,最后計算因子判別式[4]。
算法步驟如下:
(1)根據主成分分析原理將數據進行標準化處理;
(2)根據算式求相關系數矩陣,并計算相關系數矩陣;
(3)選取主成分特征值越大相對應的主成分數據越重要,選取主成分數據一般包含到85%以上即可,代表標量的大部分原始信息[5];
(4)計算主成分載荷,它主要反映主成分與原變量的相互關聯程度;
(5)根據主成分載荷矩陣,計算因子判別式;
(6)輸出因子判別式。
2.2.3 距離判別法模型的建立
采用馬氏距離其基本方法是:首先計算各類樣本空間的均值,然后計算各個樣本空間的協方差矩陣,計算任意兩樣本空間的距離,求出線性判別函數,實現預測功能。
算法步驟如下:
(1)根據距離判別法計算樣本均值;
(2)計算樣本的協方差矩陣;
(3)計算任意兩總體距離;
(4)根據計算的總體距離,得出線性判別公式。
2.2.4 故障預測模型驗證
預測模型驗證實質上就是進行模型有效性分析,是判斷建立的預測模型是否準確代表實際系統;一方面是確保采集的數據適用于建立的預測模型,另一方面是檢驗模型輸出是否接近實際系統。判別結果的評價一般根據對原始數據、驗證樣本的準確預測來評價分類效果的好壞,對原樣本及訓練樣本驗證方法有組內考核,組內回代,對驗證樣本的驗證法有組外考核等。
本文所采用的驗證方法如下:
(1)對于訓練樣本,采用組內回代法驗證模型效果是否準確,假設G1,G2…Gn為n個總體,分別抽取容量為n1,n2的樣品,設nmn表示實際歸類Gn,預測歸類Gm的樣本數。使用誤差率來估計誤判率,準確率為1減估計誤判率,其算式為:

(2)對于驗證樣本,將驗證樣品代入預測模型,與實際結果進行比較。
通過分析影響經編機故障預測的各類指標,采用基于主成成分分析對海量的經編機生產狀態數據進行降維處理,并構建了基于距離判別法評估的故障預測模型,從而實現了經編機的智能化故障預測。通過測試數據集進行驗證,結果顯示預測誤判率較低。