王彥巖,馬騰飛,沈義濤,張正興,郝寶玉
(1.哈爾濱工業(yè)大學(威海),山東 威海 264209;2.一汽解放商用車開發(fā)院,吉林 長春 130011)
廢氣再循環(huán)(EGR)技術是柴油機降低排放采取的重要技術手段之一,隨著國六排放標準進一步提高,系統(tǒng)的復雜性也大大增加,惡劣的工作環(huán)境更易使EGR系統(tǒng)出現(xiàn)故障,從而對排放性及經(jīng)濟性帶來較大的影響。同時隨著柴油機的智能化,大量傳感器的使用使得信息融合技術應用更加廣泛,其通過對從多個信息源獲取的數(shù)據(jù)進行關聯(lián)和綜合來完成最終所需決策,可提高故障診斷的準確性。在此基礎上,基于數(shù)據(jù)驅(qū)動的故障診斷方法被廣泛應用,且目前正處于學術界和工業(yè)界全面重視的階段[1]。目前柴油機在線診斷是通過車載自診斷系統(tǒng)OBD(On Board Diagnostics)實現(xiàn)故障檢測,此方法對于電子類故障有較好的診斷效率和精度,但對機械故障的診斷精度低,機械故障更多依賴于線下人工診斷,已經(jīng)無法滿足車主越來越高的需求[2-3]。SAE的IVHM(Integrated Vehicle Health Management)標準委員會定義了IVHM能力水平的進展,即從0級的基本“不自動化”到最終5級的“自適應健康管理”的目標[4],而對數(shù)據(jù)的綜合處理在此過程起著至關重要的作用,也將是未來智能化發(fā)展的基石。
主成分分析法(Principal Component Analysis, PCA)和Fisher判別分析法(FDA)都是基于數(shù)據(jù)驅(qū)動的多元統(tǒng)計方法,PCA是目前應用最廣泛的降維技術[5],F(xiàn)isher判別是一種常用的數(shù)據(jù)分類技術,已應用于許多工業(yè)過程的故障檢測和分類[6],但在柴油機故障診斷方面以上兩種方法的使用并不多見。柴油機的結構及工作特性均十分復雜,EGR系統(tǒng)的過程變量眾多,各變量之間往往呈現(xiàn)出強耦合性和非線性[7],無法根據(jù)變量變化直接獲得故障結果,故本研究在PCA和FDA的基礎上引入了核(Kernel)函數(shù),組成了KPCA與KFDA相結合的多變量故障診斷方法。對于不同EGR故障下的過程數(shù)據(jù),監(jiān)測參數(shù)眾多,其數(shù)據(jù)的結構特點和分布特性具有差異性,從整個多元統(tǒng)計的角度來看,多變量的監(jiān)測與分析弱化了部分數(shù)據(jù)之間的耦合性,這也是此類方法在大數(shù)據(jù)分析及機器學習領域的一個特點。
KPCA與KFDA相結合的柴油機EGR故障診斷方法原理見圖1。首先對數(shù)據(jù)進行采集,確定用于診斷的特征變量,然后提取出典型工況下各類故障的數(shù)據(jù)樣本,利用KPCA對高維數(shù)據(jù)樣本進行降維,再根據(jù)樣本故障類別定義數(shù)據(jù)標簽,將數(shù)據(jù)分為訓練集和測試集,分別用于訓練及測試KFDA分類器,最終通過KFDA分類器輸出測試集的數(shù)據(jù)標簽,確定故障類型,完成柴油機EGR系統(tǒng)故障的診斷。結果表明,與未使用核函數(shù)的線性方法(PCA+FDA)相比較,此方法具有更高的診斷精確度。

圖1 KPCA結合KFDA故障診斷原理
核函數(shù)可增強對非線性數(shù)據(jù)的處理能力[8],其主要思想是將原始輸入空間里的非線性數(shù)據(jù)映射到高維空間中,將非線性問題轉(zhuǎn)換為高維空間里的線性問題后再進行線性求解,思路見圖2,并且不同的核函數(shù)在處理不同的非線性數(shù)據(jù)時具有各自的效果及獨特的優(yōu)點[9-10]。

圖2 核函數(shù)映射示意
常見核函數(shù)有以下幾種:
線性核函數(shù):
K(x,y)=xTy+c。
(1)
式中:c為常數(shù)。
多項式核函數(shù):
K(x,y)=(axTy+c)d。
(2)
式中:c為常數(shù);d為多項式階數(shù)。
高斯核函數(shù):
(3)
式中:σ為函數(shù)的寬度參數(shù),控制函數(shù)的徑向作用范圍。
KPCA可以實現(xiàn)降維與提取非線性數(shù)據(jù)特征的雙重目標[10]。設原始數(shù)據(jù)集有n個樣本數(shù),m個維度,經(jīng)核方法將數(shù)據(jù)映射到高維空間后,計算其協(xié)方差矩陣,求得協(xié)方差矩陣的特征值λ及特征向量p,存在相關系數(shù)ai(i=1,2,…n),使得
(4)
進一步簡化得
nλa=Ka。
(5)
式中:K為n×n的核矩陣;a為核矩陣K的特征向量。
Kjk=K(xj,xk)=φ(xj)Tφ(xk),
(6)
a=[a1,a2,…an]T。
(7)
通過求解核矩陣K,將特征值從大到小排列,以85%的累積方差貢獻率標準[11-12],選取各特征值對應的特征向量組成特征空間的降維矩陣,新數(shù)據(jù)x在特征空間中為
(8)

(9)

(10)
(11)
引入內(nèi)積核函數(shù)替代特征空間里的內(nèi)積計算:
K(xi,xj)=kij=φ(xi)φ(xj)。
(12)
wφ可以表示為
(13)
KFDA的目標可轉(zhuǎn)換為
(14)
其中:
(15)
(16)
ξx=[K(x1,x),…,K(xN,x)]T。
(17)
進行廣義特征值分析得到:
(18)
式中與特征值λ對應的特征向量a就是投影方向。求出投影方向后,確定分類的判別閾值yφ:
(19)
對于新數(shù)據(jù)x*的投影點y,若y>yφ,則新樣本屬于第0類;若y 對10輛搭載國六排放標準柴油機的車隊進行遠程在線監(jiān)測,實時采集車輛運行狀態(tài)、ECU控制參數(shù)等共計100個參數(shù),樣本采樣時間間隔為1 s,形成了車輛運行參數(shù)的大數(shù)據(jù)樣本集。試驗中單車行駛里程為5 000 km,監(jiān)測中柴油機EGR系統(tǒng)出現(xiàn)了2個頻發(fā)故障,故障1為EGR冷卻效率低,故障2為EGR流量低,形成了一定數(shù)量的故障樣本。由于EGR率由新鮮進氣量與再循環(huán)廢氣量決定,又會受到溫度、壓力等的影響,故選擇進、排氣系統(tǒng)中的11個監(jiān)測參數(shù)作為EGR故障診斷數(shù)據(jù)模型中的特征變量,分別為新鮮進氣量、總進氣量、進氣歧管壓力、進氣歧管溫度、排氣流量、渦前排溫、中冷后溫度、EGR溫度、EGR壓力值、EGR位置輸出值、EGR壓差輸出值。經(jīng)過多次診斷試驗,結果證明能夠利用這11個變量實現(xiàn)對不同故障數(shù)據(jù)的有效識別,可以達到對故障進行診斷的需求。選取了柴油機運行中常出現(xiàn)的兩個典型工況(工況1:轉(zhuǎn)速為1 400±50 r/min,扭矩為2 200~2 400 N·m;工況2:轉(zhuǎn)速為1 200±50 r/min,扭矩為2 200~2 400 N·m)作為診斷工況。 EGR系統(tǒng)中選擇的11個特征變量與故障之間無線性對應關系,同時PCA是一種線性算法[15-16],不能有效抽取出數(shù)據(jù)中的非線性結構特征[7],而KPCA方法可以很好地解決此問題[17-18],且它提供的特征數(shù)目更多、特征質(zhì)量更高[19],對于通過信息融合后的復雜數(shù)據(jù)源仍能夠有效完成數(shù)據(jù)降維。同理,針對非線性問題,KFDA可以更好地對非線性數(shù)據(jù)樣本進行處理[7-8,20-21]。經(jīng)過使用不同核函數(shù)進行多次試驗,最終確定KPCA中的核函數(shù)使用線性核函數(shù),KFDA中的核函數(shù)使用高斯核函數(shù)。 將圖1的診斷方法用于EGR系統(tǒng)故障診斷。故障診斷流程基于Matlab平臺,采集到數(shù)據(jù)后為避免噪聲干擾進行了去噪處理,然后通過Matlab軟件載入數(shù)據(jù)樣本,每個樣本均由11個過程變量的監(jiān)測值組成;利用KPCA算法對數(shù)據(jù)實施降維,然后對正常狀態(tài)、EGR冷卻效率低、EGR流量低狀態(tài)下的三類數(shù)據(jù)定義類別標簽,分別為1、2、3,在此基礎上利用KFDA算法對訓練集數(shù)據(jù)訓練得到分類器;將測試集數(shù)據(jù)輸入分類器后,分類器根據(jù)判別閾值輸出每個數(shù)據(jù)對應的類別標簽,結果以莖狀圖的形式進行可視化,可根據(jù)莖狀圖里的類別標簽確定樣本數(shù)據(jù)對應的故障狀態(tài),完成診斷。 選取工況1正常狀態(tài)、EGR冷卻效率低、EGR流量低狀態(tài)下的數(shù)據(jù)樣本各300個,對數(shù)據(jù)進行降維并標注類別標簽后按照3∶1的比例隨機分為訓練集和測試集,利用訓練集數(shù)據(jù)進行KFDA分類器訓練,最終分類器的訓練集精度達到99.41%。然后利用訓練好的分類器對測試集數(shù)據(jù)進行分類,測試集精度達到99.11%,結果見圖3。 圖3 工況1 KPCA+KFDA診斷結果 而PCA+FDA組合成的線性方法,對于柴油機參數(shù)中的非線性數(shù)據(jù)不能很好地進行判別,其訓練集精度為86.96%,測試集精度只有88%,結果見圖4。 圖4 工況1 PCA+FDA診斷結果 同理,選取工況2正常狀態(tài)、EGR冷卻效率低、EGR流量低狀態(tài)下的數(shù)據(jù)樣本,樣本數(shù)分別為161、187、183個,降維并標注類別標簽后按照3∶1的比例隨機分為訓練集和測試集,利用訓練集數(shù)據(jù)進行KFDA分類器訓練,最終訓練集精度達到95.98%。然后利用分類器對測試集數(shù)據(jù)進行分類,測試集精度達到了90.98%,受到工況及樣本數(shù)量的影響,其精確度略低于工況1,結果見圖5。而PCA+FDA組合成的線性方法,其訓練集精度為82.41%,測試集精度為87.97%,結果見圖6。 圖5 工況2 KPCA+KFDA診斷結果 圖6 工況2 PCA+FDA診斷結 由診斷結果可知,在原有線性方法的基礎上結合核函數(shù),可以有效處理EGR系統(tǒng)中的非線性過程變量,進一步提高故障的診斷精確度,并能夠較為準確地診斷出EGR系統(tǒng)的冷卻效率低故障和流量低故障。 針對柴油機EGR系統(tǒng)的非線性問題,引入了核方法,可提高對EGR系統(tǒng)非線性問題的處理能力。提出基于KPCA與KFDA結合的柴油機EGR系統(tǒng)故障診斷方法,對EGR冷卻效率低和EGR流量低兩類故障多次驗證后,診斷精度最高達到99.11%。將此方法向柴油機其他系統(tǒng)拓展,對于建立柴油機整機在線健康管理系統(tǒng),提高柴油機運行可靠性,具有重要意義。3 故障監(jiān)測及數(shù)據(jù)采集
4 故障診斷




5 結束語