顧 佳, 黃 明, 關 岳
(1.大連交通大學機械工程學院 大連,116028) (2.大連交通大學軟件學院 大連,116028)
(3.中車青島四方機車車輛股份有限公司信息技術部 青島,266111)
(4.中車青島四方機車車輛股份有限公司國家工程試驗室 青島,266111)
牽引變流器作為高速列車的關鍵部件,主要作用是實現電能的轉換。牽引變流器會在列車行駛過程中會產生大量的熱量,為保證牽引變流器正常工作,這些熱量將被冷卻系統通過水冷或風冷的方式帶走。風冷即冷卻風機通過從外部抽入冷卻空氣作用在散熱器上,以達到冷卻的目的,冷卻系統濾網的作用是阻擋空氣中的塵埃粒子以及較大的顆粒污染物進入冷卻系統。隨著列車的持續運行,濾網上吸附的灰塵越來越多,通風量越來越少,冷卻效果隨之也會變得越來越差。當濾網堵塞到一定程度,冷卻系統不能滿足實際要求時,會導致牽引變流器過熱引起安全問題,對動車組的正常運行造成極大的影響。隨著季節、運行線路環境的不同,濾網堵塞程度也不相同,應適時清理濾網沉積物,以免影響牽引變流器的正常運行。
目前,動車組對于牽引變流器濾網的清潔采取計劃修的方式。這種維修方式能夠在一定程度上避免牽引變流器濾網堵塞,但存在過度維修、浪費維修資源問題,對于一些短時間發生嚴重堵塞的情況也會存在欠修風險。牽引變流器濾網清理狀態修是運用列車車載狀態數據、故障數據、環境工況數據以及檢修運用數據,利用數據分析挖掘和人工智能等方法,通過研究濾網堵塞與牽引變流器故障、冷卻系統水溫變化及新風溫度等因素之間的關系,構建濾網堵塞故障診斷模型。同時,利用濾網堵塞故障診斷模型提取的多維故障特征,擬合出濾網堵塞退化狀態曲線,來表征濾網健康水平的退化狀態或退化程度,并依據退化趨勢來預測濾網清潔的維修時間,動態判定濾網是否需要進行清理,以及何時需要清理。
近些年,基于機器學習的故障診斷方法已成為研究熱點[1],例如:支持向量機(support vector machine,簡稱SVM)和BP神經網絡(back propagation neural network,簡稱BPNN)等[2]。然而,以上淺層學習模型用于故障診斷時,診斷精度依賴于提取故障特征的好壞,且在多維大數據情況下,其診斷效果和泛化能力明顯不足。深度學習作為機器學習的一個分支,具有強大的建模能力,在故障診斷等領域同樣取得較好的研究成果。深度學習通過逐層特征提取,能夠學習出故障的早期特征,相比淺層的機器學習算法有更好的優勢[3-6]。然而,單任務深度學習在實際應用中通常會遇到訓練樣本不充分以及欠擬合的問題,相關任務之間的關聯關系沒有被進一步挖掘,模型的泛化能力不強。
視情維修的核心是對設備的退化狀態進行建模及對剩余壽命進行預測。通過對退化狀態建模可以實時了解設備從健康狀態轉變為當前退化狀態的變化情況,剩余壽命預測可以為設備的維修決策提供指導作用[7]。在傳統方法中,特征提取能力和非線性函數映射能力逐漸暴露出不足,迫切需要利用新的智能學習方法對設備進行更加精準、高效的退化狀態建模。近些年,深度學習憑借強大的特征提取能力和非線性函數映射能力,逐漸成為設備退化狀態建模領域的研究熱點。
筆者利用已收集的故障樣本數據,運用多任務深度學習,綜合考慮濾網故障分類診斷和濾網堵塞嚴重程度預測2個相關任務,通過訓練樣本對多個具有共享表達的任務進行并行學習,將其他任務學到的知識用于目標任務中,從而提升目標任務效果。首先,利用列車實時采集的牽引變流器狀態數據、故障樣本數據構建牽引變流器濾網堵塞故障診斷主任務;其次,利用列車回庫檢修過程中采集到的人工測量數據,構建濾網堵塞嚴重程度輔助子任務,在深度神經網絡(deep neural networks,簡稱DNN)基礎上,通過共享2個任務的輸入參數,構建了牽引變流器濾網多任務深度神經網絡診斷模型;然后,結合SOM方法將多任務深度學習所抽取的高維故障特征向量集成為一個故障特征變量,根據歷史故障數據特征變量演化規律,擬合退化狀態曲線,直接反映故障特征量和退化狀態之間的關系,實現濾網堵塞維修決策。
多任務學習(multi-task learning,簡稱MTL)通過從對訓練樣本中選擇2個以上訓練目標,并根據目標間相關性提升模型訓練的泛化性能力的方法[8]。多任務學習與單任務學習(single-task learning,簡稱STL)相比,MTL通過利用多個任務之間的相關信息來提升任務之間的辨識度或預測能力,即MTL通過放松部分訓練樣本與主任務之間的關系,同時,相關任務利用潛在數據特征提升模型訓練效果,從而實現模型的泛化能力。目前,MTL主要解決圖像識別和語音識別等問題[9-10]。
與單任務深度神經網絡(single-task deep neural networks,簡稱ST-DNN)相比,多任務深度神經網絡采用多個任務共享同一隱層的方式,每個隱層的輸出將作為多個任務輸入。MT-DNN通過多任務共享隱層的機制,可以有效提取任務之間的共同信息,克服由于訓練樣本不足而導致的網絡訓練不足[11]。


(1)

自組織映射作為一種無監督競爭式機器學習算法[12],主要作用是將任意維度的輸入通過權值計算轉變為一維或者二維的離散映射,權值計算的過程滿足自適應的特點[13]。SOM學習算法步驟如下:
1) SOM網絡的初始化。選擇權值較小的隨機值對輸入向量和權值進行初始化,并對輸入向量和權值做歸一化處理。
2) SOM神經網絡的向量輸入。將輸入向量X={x1,x2…,xm}T按照對應的維度賦值給各個輸入神經元。
3) 確定輸入向量與權值向量的歐幾里得距離。距離最小的神經元將贏得競爭,以權值向量的第j神經元的計算為例,計算其與輸入向量間的距離

(2)
其中:wij為輸入向量的i神經元和權值向量的j神經元之間的權值。

4) 權值的學習。調整式(2)中所確定的勝出神經元j*及其鄰接神經元的權值
Δwij=wij(t+1)-wij(t)=η(t)(xi(t)-wij(t))
(3)
其中:η為常數,0<η<1,隨時間變化η衰減為0。

(4)
5) 確定輸出ok

(5)
其中:f(*)為輸出函數,其輸出值為0~1,且f(*)可以為其他的非線性函數。
6) 判斷是否收斂。如果滿足設定的迭代次數要求,算法結束;否則,返回步驟2,繼續學習。
利用多任務深度學習進行牽引變流器濾網堵塞故障診斷包括以下幾個步驟。
1) 構建一個含有N個隱層、2個任務的多任務深度神經網絡,圖1為基于DNN的多任務學習模型。網絡架構為
[DNNnet]=Feedforward(X;H1,H2,…,HN;Ymain,Ysub;W,b)


圖1 基于DNN的多任務學習模型Fig.1 Multi-task learning model based on DNN
2) 構造濾網堵塞故障診斷主任務和濾網堵塞嚴重程度子任務,2個任務共享DNN隱層H1,H2特征,在隱層H2添加2個輸出,主任務輸出表示濾網堵塞故障診斷,為二分類問題;子任務輸出表示濾網堵塞嚴重程度,為回歸問題。其中:主任務激活函數和子任務激活函數采用sigmoid;主任務損失函數采用二分類交叉熵;子任務損失函數采用均方誤差。
3) 計算模型總的損失函數為
J=αJmain+βJsub(α=1,β=1)
(6)
其中
4) 多任務模型訓練。上述2個任務通過總的損失函數J立,通過最小化誤差函數J用梯度下降法來更新網絡參數,公式為

(11)

(12)
其中:η>0,為學習速率,筆者使用隨機梯度下降優化(stochastic gradient descent,簡稱SGD)算法來求解總的目標函數式的最小值。
利用提取到的牽引變流器濾網堵塞故障特征進行濾網堵塞性能退化預測,圖2為牽引變流器故障診斷及狀態修預測方法流程圖。

圖2 牽引變流器故障診斷及狀態修預測方法流程圖Fig.2 Flow chart of fault diagnosis and condition-based maintenance prediction model for traction converter


3) 將包含從濾網剛被清潔到由于堵塞而引起故障整個周期的濾網堵塞故障樣本數據作為測試數據,輸入到訓練好的多任務深度神經網絡中,通過多個隱含層和分類、回歸進行特征提取,之后將提取出的特征輸入到訓練好的SOM網絡,構建濾網堵塞性能退化曲線。
選擇某列車實際故障樣本數據進行分析,排除其他因素干擾,筆者選擇列車在正常運行過程中,其他條件恒定的情況下觀察濾網堵塞情況與牽引變流器水溫溫度變化的關系。恒定條件為:時速大于300 km/h;風機轉速為高速;風機電流正常;進、出水口壓力正常。
在列車運行過程中的46 d時間內共進行3次周期性濾網堵塞清理工作。從第1次清理到第2次清理時隔25 d,在此期間隨著時間的推移,進出水口溫度越來越高,到第26 d時報高溫故障,現車檢查牽引變流器風機濾網臟堵嚴重,散熱器表面有灰塵,對比其他車透光性差,當天進行清理。第2次清理到第3次清理時隔20 d,溫度變化與上一次相似,第20 d報高溫故障,庫內檢查牽引變流器濾網輕微臟堵,當日進行清理,第1個濾網堵塞周期進出水口溫度變化如圖3所示。

圖3 牽引變流器濾網堵塞與進出水口溫度的關系Fig.3 The relationship between the filter blockage of the traction converter and the temperature of the inlet and outlet
分析發現,水溫溫度變化是一個周期性的變化過程,跟濾網清理周期關系很大。濾網清理后隨著時間的推移,濾網表面附著的灰塵越來越多,導致濾網臟堵越來越嚴重,影響冷卻系統散熱,從而導致進出水口的溫度越來越高。
除變流器冷卻水溫外,筆者選取了其他可能影響濾網堵塞的狀態參數進行相關性分析,最終選擇牽引變流器冷卻水入口溫度均值、冷卻水出口溫度均值、新風溫度均值、車重均值、變壓器原邊側電流均值和中間環路電壓這6個變量過去的第1,2,3,5,7,9,12,15,18,22,26 d的均值以及進風口濾網風速共計56個變量作為建模輸入變量,主任務輸出特征為故障診斷結果0或1;子任務輸出特征為濾網堵塞百分比。
試驗仿真數據來源于我國某型動車組牽引變流器車載實時數據和回庫檢測數據等日常運行維護數據。根據前期的數據分析結果,選取1 800條數據作為建模樣本數據。這里將報出冷卻系統故障的記錄標記為1,未報出故障的記錄標記為0,作為主任務故障診斷標簽;進風口濾網風速值記為子任務濾網堵塞程度標簽值。濾網堵塞數據共計460條,占總體樣本的25.6%,樣本按照70%和30%的比例作為訓練樣本和測試樣本,即訓練集1 260條,測試集540條。
初始化參數設定如下:
1) 神經網絡層數及每層節點數。這里輸入層56個神經元,主任務輸出層1個神經元,子任務輸出層1個神經元;
2) 最大迭代次數設置為300次;
3) 優化器采用SGD,使用基于時間的衰減方案調節學習率,初始學習率為0.1;
4) 權重w初始化時采用隨機的方式;
5) 偏向b初始化為0。
多任務神經網絡學習迭代次數最大設置為300次,筆者采用遍歷的方式確定隱層的最佳網絡結構,隱層神經元從100~300,每種結構重復50次。圖4為兩種方法準確率對比。從圖4可以追蹤濾網臟堵故障診斷分類網絡的訓練過程。當隱層神經元150為最優,平均損失值最低。當濾網堵塞程度子任務加入到網絡后,多任務模型相對于單任務模型,準確率在迭代十幾次時快速達到90%以上,訓練時間明顯少于單任務學習。

圖4 兩種方法準確率對比Fig.4 Comparison of accuracy of the two methods
筆者為評估算法性能,選擇了SVM、單任務DNN與本研究MT-DNN進行比較,其結果如表1所示。對于支持向量機模型,采用徑向基函數(radial basis function,簡稱RBF),通過比較正確率、召回率和F值評價性能。可以看出,無論是正確率、召回率還是F值,MT-DNN模型都取得了最好的結果,說明采用多任務學習可以有效提高故障診斷的性能。另外,各個模型預測結果雖然存在一定的差異,但是F值都超過了70%。說明本研究提取的特征較好地預測了故障診斷的結果。

表1 濾網故障診斷模型性能對比Tab.1 Performance comparison of filter fault diagnosis models %
選取包含整個濾網堵塞故障周期的故障樣本作為訓練數據,應用MT-DNN模型提取故障樣本特征,將模型提取出的特征作為SOM模型的輸入變量,構建多任務濾網堵塞退化狀態曲線。SOM的網絡拓撲節輸入節點個數為150,訓練次數為30,學習率為0.6。模型訓練完成后,為驗證退化狀態曲線的擬合效果,選取濾網堵塞故障樣本,分別將基于MTDNN-SOM和單任務深度神經網絡狀態修模型(single-task deep neural networks-SOM,簡稱STDNN-SOM)得到的退化狀態曲線經歸一化后,與歸一化的濾網通風量數據進行對比,如圖5所示。筆者提出的濾網堵塞退化狀態曲線能較好地描述濾網從被清洗到輕微堵塞再到嚴重堵塞引起故障的整個周期的退化過程,曲線局部震蕩較小。相對單任務模型,多任務模型具有更好的趨勢性和擬合效果,能夠更好地反映濾網堵塞狀態變化,為牽引變流器濾網基于狀態的清理提供決策依據。

圖5 兩種方法擬合效果對比Fig.5 Comparison of the fitting effects of the two methods
針對高速列車牽引變流器濾網清理狀態修問題,提出一種基于MTDNN-SOM的濾網故障診斷和堵塞程度預測模型。針對濾網堵塞引起故障及堵塞狀態緩慢變化的特點,采用深度神經網絡構建了濾網故障診斷主任務和濾網堵塞程度子任務的多任務深度學習模型,將實時接收的車載狀態數據及列車回庫檢修數據應用于MTDNN-SOM模型進行故障診斷及堵塞程度預測,實現牽引變流器濾網基于狀態的清理維修和模型的自適應優化。
針對濾網故障診斷,通過與SVM、單任務算法的對比,本方法準確性均優于SVM和ST-DNN,訓練迭代次數優于ST-DNN。同時,通過MT-DNN提取的故障特征經SOM處理得到的濾網堵塞性能退化曲線比STDNN-SOM得到性能退化曲線預測的效果更好。因此,筆者所提出的基于MTDNN-SOM的濾網故障診斷和堵塞程度預測模型有效可行,可用于牽引變流器濾網清理狀態維修決策。