杜子學,蔣大衛,吳 晶
(1. 重慶交通大學 軌道交通研究院 重慶 400074; 2. 重慶交通大學 交通運輸學院 重慶 400074;3. 重慶市軌道交通(集團)有限公司 重慶 400042)
車載空調系統是城市軌道車輛的重要部分,通過除濕、降溫處理車廂內空氣,給乘客一個良好的乘車環境。重慶單軌3號線采用CK22/BPG-E03型變頻空調機組,機組結構為頂置式,出風、回風在底板下部[1]。重慶單軌3號線自開通至今,發現空調系統故障數據中,幅流風機故障達72.12%,空調機組故障達26.27%,且故障主要集中在7、8、9月, 尤其9月故障數激增,而1、2、3、12月故障數較低。說明車載空調系統故障的出現與季節溫度存在一定聯系。初步分析認為空調故障季節性波動,主要是環境溫度升高且地下隧道空間限制,造成通風量有限,熱空氣無法及時排除,導致制冷劑散熱不良,使空調系統長時間高負荷運轉產生故障。
學者們提出了一些針對空調系統故障預測的方法,王輝等[2]采用ARMA模型對飛機空調系統故障進行短期變化的預測;陳維興等[3]針對機坪地面空調間歇故障問題,提出改進Apriori算法,實現了延誤維修預測。通過對故障時間序列的預測分析,可以更合理制定維修策略,優化零備件采購,選擇高可靠性產品,從而有效控制維修成本,并對短期的維修成本預測提供參考,空調系統故障數預測對控制軌道車輛運維成本具有重要意義。
隨著預測理論發展,單一預測模型如GM(1,1)模型、BP神經網絡、ARIMA模型難以滿足含有多影響因素的復雜問題的需求。利用多個單一模型進行組合預測,成為現今眾多學者的研究重點。趙鵬等[4]根據城市軌道交通客流以“周”為單位的周期性波動規律,采用季節ARIMA模型對未來10天內進站量進行短期預測;聶淑媛[5]根據房價序列存在明顯的季節特征和典型的波動聚集性,使用X-12季節調整方法進行處理,建立ARIMA和AR(2)-GARCH(1,1)復合模型對北京市新建住宅價格指數序列進行擬和預測;翟靜等[6]研究了ARIMA與BP神經網絡的組合,建立預測模型在糧食產量時序預測問題上進行應用;劉天等[7]研究并比較了GM(1,1)、ARIMA模型及其組合模型在病毒性甲型肝炎發病數時間序列預測的應用;張忠林等[8]提出了一種BP神經網絡補償灰色周期外延模型用于預測就診人數,相比單一模型提高了預測精度。目前,對時間序列預測的諸多研究均顯示出組合預測模型的優勢,克服了單一模型預測的缺陷,也提高了預測精度。
為深度挖掘跨座式單軌空調系統故障數據的變化規律,合理預測故障數量,筆者根據空調故障時序的明顯季節特征和波動聚集特征,采用BP神經網絡對X12-ARIMA模型的殘差進行修正,提取序列的非線性特征,將X12-ARIMA模型所得結果與BP神經網絡修正結果相加得到改進后模型預測結果。基于重慶單軌3號線空調系統7年逐月故障數據,對比改進模型與X12-ARIMA模型、BP神經網絡模型及ARIMA-BP組合模型的故障數預測值,并根據多個模型評價指標選出最優預測模型。
1.1.1 Census X12季節調整法
X12季節調整法的基本分解模型包括加法模型和乘法模型。空調故障時間序列數據的季節成分較為穩定,故選用Census X12中的加法模型對跨座式單軌空調系統故障數進行季節調整[9]。X12-ARIMA模型是將具有季節特征的時間序列通過Census X12進行季節調整,把故障次數時間序列分解為趨勢循環要素、季節變動要素和不規則變動要素,在此基礎上采用ARIMA模型進行建模,模型如式(1):
B=BSF+BSA
(1)
式中:B為故障次數原始數據;BSF為季節變動因子,BSF=T+C+I,T為趨勢變動因素,C為循環變動因素,I為不規則變動要素;BSA為剔除季節因子后的故障時間序列。
1.1.2 ARIMA模型
ARIMA模型作為一種現代統計分析方法,廣泛應用于各個領域[10-11]。ARIMA(p,d,q)模型中,p為自回歸項數,q為滑動平均項數,d為使之成為平穩序列所做的差分次數,模型可以表示為:
(2)
式中:yt為當前值;μ為常數項;γi為自相關系數;εt為誤差;θi為偏自相關系數。
ARIMA模型變量主要借助內生,不依賴于其他外生變量[10]。基于ARIMA模型的時間序列預測方法的建模主要有4個步驟:①判斷序列是否平穩:若序列非平穩,可采用取對數、一般差分、季節性差分使序列轉變為平穩序列,并用單位根檢驗(ADF檢驗)判定序列是否平穩;②模型參數定階:依據平穩化處理后的序列的自相關圖和偏自相關圖,初步確定模型中的p、q的值;③模型診斷:通過Box-Ljung-Q統計量進行模型殘差診斷,若殘差為白噪聲序列,則可以采用該模型進行預測;④模型選擇:若存在多個符合建模條件的模型,則根據相應準則選擇最有效的模型。
作為一種多層前饋網絡,BP神經網絡的主要特征是訓練網絡時誤差逆向傳播,信號前向傳遞。標準的BP神經網絡有3層(圖1) :一個輸入層、若干隱藏層和一個輸出層。 同一層神經元之間并無聯系,不同層的神經元則前向連接[10]。數據通過輸入層的m個節點輸入,經由激活函數沿網絡正向傳遞,經過各個隱藏層節點,到達輸出層。若此時結果不理想,則將輸出值與實際值的誤差反向傳播,重新調整每一層的權值與閾值,重復多次可使網絡不斷優化,保證輸出數據的準確。

圖1 3層BP神經網絡結構Fig. 1 Three-layer BP neural network structure

Yt=F(Yt-1,Yt-2,…,Yt-m)+ei
(3)
式中:Yt-1,Yt-2,…,Yt-m為輸入變量;Yt為輸出量;F(·)是由BP神經網絡決定的激活函數;ei是隨機誤差。
經大量數據訓練后,建立輸入和輸出數據間的數學關系,并推導未來值。
組合模型是根據歷史數據,利用原理和方法不同的多個單一預測方法分別建立模型,并根據各子模型的精度進行權衡,賦予不同模型一定權重[6]。組合模型的難點在于最優組合權重的確定,若權重不合理,可能預測效果比單項模型更差[12]。線性組合預測模型是目前使用最廣泛的模型,如式(4):
(4)
式中:n為單項模型種類;Fit為第i種預測方法在第t期的預測值;ωi為第i種預測方法的權重。
采用方差倒數法計算權重,即依據相對誤差指標對模型賦予合適的權重。在方差倒數法中相對誤差越大,模型預測精度越小,賦予權重越小,反之亦然,如式(5)、式(6):
(5)
(6)
式中:di為第i個單項模型的誤差平方和。

步驟1利用X12-ARIMA模型對原始時間序列建模,得到原始序列的擬合值Z1i和預測值F1i,將擬合值與原始數據相減得到殘差εi=Yi-Z1i。
步驟2應用殘差序列εi建立BP神經網絡,經過大量數據訓練,建立函數關系,并得到殘差序列的擬合值Z2i和預測值F2i。
步驟3X12-ARIMA-BP模型的最終擬合值為Zi=Z1i+Z2i,預測結果為Fi=F1i+F2i。
分別利用X12-ARIMA模型、BP神經網絡模型、組合模型和X12-ARIMA-BP模型,對7年故障數據的前6年的空調系統逐月故障數進行擬合,預測第7年的逐月故障數,并與第7年的實際值進行比較。采用平均絕對誤差(MAE)、平均絕對誤差百分比(MAPE)、均方誤差(MSE)作為評價指標。
重慶單軌3號線(跨坐式單軌)2013—2019年空調系統故障累計報告4 644例,月平均報告55.29例,空調故障整體呈逐年略微下降趨勢(如圖2)。2013—2019年各月均有故障報告,故障數據含有明顯季節高峰,7、8、9月故障數相對較多,占總數的41.19%。選取2013年1月—2018年12月,共72個月的故障數據建立預測模型,2019年1—12月的數據作為檢驗數據,驗證模型的精確度。

圖2 重慶單軌3號線空調系統2013—2019年故障時間序列Fig. 2 Fault time series of air conditioning system of Chongqingmonorail line 3 from 2013 to 2019
借助EViews7.0軟件,將故障次數的原始數據分離出季節因素序列(無量綱)如圖3, 剔除季節因素的故障時間序列(無量綱)如圖4。

圖3 故障數的季節因素序列Fig. 3 Seasonal factor sequence of fault data

圖4 剔除季節因素的故障時間序列Fig. 4 Fault time series excluding seasonal factors
2.1.1 剔除季節因素的時間序列建模預測
對剔除季節因子的時間序列進行平穩性檢驗,單位根統計量ADF值為-1.085 428,該統計量對應概率值為0.248 8>0.050 0,序列非平穩需先進行一階差分,一階差分后的自相關與偏自相關如圖5。差分后序列滿足平穩性條件,根據圖5在q階與p階之后出現拖尾特征,可初步判定ARIMA模型的p=0~6,q=0~7,共55個ARIMA模型(p取值有7個,q取值8個,共56個組合,去除p=q=0的組合)。經過逐一試驗,其中50個模型存在參數不顯著的情況。根據AIC(赤池信息準則)、SC(施瓦茲準則)、H-Q(漢南-奎因準則)最小準則和殘差白噪聲要求選取最優模型。

圖5 一階差分后時間序列的自相關與偏自相關Fig. 5 Autocorrelation and partial autocorrelation of time series afterfirst order difference

圖6 ARIMA(6,1,0)模型的殘差檢驗Fig. 6 Residual test of ARIMA (6,1,0) model
通過比較,結合模型簡潔的原則得到最優的模型為ARIMA(6,1,0)模型,經過參數估計與校驗,模型的AIC值為7.37,SC值為7.60,模型的決定系數R2=0.55,殘差序列經檢驗為白噪聲序列(自相關與偏自相關系數如圖6)符合建模要求。ARIMA模型的公式為:
Δyt=-0.238 0-0.791 6Δyt-1-0.774 5Δyt-2-
0.558 2Δyt-3-0.545 7Δyt-4-0.609 9Δyt-5-0.444 0Δyt-6+εt
(7)
2.1.2 季節因子的時間序列預測
由圖3可知:相同月份的空調系統故障數的季節因素序列波動較小。根據“近大遠小”原則,將歷史故障數據中每年同時期季節分量按一定的權重求和,可得本年當期空調故障數的季節周期分量[12],即:
BSF(i,j)=αBSF(i-1,j)+α(1-α)BSF(i-2,j)+…+α(1-
α)n-1BSF(i-n,j)
(8)
式中:BSF(i,j)為第i年第j月的月故障季節周期分量;α為加權系數。
由文獻[13]可知,若月故障季節周期分量波動不大,α取值在0.1~0.5之間,筆者取α=0.5。
2.1.3 X12-ARIMA模型預測結果
將2.1.1節和2.1.2節得到的空調系統故障數據分量的擬合值和預測值按式(1)進行計算,最終對2019年1—12月空調系統故障次數進行預測。
2.2.1 數據預處理
在建立BP神經網絡模型前,運用MATLAB的Mapminmax函數對數據進行歸一化處理。從圖2可看出空調系統故障數據包含季節波動性,每月故障差異較大,但年故障數存在一定規律,因此采用滯后項預測法。
為充分利用數據,選取每相鄰12個月的數據作為輸入,下1個月的數據作為輸出,即取2013年1—12月的數據作為輸入,2014年1月的故障數據作為輸出。應用2013年1月—2018年12月數據生成60組訓練序列,其中隨機選取48組序列進行神經網絡的訓練,剩下的12組序列進行模型檢驗。
2.2.2 網絡參數設置
采用每相鄰12個月的數據預測下1個月的數據,故輸入層節點數為12,輸出層節點數為1。
隱含層節點數通過經驗公式確定:
(9)
式中:h為隱含層節點數,通過試探性實驗確定h=9;m、n為輸入層與輸出層節點個數,m=12,n=1;a為1~10之間常數。
在BP神經網絡中,激活函數的選擇對BP網絡預測結果有直接影響。隱含層激活函數經試驗確定為雙曲正切S型傳輸函數,輸出層的激活函數為線性傳輸函數。設置目標誤差為0.001,最大訓練周期為1 000,學習速率為0.01,當誤差小于0.001時學習終止。構建3層BP神經網絡對空調系統故障數進行建模并預測。
經過數據預處理并確定網絡參數后,使用MATLAB軟件建立BP神經網絡預測模型,采用的算法為Levenberg-Marquardt算法,經過5次迭代訓練后達到學習終止條件。
利用建立的X12-ARIMA模型及BP神經網絡模型,計算得到2種模型的殘差。按公式依次計算出殘差序列的方差為4 339.455 7、12 410.306 6,根據方差倒數法得到兩種模型的權重依次分別為0.740 924 34、0.259 075 66,該變權組合模型的表達式為:
Xt=0.740 924 34X1t+0.259 075 66X2t
(11)
式中:Xt為組合模型的擬合值,X1t為X12-ARIMA模型的擬合值,X2t為BP神經網絡模型的擬合值。
由X12-ARIMA模型與BP神經網絡模型預測結果可知,分別使用單一模型,預測誤差較大。為此,將X12-ARIMA模型的擬合值與空調系統故障數實際值作差求得殘差序列,并將殘差序列作為BP神經網絡的輸入。選取每相鄰12個月的數據作為輸入,下1個月的數據作為輸出。
經過大量實驗,最終取隱層節點數為5,目標誤差為0.001,學習率為0.01,最大訓練周期為1 000,當誤差小于0.001時學習終止。隱層激活函數采用對數S型傳遞函數,輸出采用線性函數。采用MATLAB計算殘差BP模型的擬合值與預測值。
將X12-ARIMA模型的擬合值和殘差BP神經網絡模型的擬合值與預測值分別相加得到改進X12-ARIMA-BP模型的擬合值與預測值。
4種模型擬合預測后的預測結果如表1,擬合結果與預測結果對比如表2。

表1 4種模型預測結果Table 1 Prediction results of four kinds of models

表2 4種模型擬合與預測結果對比Table 2 Comparison of fitting and prediction results of four kinds of models
由表1、表2可知:
1)不同模型的擬合結果表明,BP神經網絡模型擬合效果最差,平均絕對誤差百分比為22.87%,平均絕對誤差為11.1764。除BP神經網絡模型外,其余3種模型擬合結果相近,其中X12-ARIMA平均絕對誤差最小,為6.138 2,均方誤差也最小為72.324 3,X12-ARIMA-BP模型的平均絕對誤差百分比最小為13.41%。綜合來看擬合精度最高的是X12-ARIMA模型,平均絕對誤差百分比為13.98%,其次為X12-ARIMA-BP模型。
2)從預測對比結果看,X12-ARIMA-BP模型的平均絕對誤差百分比與平均絕對誤差最小,其平均絕對誤差百分比為18.54%,平均絕對誤差為6.868 6,均方誤差為78.433 2,略大于變權組合模型。相比其他3種預測模型,X12-ARIMA-BP模型的預測效果最佳。
對軌道交通線空調系統故障數進行分析與預測,有助于提高軌道交通公司的預防性維修水平,也有助于合理制定維修策略和零件采購方案,從而有效控制成本。針對軌道交通線空調系統故障數時間序列的預測問題,在分析故障數的周期性波動規律及變化趨勢的基礎上,結合季節調整法建立X12-ARIMA模型并進行了時間序列的擬合與預測,在此基礎上采用BP神經網絡模型對X12-ARIMA模型的殘差序列進行擬合并預測,將兩個模型預測值相加得到改進X12-ARIMA-BP模型的預測值。以重慶軌道交通3號線空調系統故障時間序列進行模型參數標定,利用構建的改進X12-ARIMA-BP模型進行預測,并與X12-ARIMA模型、BP神經網絡模型、ARIMA-BP變權組合模型的預測效果進行對比。實例分析得出,改進X12-ARIMA-BP模型的平均絕對誤差與平均絕對誤差百分比均為最小,因此作為預測未來短期跨座式單軌空調系統故障數的模型,該模型有效。
改進的X12-ARIMA-BP模型能夠較好地預測未來短期跨座式單軌空調系統故障數,但仍存在一定的局限性。該模型的平均絕對誤差百分比為18.54%,預測精度尚有提升空間,且由于原始數據基數較小,導致一部分的相對誤差較大,降低了整體精度,今后可以考慮采用其他模型對殘差進行優化,以提升模型的預測精度。