Combined Prediction Based on EMD for Instrument Stability
程雙江 李世平 鄔肖敏
(第二炮兵工程大學,陜西 西安 710025)
基于EMD的儀器穩定度組合預測
Combined Prediction Based on EMD for Instrument Stability
程雙江李世平鄔肖敏
(第二炮兵工程大學,陜西 西安710025)
摘要:為更好地把握儀器的性能變化規律,規避其可能帶來的各種風險,將預測理論應用到儀器穩定度預測中,建立了一種基于EMD-SVM的穩定度組合預測模型。首先利用EMD方法對穩定度數據進行分解,然后對分解得到的數據選擇一種預測模型進行預測,最后再把所有這些分解數據的預測結果輸入到SVM中進行組合預測。通過與移動平均模型、自回歸積分滑動平均(ARIMA)模型和線性組合預測模型的預測結果相比較,驗證了該方法的有效性。
第一作者程雙江(1989-),男,現為第二炮兵工程大學儀器與科學技術專業在讀碩士研究生;主要從事預測方面的研究。
關鍵詞:儀器穩定度經驗模態分解(EMD)支持向量機(SVM)組合預測預測精度
Abstract:In order to better grasp the regular pattern of the performance variation of the instruments, and to evade various risks may occur, the prediction theory is applied in the prediction of instrument stability, and the combined prediction model based on EMD-SVM is built. Firstly, the data of stability are decomposed by adopting EMD method; then a prediction model is selected from the data obtained by decomposition for predicting; finally all the predicted results of decomposed data are put into SVM for combined prediction. The comparison of the predictive results from moving average model, autoregressive integrated moving average (ARIMA) model and linear combination forecasting model, proves the effectiveness of this method.
Keywords:InstrumentStabilityEmpirical mode decomposition(EMD)Support vetor machine(SVM)Combined predictionPrediction accuracy
0引言
儀器作為人類認識世界必不可少的工具,如今已被廣泛應用于我們生活的各個領域。但是儀器在給社會帶來巨大利益的同時,其自身也會出現一系列的問題,如果不注意這些問題,帶來的損失同樣不可估量。因此,依據儀器性能指標參數的歷史數據,對其未來可能的發展趨勢作出預測就顯得格外重要。對于如今的高精度智能儀器而言,穩定度指標已經逐步成為用戶最關心的話題,因此本文對儀器穩定度數據進行研究,具備更大的工程與現實意義。
目前,關于預測的研究很多[1-3],但主要還是組合預測,比如基于神經網絡的組合預測、基于支持向量機(support vector machine,SVM)的組合預測等。其中,SVM在解決小樣本、過擬合和維數災變等問題中具有不可比擬的優勢[4-6],因此本文選擇了基于SVM的組合預測模型對穩定度數據進行預測。首先利用經驗模態分解(empirical mode decapmosition,EMD)方法對穩定度數據進行分解,然后對分解得到的3種不同類型的數據分別采用多項式模型、BP神經網絡模型和自回歸積分滑動平均(autoregressive integrated moving average,ARIMA)模型進行單獨預測,最后再將單獨預測的結果輸入到SVM中進行組合預測,最終建立了基于EMD-SVM的組合預測模型。
1EMD方法和SVM簡介
EMD是將非平穩、非線性信號分解成一系列表征信號特征時間尺度的IMF,使得每個IMF是單分量的幅值或頻率調制信號。簡單來說,就是將原始信號中不同尺度的波動或趨勢項逐級分解,產生一系列具有不同特征尺度的數據序列,每一個序列就是一個IMF。
相比于小波分解等其他信號分解方法而言,EMD在信號分解過程中分解的基函數是不確定的。EMD依據的是信號本身的局部信息特征進行自適應分解,不需要預先設定基函數,也無需信號的任何先驗知識。因此,EMD具有更好的自適應性,在處理非線性、非平穩信號方面具備更大優勢[7-8]。對信號x進行EMD分解的具體步驟如圖1所示,其實質就是一個篩選過程,通過一個停止準則對IMF進行不間斷的篩選。

圖1 EMD流程圖
支持向量機(SVM)是基于統計學習理論發展起來的一種新型機器學習方法,它建立在統計學習理論的VC維和結構風險最小化的理論基礎之上。由于SVM在一定程度上克服了“維數災難”和“過學習”等困難,并且在解決小樣本問題上具有不可比擬的優勢,因此目前SVM已被廣泛應用于模式識別、函數逼近、數據挖掘和非線性系統控制等領域中[9-11]。
SVM預測的本質是通過非線性變換,將非線性問題映射到高維特征空間中,從而轉換為線性問題進行求解。
SVM預測可表示為如下二次規劃問題。

(1)
約束條件:
(2)
式中:n為樣本總數;ξi,ξi*為松弛因子;C為懲罰因子。
考慮到直接對此式進行求解存在一定的困難,為此引入拉格朗日因子,將其轉化為凸二次規劃問題求解。

(3)

那么SVM函數就可以表示為:
(4)
引入核函數K(xi,xj),將其轉化到高維特征空間中,用K(xi,xj)代替ψ(xi)ψ(xj),則式(4)可以轉化為式(5)進行求解。
(5)
這樣就實現了數據從低維到高維之間的數據轉換(非線性映射),達到樣本學習的目的。
2基于EMD-SVM的組合預測原理
假設EMD分解后得到的信號為IMF1、IMF2和RES,那么基于EMD-SVM的原理圖如圖2所示。

圖2 EMD-SVM組合預測原理圖
組合預測方法是建立在多種單一預測模型基礎之上的。組合預測的理論已經證明,多種單一模型的組合在一定的條件下能更有效地改善模型的擬合能力,提高預測精度[12]。而要想提高最終的組合預測模型的預測精度,單一模型的預測好壞是前提,因此必須首先選擇恰當的單一模型進行預測。
要建立基于EMD-SVM的組合預測模型,首先需要采用EMD方法對原始穩定度數據進行分解,得到相對較為簡單的分解數據,比如說趨勢項、周期項、隨機項等;其次再針對這些分解得到的數據分別選用精度較高的預測方法;最后再將這些分解信號的單一模型預測結果輸入到SVM中進行非線性組合,實現基于EMD-SVM的組合預測。
如圖2所示,假設經過EMD分解后得到的信號有3個,那么就分別采用一種預測方法進行針對性的預測,得到的預測結果分別為y1、y2、y3。非線性組合的預測結果可以表示為:
y=F(y1,y2,y3)
(6)
式中:F為SVM組合預測函數。
這樣就基本實現了針對儀器穩定度數據這類非線性、非平穩時間序列的分解,單一預測到組合預測的整體過程。
3基于EMD-SVM的儀器穩定度預測
計量標準儀器不僅需要作為檢定其他儀器設備的依據,作為中間環節,還需要將測量結果在允許的范圍內溯源到國家計量基準。因此,對計量標準儀器進行預測研究具備更大的工程與現實意義。同時,鑒于高穩時頻晶振的穩定度指標在使用的過程中尤為重要,本文的仿真試驗采用的是某計量站高穩時頻晶振計量標準儀器的穩定度數據。
數據來源于該儀器每年一次的上級單位檢定數據(作為第一季度數據),以及兩次檢定期間該計量站計量員利用更高精度的計量標準每季度進行一次的檢定數據(第一季度除外)。從2002年到2012年總共44個數據點,以2002~2011年的40個數據點進行穩定度擬合,建模預測2012年4個季度的穩定度值,然后進行結果比對分析,如表1所示。

表1 高穩時頻晶振2002~2012年穩定度值
首先進行EMD分解,分解結果如圖3所示。EMD分解得到了IMF1、IMF2和RES三個分量,其中IMF1和IMF2為IMF分量,RES為剩余分量。經過計算得到分解造成的各點的累計誤差和為-1.77×10-15,相比于預測誤差可以忽略不計。從圖3可以看出,IMF1變化規律較為復雜,因此預測起來也相對比較困難,需要著重考慮。最終通過比較選擇了效果較好的ARIMA模型進行預測。IMF2為近似周期項,預測較為簡單,本文采用的是BP網絡對其進行預測。RES可以認為是趨勢項,預測更為簡單,直接選用傳統的多項式模型進行預測。

圖3 EMD分解結果
首先對IMF1進行預測,然后再依次對IMF2和RES進行預測。對IMF1進行預測時,由于變化規律比較復雜,采用ARIMA模型進行預測。首先需要進行去平穩化差分處理,然后再進行模型的定階,模型的定階通過AIC準則確定,最終設定的模型參數(p,d,q)為(1,1,3),用前40個數據點進行擬合,最終得到的擬合曲線如圖4所示。從圖4可以看出,ARIMA模型對IMF1擬合效果相對較好。

圖4 IMF2擬合
對IMF2和RES進行建模,采用BP網絡模型和多項式模型得到的擬合曲線分別如圖5和圖6所示。從圖5和圖6可以看出,擬合精度更高。

圖5 IMF2擬合曲線

圖6 RES擬合曲線
采用ARIMA模型、BP網絡模型和多項式模型分別實現了IMF1、IMF2和RES的建模擬合。將建立的模型用于后4個點數據預測,與EMD分解后得到的IMF1、IMF2和RES后4個數據點的實際值進行比較,結果如表2所示。

表2 單一模型后4個數據點預測結果
從表2可以看出,單一模型預測效果較好,僅僅對IMF1進行預測時預測誤差相對稍大,因此可以將3種單一模型預測結果作為輸入,利用RBF核函數SVM進行非線性組合預測,采用遺傳算法(genetic algorithm,GA)對SVM參數進行尋優,得到的最優懲罰因子C和核函數參數δ分別為88.35和11.47,那么最終建立的基于SVM的非線性組合預測結果如圖7所示。圖7中,前40個為擬合數據,后4個為預測數據。

圖7 基于EMD-SVM的組合預測
從圖7可以看出,EMD方法預測效果較好,精度較高。為了更直觀地觀測其預測效果,將2012年后4個季度的穩定度預測值以具體數值展現。同時,為了驗證該EMD-SVM預測模型的有效性,分別與單一的移動平均模型、ARIMA模型和線性組合預測模型的預測結果進行了比較,結果如表3所示。

表3 幾種模型預測結果
以平均相對誤差作為衡量標準,經過計算,4種模型的平均預測相對誤差分別為26.5%、2.94%、1.97%和1.4%。可以看出,組合預測模型相對與單一預測模型而言,預測精度得到了大幅提升,而基于EMD-SVM的非線性組合預測模型相比線性組合預測模型,精度更高。因此,可以認為對高穩時頻晶振儀器穩定度數據進行預測時,采用EMD-SVM的非線性組合預測模型效果較好。
4結束語
基于儀器設備在現實生活中發揮的巨大作用,為了規避其可能帶來的風險,本文就儀器穩定度數據展開分析,結合歷史數據對其可能出現的規律進行預測,
實現了基于EMD-SVM的儀器穩定度非線性組合預測。仿真結果表明,該方法預測效果較好、精度較高。對儀器穩定度數據的預測,對于指導企業生產、避免各類事故發生等具有重大的現實意義,但還有待于進一步的研究探索。
參考文獻
[1] 高寧,崔希民,高彩云.灰時序GM-AR模型在建筑物沉降變形預測中的應用[J].測繪科學,2013,38(1):139-141.
[2] 華靜,艾莉,程加堂.神經網絡組合模型在大壩位移預測中的應用[J].科學技術與工程,2013,2(4):1091-1093.
[3] 周偉萍,王豐效.灰色DNGM(1,1)預測模型及其優化[J].計算機工程與應用,2013,49(10):28-31.
[4] 甘旭升,端木京順,叢偉,等.基于ARIMA與SVM的飛行事故組合預測方法[J].中國安全科學學報,2011,21(7):79-81.
[5] 陳濤.基于DE-SVM非線性組合預測模型的研究[J].計算機工程與應用,2011,47(13):33-36.
[6] 朱莎,劉曉.小波分析和支持向量機組合法預測應急血液需求研究[J].中國安全科學學報,2013,23(5):166-170.
[7] 余偉凱.EMD時頻分析方法的理論研究與應用[D].秦皇島:燕山大學,2006.
[8] 王婷.EMD算法研究及其在信號去噪中的應用[D].哈爾濱:哈爾濱工程大學,2010.
[9] 張偉,李泓儀,蘭書梅,等.GA-SVM對上證綜指走勢的預測研究[J].東北師范大學學報,2012,44(1):55-59.
[10]顧亞祥,丁世飛.支持向量機研究進展[J].計算機科學,2011,38(2):14-17.
[11]張捍東,張莉,湯敏.云模型優化LSSVR的短期電力負荷預測[J].自動化儀表,2013,34(11):1-5.
[12]陳華友.組合預測方法有效性理論及其應用[M].北京:科學出版社,2008.
中圖分類號:TH71
文獻標志碼:A
DOI:10.16086/j.cnki.issn1000-0380.201501007
修改稿收到日期:2014-06-11。