秦喜文,邢婷婷,董小剛,高中華,張 瑜,劉媛媛
(1.長春工業大學研究生院,吉林 長春 130012;
2.長春工業大學基礎科學學院,吉林 長春 130012;
3.長春工業大學汽車工程研究院,吉林 長春 130012)
?
基于EEMD的公路客流量波動性與周期性研究
秦喜文1,2,3,邢婷婷2,董小剛2,高中華2,張瑜2,劉媛媛2
(1.長春工業大學研究生院,吉林 長春 130012;
2.長春工業大學基礎科學學院,吉林 長春 130012;
3.長春工業大學汽車工程研究院,吉林 長春 130012)
[摘要]為實現對公路客流量進行快速且準確預測,提出了將公路客流短期預測的總體平均經驗模態加以分解的EEMD方法.通過將原始時間序列分解為多個固有模態函數與趨勢項之和,對多個固有模態函數進行周期性和波動性分析,揭示出各階模態間的周期性變化規律以及不同時間段內的波動特點,進而證明了總體平均經驗模態分解方法的合理性與有效性.
[關鍵詞]總體平均經驗模態分解;固有模態函數;波動性;周期性
隨著我國經濟的迅猛發展和城鄉一體化建設的全面展開,公路客運因其安全、快捷、舒適、高效和高質量全程服務等優越性,日漸成為大眾出行的一個重要選擇.[1]因此,研究公路客流的客流量特點及發展趨勢并討論其周期性和波動性,對客運公司制定運營計劃、提高客運服務質量、增強公路客運的市場競爭力等方面具有重要的現實指導作用.公路交通雖然具有載客量大、速度快、安全性高等優勢,但同時也存在一定的不足,如運營環境的特殊、運營空間的有限和管理效能低等,這些都會導致客流量不穩定.本文根據短期公交客流量預測的非線性、非平穩性以及影響因素較多的特點,提出了一種基于EEMD的研究方法,并利用該方法對公路客流量的波動性和周期性進行分析.
1EEMD方法介紹
HHT方法是由N.E.Huang提出的一種適應性更廣且能處理復雜非線性和非平穩信號的分析方法,即基于經驗模態分解(EMD)的一種時頻分析方法.此方法與Fourier分析相比,HHT方法可以處理非平穩和瞬態問題;與小波分析相比,吸收了小波變換多分辨的優勢,卻避免了基函數的選擇問題.同時具備比現有所有信號處理方法更強的局部特性,因此成為一種先進有效的信號分析處理方法,其本質就是對信號進行平穩化處理.[2]然而EMD在處理信號的過程中,也存在著由于算法的局限和信號的間斷等因素導致出現模態混疊現象,使得分析得到的效果并不理想,為解決這個問題,Huang等[3]提出了對EMD方法的改進,即結合噪聲輔助分析方法的總體平均經驗模態分解方法,簡稱EEMD方法.本研究主要基于EEMD方法對客流量其波動性和周期性特點進行分析.
HHT方法的核心是EMD分解,其過程是將任意復合信號分解成有限個固有模態函數(IMF)之和,關鍵是如何把一個非平穩序列分解為有限個IMF分量和一個趨勢項,同時把本征模函數分量定義為在信號中加入了有限振幅的白噪聲之后的多次集成的均值.本研究采用的是對EMD方法改進后的EEMD方法,即總體平均經驗模態分解方法.總體來說就是在原信號中加入若干次均勻分布的高斯白噪聲,目的是將分解的IMF丟失的尺度補全,再各自進行EMD處理,最后求平均的一種全局化方法.此方法將加入的白噪聲互相抵消,使分解的結果不僅保留原序列的信號信息,而且很大程度上克服了模態混疊,使分解在物理上唯一.[3]
EEMD方法具體步驟如下:
(1)通過給待分析信號x(t)中加一組白噪聲w(t),構成信噪混合體
X(t)=x(t)+w(t).
(2)對信噪混合體X(t)進行EMD分解,分解成各個IMF分量的組合

(3)給待分析信號中加入不同的白噪聲wi(t),并重復以上兩步:
Xi(t)=x(t)+wi(t);
分解后得到各自的IMF分量組

(4)對得到的IMF組合下相對應的IMF求均值

其中N表示整體的個數.從而最終的分解結果為

在待處理的信號上附加一個白噪聲后將具有如下特征:
(1) 白噪聲具有零均值特性,即附加噪聲的次數足夠多時,噪聲就可以達到被消除的效果.
(2) 白噪聲的加入和多次計算均值可以使得最終得到的結果與真實信號相當.
2實證分析
客流量是典型的非線性、非平穩的時間序列,針對這一情況我們處理數據的方法應與普通信號處理方法有所不同,本研究嘗試將EEMD方法應用于短期客流量數據的處理和分析中.
2.1公路客流量的EEMD分解
本文的研究數據主要采用近10年的公路客流量數據,數據來源于長春市客運總站.該數據基本上反映了公路客流的變動情況.
通過對2003—2012年間的客流量數據進行EEMD分解和分析,發現第50個數據明顯高于其他數據.根據長春市公路客流的原始數據和異常點的定義可知,可確定該點為異常點.一般而言,異常點的出現是由于系統受到外部或內部非正常的干擾所產生的,它會帶來虛假的信息,但也提供關于系統穩定性、靈敏度等信息,因此我們不能忽視異常點.在處理數據時,應剔除高度異常的異常值,再利用現有變量的信息,對異常值(缺省值)進行填補.但當剔除異常值造成了數據的殘缺時,就違背了時間序列“順序的重要性”原則,從而導致結果的不準確.[4]為此,當序列中存在缺省值時,一般用插值法來補足缺省值,插值過程所遵循的原則是以達到最理想的插值效果為目的而進行方法的選擇.本研究利用三次樣條插值函數對數據進行插值,替換掉第50個異常值數據,經過預處理后的長春市公路客流量的時序圖,如圖1所示.

圖1 長春市公路客流量時序圖
對2003年1月至2012年12月公路月客流量,總計120個數據進行EEMD分解,共得到5階固有模態函數和一個剩余的趨勢項,如圖2所示(圖2中各圖的縱坐標均表示客流量,單位為萬人次).通過EEMD方法對公路客流量時間序列進行處理,將原始序列分解,得到若干個不同尺度的分量,對其進行研究可以準確地分析出公路客流量的波動性與周期性.[5]

圖2 固有模態函數(IMF)和趨勢項(TREND)
從圖2中可以看出分解后的各階IMF頻率由高到低依次排列,分解后的剩余趨勢項是單調的.具體來講:IMF1的高頻振蕩能夠很好地刻畫出客流量的波動細節,與原序列的波動趨勢大體一致;IMF2和IMF3的振動頻率依次降低,雖然在IMF2中反映出2006年末到2007年初有較大波動,但從IMF3中可以看出這一階段客流量整體表現仍為上升趨勢;IMF4和IMF5的振動頻率顯然低于圖示的IMF1—IMF3,體現出波動尺度較大的特征,其在2008年末出現較大幅度波動;最后的剩余趨勢項是一條基本呈上升趨勢的曲線,它并不直觀地反映客流量的波動情況,但它可以體現數據的整體水平.[6]
EEMD方法把公路客流量數據分解為不同尺度和頻率的固有模態函數IMF,但考慮到在不同時間尺度上公路客流量的較大差異以及每個IMF在不同時期的波動對于總客流量的貢獻不同,我們需要一個能夠衡量各階IMF相對于EEMD分解前總客流量所占波動比率的量,因此引進波動率的表述,本文將波動率定義為任意時刻IMF的絕對值與原始信號的比值,即


經過EEMD分解重構后的IMF1與IMF2的波動和波動率曲線如圖3所示.從圖3中我們可以看出,在2003年初到2012年末這10年間,有兩個時間段的波動幅度比較大,分別為每年的11月到次年的2月和每年的6月到8月.引起較大波動的主要原因是我國春節假期與學生的寒暑假.這說明我們的計算結果與實際情況基本吻合.

圖3 IMF1和IMF2的波動和波動率曲線
2.2公路客流量的各階IMF的周期性分析
這里采用平均周期法計算經EEMD分解后的各IMF周期,得到的各階IMF振蕩周期可以更直觀地觀察到客流量的周期性變化規律.平均周期法采用如下定義

其中N1為公路客流量時間序列中的數據數目總量,N2為極小值點或極大值點的數目.即通過統計波峰和波谷的數量得到公路客流量的振蕩周期,詳見表1.從表1中我們不難發現各分量的平均振蕩周期大致呈增長趨勢,其中3.333,6.316和13.333分別為IMF1,IMF2,IMF3所得到的平均周期.由此可大致反映出在一個季度,半年和一年時間尺度上的波動趨勢.[7]

表1 各階IMF的周期
3總結
EEMD方法是基于信號局部特征,把復雜的信號函數加以分解的過程,是一種自適應的時頻局部化分析方法.本文將EEMD方法應用在具有非線性、非平穩性特征的公路客流量分析中,將客流量數據分解為有限個固有模態函數和一個趨勢項.通過對分解后的各階IMF進行波動性與周期性分析,運用波動率來衡量各階IMF不同時期的波動對于總客流量的影響,運用各階IMF的周期計算出平均周期.這體現了EEMD方法可以有效地提取原始時間序列中不同周期的分量,揭示各模態在不同時間尺度上的周期規律.
[參考文獻]
[1]楊柳靑.基于EEMD的航空客流需求預測技術及其應用研究[D].武漢:華中科技大學,2009:15-21.
[2]HUANG N E,SHEN Z,LONG S R,et al. The empirical mode decomposition method and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J]. Proc R Soc Lond A,1998,454:903-995.
[3]WU Z,HUANG N E. Ensemble empirical mode decomposition:a noise-assisted data analysis method[J]. Advances in Adaptive Data Analysis,2009,1(1):1-41.
[4]許廷霆,李克平.應用EMD方法分析交通流量的動態特性[J].科學技術與工程,2009,9(11):25-32.
[5]HUANG N E,SHEN S P. The Hilbert-Huang transform and its applications[M]. Singapore:World Scientific Publishing Company,2005:289-302.
[6]蔡赟姝,盧志明.基于經驗模態分解的上證綜合指數時間序列分析[J].上海大學學報(自然科學版),2012,18(4):3-6.
[7]趙泓揚,劉立生,韓慶邦.一種基于HHT和神經網絡的智能軸承狀態監控系統[J]. 東北師大學報(自然科學版),2013,45(2):73-78.
(責任編輯:李亞軍)
The volatility and periodicity of highway passenger volume based on ensemble empirical mode decomposition
QIN Xi-wen1,2,3,XING Ting-ting2,DONG Xiao-gang2,GAO Zhong-hua2,ZHANG Yu2,LIU Yuan-yuan2
(1.Graduate School,Changchun University of Technology,Changchun 130012,China;2.School of Basic Sciences,Changchun University of Technology,Changchun 130012,China;3.Automotive Engineering Research Institute,Changchun University of Technology,Changchun 130012,China)
Abstract:In order to achieve the forecasting of the highway passenger volume quickly and accurately, the volatility and periodicity of the highway passenger volume is studied based on ensemble empirical mode decomposition(EEMD) method, which is very important for establishing and optimizing the passenger highway operation plan. The original time series is decomposed into a series of intrinsic mode functions (IMF) and a trend item. By analyzing the volatility and periodicity of each function,the different volatility features of the highway passenger volume with different scales are shown, which implies the volatility characteristics of the passenger volume in different period and the periodic property in different IMF. Consequently,it can be proved that the rationality of the EEMD method is feasible and effective.
Keywords:ensemble empirical mode decomposition;intrinsic mode functions (IMF);volatility;periodicity
[中圖分類號]O 29[學科代碼]110·71
[文獻標志碼]A
[作者簡介]秦喜文(1979—),男,博士,副教授,主要從事HHT理論與應用研究;通訊作者:董小剛(1961—),男,教授,博士生導師,主要從事應用統計研究.
[基金項目]國家自然科學基金資助項目(11301036,11226335);吉林省教育廳科研項目(2014第127號,2013第142號).
[收稿日期]2014-05-21
[文章編號]1000-1832(2016)01-0044-05
[DOI]10.16163/j.cnki.22-1123/n.2016.01.011