蔡赟姝, 盧志明
(上海大學上海市應用數學和力學研究所,上海200072)
中國的證券市場,以1990年12月上海證券交易所和1991年4月深圳證券交易所開始營業為標志,已走過了20多年的發展歷程.作為一個新興的發展中市場,其市場結構、市場規則等方面還不夠成熟、規范.證券市場的穩定對于金融市場乃至整個國民經濟的平穩運行都具有非常重要的意義,因此,研究股票指數的變化規律及波動特性,無論是對政府部門還是對投資者都具有重要意義.股票指數是非線性、非平穩的時間序列.我國股市數據具有時間序列短、隨機因素多、價格波動變化劇烈等特點[1].這些特點對金融時間序列的分析提出了較高的要求,在其實證研究中需要一種更為有效的方法或工具.
近年來,金融領域的跨學科研究受到了廣泛關注,許多學者將數學、物理學以及工程等領域的理論、方法、技術等運用于金融時間序列的研究,并取得了豐碩的成果[2-3].信號分析技術作為其中的一種有力工具,已被運用于金融時間序列的分析中.經驗模態分解(empirical mode decomposition,EMD)方法是Huang等[4]于1998年首次提出的一種新的信號處理方法.1999年,Huang等[5]又對該方法進行了改進.與以往的信號分析方法不同,EMD方法并不預設基函數,而是預先選擇好判據,基于信號本身所包含的特征尺度進行分解,得到有限階內模函數(intrinsic mode functions,IMFs).EMD方法對數據沒有平穩性和線性的要求,具有自適應性的特點,能更好地保留原有信號的特征.該方法是對傳統信號分析方法的發展和突破,已在自然科學、工程等領域引起了廣泛的關注[5-7],并在非線性、非平穩數據處理中得到了更符合物理實際的解釋和說明.2003年,Huang等[8]首次將該方法引入金融時序的分析.此后,國內外一些學者也陸續嘗試將該方法用于石油價格預測[9]、經濟增長波動[10]、股指日收益率[11]等金融領域的研究,取得了較好的效果.本研究主要將該方法用于上證綜合指數(Shanghai composite index,SCI)時間序列的分析.對于上證綜合指數已有較多的研究,如自回歸(autoregressive,AR)模型,自回歸滑動平均(autoregressive moving average,ARMA)模型、單位根在內的差分模型以及自回歸條件異方差(autoregressive conditional heteroskedasticity,ARCH)模型、廣義自回歸條件異方差(generalised autoregressive conditional heteroskedasticity,GARCH)模型等[12-13],也獲得了較好的波動特點和統計結果,但這些分析方法往往是在單一尺度上進行的,而基于EMD方法的多尺度分析更能捕捉到上證綜合指數不同尺度的波動特點和統計特性.
內模函數描述性定義[4-5]由以下 2點給出:①極值點的個數和過零點的數目相等,或者最多相差為1;②在任意一點,由極大值和極小值構成的包絡的平均值為0.為了從原始信號中分解出內模函數,Huang等[4]給出了經驗模態分解方法,過程如下:①找到信號x(t)所有的極值點;②用3次樣條曲線擬合出上下極值點的包絡線emax(t)和emin(t),并求出上下包絡線的平均值,即m(t)=(emax(t)+ emin(t))/2,并在x(t)中減去它,即h(t)=x(t)-m(t);③根據預設判據,判斷h(t)是否為IMFs,如果不是,則以h(t)代替x(t),重復步驟①和步驟②,直到h(t)滿足判據,則h(t)即為需要提取的內模函數Ck(t);④每得到一階IMFs,就從原信號中將其扣除,重復以步驟①~步驟③,直到信號最后剩余部分rn(t)為單調序列或者常值序列.
經過EMD方法分解,將原始信號x(t)分解成了一系列IMFs以及剩余部分的線性疊加,即

式中,Ci(t)為第i階IMF.Huang等[4]將這樣的處理過程形象地比喻為“篩”過程(sifting process).最后,原始數據序列可用這些IMFs分量以及一個均值或趨勢來表示.由于每一個IMFs分量代表一組特征尺度的數據序列,“篩”過程實際上是將原始數據序列分解為各種不同特征波形的疊加,每一個IMFs分量既可以是線性的也可以是非線性的.圖1為IMFs例子.

圖1 IMFs例子Fig.1 Example of IMFs
股票指數是典型的非線性、非平穩的金融時間序列,尤其是處于成長期的我國股市數據,更具有時間序列短、隨機因素多、價格波動變化劇烈等特點.股票指數時間序列分析方法應與普通的信號處理方法有所不同.因此,本研究嘗試將EMD方法用于上證綜合指數日收盤價數據的處理和分析.
本研究數據主要采用上證綜合指數(000001).該指數從總體上反映了上海證券交易所上市股票的價格變動情況.數據來源于新浪財經,主要針對1994年之后上證綜合指數日收盤價數據、典型的上漲和下跌時間段的日收盤價數據進行EMD分解及分析.
對1994年1月3日—2010年9月30日上證綜合指數,共4 074個交易日的日收盤價格數據進行EMD分解,共得到了9階內模函數和剩余項,如圖2所示.可以發現,IMFs按頻率由高到低排列,分解得到的剩余部分是單調的趨勢項.因此,用EMD方法對金融時間序列進行處理,可以將原時間序列分解為不同尺度的分量,進而通過對分量的研究達到研究原序列的目的.

圖2 上證綜合指數4 074個交易日收盤價格數據的EMD分解結果Fig.2 EMD results of closing price data of SCI(4 074 trading days)
IMF1的高頻振蕩能很好地刻畫上證綜合指數的波動細節.直觀上可以看出,原序列的波動都能從IMF1中找到.可見,IMF1反映的是上證綜合指數日線的波動細節.IMF2,IMF3能刻畫上證綜合指數日線頻率較高的波動.IMF4,IMF5能刻畫上證綜合指數日線中的高頻波動,但與IMF1~IMF4相比,其反映的波動細節要少.同時發現,在2006年下半年附近的波動幅度比之前的波動要明顯.IMF6~IMF9各模態的波動頻率低于IMF1~IMF5,其波動尺度也較大,在2007年底2008年初附近有較大幅度的波動.觀察剩余項,發現其并不反映上證綜合指數日線的波動,而是一條反映大體上升趨勢的曲線.


1994年1月3日—2010年9月30日上證綜合指數日收盤價數據,經EMD分解重構后的波動和波動率如圖3所示.可見,在1994—1996年,波動幅度比較大,其原因主要是當時我國股市正處于起步階段,市場較不穩定,加之我國證券市場現行的漲跌停板制度是從1996年12月26日才開始實施的.這在先前僅僅通過模態重構的絕對波動圖中是無法發現的.在2006—2009年期間,波動幅度也比較大.在這期間,中國股市經歷了從未有過的大漲和大跌,2007年10月中旬一度達到6 000多點的高位.這一過程無論在波動率的圖中還是在各階模態中都有所體現,在此期間,股市具有較大的能量.
對上證綜合指數1994年1月3日—2010年9月30日的日收盤價格數據進行EMD分解,并對分解后的各階IMFs進行白噪聲顯著性檢驗[14],以判斷是否存在只包含噪聲而無其他信息的模態,結果如圖4所示,其中虛線為白噪聲理論線,實線為95%置信水平線,9個點分別代表實證數據IMF1~IMF9的檢驗值.可見,這些值均在實線上方,表明在95%置信水平下,各階IMFs與白噪聲相比是顯著的,上證綜合日指數經EMD分解后得到的各階IMFs都不是白噪聲,包含有一定的實際物理(經濟學)信息.

圖3 上證綜合指數日收盤價格數據經EMD分解重構后的IMF1~IMF2的波動和波動率Fig.3 Volatility and variability of closing price data of SCI based on the IMF1~IMF2

圖4 各階IMFs的白噪聲顯著性檢驗Fig.4 Significance test of IMFs of white noise
對各階IMFs進行基本統計分析,發現樣本偏斜度基本對稱,峰度絕大部分均大于3.與正態分布相比,各階模態呈現“尖峰厚尾”的現象.這一結果的意義在于,大致確定了上證綜合指數各不同頻率數據的分布形狀.
由于t分布的概率密度函數比正態分布具有更厚的尾部,因此,嘗試用t分布來描述各階IMFs的厚尾特性.自由度為n的t分布的概率密度函數為

繪制Quantiles-Quantiles(Q-Q)圖對數據進行擬合,實證數據根據理論分布繪制出的點應近似為一條直線,任何偏離這條直線的點都是偏離了該規定的分布.圖5為用正態分布繪制的IMF1和IMF2的Q-Q圖,可見明顯不在一條直線上.圖6為自由度n=3的t分布(記為t(3))的Q-Q圖,可見,除了端部,幾乎都在一條直線上.其他各階IMFs也有類似結果.通過對比Q-Q圖可以發現,用t(3)分布擬合好于用正態分布擬合.

圖5 基于正態分布的上證綜合日指數IMF1和IMF2的Q-Q圖Fig.5 Q-Q plot of IMF1 and IMF2 of SCI based on normal distribution
通過觀察上證綜合指數的EMD分解結果,可以發現,上證綜合指數及其IMFs的變動有一定的周期性,并且不同的IMFs反映了不同時間尺度上的波動信息.例如,對上證綜合日指數收盤價數據經EMD分解后的各階IMFs進行重構,通過IMF3+IMF4+ IMF5+IMF6+IMF7+IMF8+IMF9+RES所得的曲線(見圖7(a))與計算得到的周平均指數曲線(見圖7(b))相似;通過 IMF5+IMF6+IMF7+IMF8+ IMF9+RES所得的曲線與計算所得的月平均指數曲線類似.這表明,EMD方法能夠提取金融時序中不同波動周期的分量.研究股市波動的各個周期,了解上證綜合指數的各種周期特征,無論是對于投資者還是政府部門都具有非常大的現實意義.

圖6 基于t(3)分布的上證綜合日指數IMF1和IMF2的Q-Q圖Fig.6 Q-Q plot of IMF1 and IMF2 of SCI based on t(3)distribution

圖7 重構的IMF3~RES所得曲線和周平均指數曲線Fig.7 Curves of reconstruction of the data from the sum of IMF3~RES and weekly averaged index
本研究運用平均周期法來計算上證綜合指數經EMD分解后的各階IMFs的周期.平均周期法是根據波峰和波谷的數目給出上證綜合指數的震蕩周期,即

式中,N1為時間序列中的數據點個數,N2為極大值點個數或極小值點個數.
通過計算1994年1月3日—2010年9月30日上證綜合日指數經EMD分解后的各階IMFs的周期(見表1),發現各時間尺度依次遞增,其中IMF2,IMF4和IMF6的平均周期分別為6.870,33.950和162.960 d,表明這3個模態大致反映了周、月和半年尺度上的波動.

表1 上證綜合指數各階IMFs的周期Table 1 Periods of the IMFs of SCI
此外,通過對上證綜合指數上漲階段(2005年12月12日—2007年10月15日)和下跌階段(2007年10月24日—2008年10月16日)的日收盤價數據進行周期性分析,發現在上漲和下跌過程中,各階IMFs具有較好的周期性特征,具體結果如表2所示.為進一步觀察典型的上漲和下跌過程的波動特點,繪制了這兩個階段的波動率圖(見圖8).可以看到,上漲初期的波動幅度比較小,隨著上漲過程的推進,幅度逐漸增大;下跌過程則表現出更為明顯的震蕩,且幅度大于上漲過程.結合各階IMFs的周期、標準差(見表3)及波動率等結果,從整體指數走勢來看,指數下跌過程快于上漲過程,且下跌時間段各階IMFs的周期、波幅均大于上漲時間段,其差值也隨著IMFs階數的增大逐漸增大.

表2 上證綜合指數典型上漲和下跌階段各階IMFs的周期Table 2 Periods of the IMFs on typical rising and dropping processes of SCI

表3 上證綜合指數典型上漲和下跌階段各階IMFs的標準差Table 3 Standard deviations of the IMFs on typical rising and dropping processes of SCI

圖8 上證綜合指數典型上漲和下跌階段的指數和波動率Fig.8 Index and variability on typical rising and dropping processes of SCI
EMD方法基于信號本身所包含的尺度進行分解,具有良好的自適應性,對數據沒有線性和平穩性的要求.本研究將EMD方法用于非線性、非平穩特性的金融時間序列分析,將上證綜合日收盤價指數分解為多個不同尺度的IMFs和剩余項.研究結果表明,通過對分解后各階IMFs進行白噪聲顯著性檢驗,發現并不存在白噪聲的模態,各模態包含著一定的實際物理(經濟學)信息.隨后,對各模態進行基本統計分析和分布擬合,發現其“尖峰厚尾”的特點基本服從自由度為3的t分布.通過對各階IMFs進行周期性分析,運用平均周期法計算各階IMFs的周期,揭示了各階模態間不同的波動信息,并得到了周、月、半年等相關時間尺度的波動特點,這表明EMD方法可以有效地提取金融時序中不同波動周期的分量.此外,對典型上漲和下跌階段的周期性進行了分析,發現不同尺度的模態在這兩個階段都具有較好的周期性特點,上漲初期的波動幅度比較小,隨著上漲過程的推進,幅度逐漸增大.從整體指數走勢來看,指數下跌過程快于上漲過程,且下跌時間段各階IMFs的周期、波幅均大于上漲時間段.
[1] 韓仙華,蔣敏.金融系統復雜性與經濟物理學模型——物理-經濟-股市:股市波動的經濟物理學分析[J].系統辯證學學報,2002,10(3):35-39.
[2] GABAIXX,GOPIKRISHNANP,PLEROUV,et al.A theory of power-law distributions in financial market fluctuations[J].Nature,2003,423(6937):267-270.
[3] PLEROU V, GOPIKRISHNAN P,STANLEY H E.Econophysics:two-phase behaviour of financial markets[J].Nature,2003,421(6919):130.
[4] HUANGN E,SHENZ,LONGS R,et al.The empirical mode decomposition and the Hilbertspectrum for nonlinear and non-stationary time series analysis[J].Proceedings:Mathematical,Physical and Engineering Sciences,1998,454(1971):903-995.
[5] HUANGN E,SHENZ,LONGS R.A new view of nonlinear water waves:the Hilbert spectrum[J].Annual Review of Fluid Mechanics,1999,31(1):417-457.
[6] DUFFYD G.The application of Hilbert-Huang transforms to meteorological datasets[J].Journal of Atmospheric and Oceanic Technology,2004,21(4):599-611.
[7] HUANGY X,SCHMITTF G,LUZ M,et al.An amplitude-frequency study of turbulent scaling intermittency using empirical mode decomposition and Hilbert spectral analysis[J].Europhysics Letters,2008,84(4):40010.
[8] HUANGN E,WUM L,QUW,et al.Applications of Hilbert-Huang transform to non-stationary financial time series analysis[J].Applied Stochastic Models in Business and Industry,2003,19(3):245-268.
[9] YUL,LAIK,WANGS,et al.Oil price forecasting with an EMD-based multiscale neuralnetwork learning paradigm[C]∥ The InternationalConference on Computational Science.2007:925-932.
[10] 秦賢宏,段學軍,李慧.基于EMD的我國經濟增長波動多尺度分析[J].地理與地理信息科學,2008,24 (2):44-47.
[11] 丁志宏,謝國權.金融時間序列多分辨率實證研究的EMD方法[J].經濟研究導刊,2009(6):61-63.
[12] 陳志娟.上證指數收益率的ARCH族型的實證分析[J].統計與決策,2010(17):141-143.
[13] 孔祥芝,王延清.基于ARIMA-GARCH模型和極值理論的中國股市[J].中國管理信息化,2010(9):57-60.
[14] WUZ H,HUANGN E.A study of the characteristics of white noise using the empirical mode decomposition method[J].Proceedings of the Royal Society of London SeriesA:Mathematical,Physicaland Engineering Sciences,2004,460(2046):1597-1611.