趙 越, 宋 立 新, 回 德 俊
(大連理工大學 數學科學學院,遼寧 大連 116024)
時間序列分析方法是生產和實際中經常用到的研究手段,在經濟、氣象和水利等領域有著廣泛的應用.本文所要研究的對象是非線性隨機序列,是指從非線性系統獲取的時間序列.當系統具有混沌特征時,前人已論證了對非線性時間序列采用動力系統方法進行預測比較有效[1].實際上,通過觀測或實驗獲得的時間序列往往含有噪聲,也可能不平穩,需要進行降噪處理,對含有隨機因素影響的原始觀測序列提取趨勢項.常用的趨勢項提取方法有最小二乘法、平均斜率法和最佳擬合廣義多項式等方法,這些方法經常用在信號處理、檢測技術等工程中[2、3].本文在趨勢項提取的判斷標準上引入一種新的衡量準則,即基于Copula方法構造積分絕對誤差函數,以此來判斷不同方法所提取的趨勢項合理性.最后將動力系統[1]建立在所提取的趨勢項數據基礎之上,針對次貸危機以來美國證券市場實際數據進行模擬和預測.
在實踐中可以得到容量為n的一組時間序列觀測值,同樣對該樣本序列進行類似的分解,記為.應用不同提取趨勢項的方法,可得到不同的估計,記為面對多組估計,要找到最接近真實的一組,思路如下:由在 得 到 一 組 估 計 值后,將殘差作為的估計值,若它是最接近正態分布N(0,Σ)的殘差向量,其所對應的即是要找的趨勢項的最優估計.通過Copula函數,構造了一個衡量模型來衡量積分絕對誤差,目標完成.具體過程如下:對于任意的(u,v)∈I2= [0,1]2,由Sklar定理,可構造二元Copula函數,記為CΣ(u,v)[4].設,其中,規定這里σ0為大于0的常數.此時函數可寫為

式中:Nρ是二元正態分布函數,F(·)和G(·)分別為邊緣分布函數,Σ中σ1、σ2和相關系數ρ都是未知的.

記的秩為的秩為.則式(1)改寫為



同理對Yi+j≈bi+εi+j′,-h′≤j′≤h′,可得趨勢項bi的估計.對應一組(h,h′),可得一組趨勢項的估計,(h,h′)究竟取值多少才能使趨勢項的估計最優,這個問題并沒有解決.設h、h′滿足已知,取最優的(h,h′)為此范圍中使IAE達到最小者,此時得到的趨勢項的估計達到最優.下面介紹本文所要研究的時間序列觀測值,并用h-步平滑法提取趨勢項.
例1h-步平滑法在股市上的應用
選取具有代表性的美國標準普爾500和NASDAQ周收盤價為研究對象,從2007-01-03~2008-12-08共計有102組數據中xi為標準普爾500周收盤價,yi為NASDAQ周收盤價.先利用h-步平滑法求出趨勢項的眾多估計值,然后在IAE衡量模型下找到一組使趨勢項的估計最優的(h,h′),在(h,h′)= (4,9)下算得趨勢項的估計值并做圖1[5、6].
h-步平滑估計用法簡單,其局限性在于忽略超出觀測時間范圍的那些數據,這種不對稱平均可能會產生邊界偏倚.通過引進一個加權設計,可對滑動平均估計進行改善,具體改動如下:其 中 權 數同理可得均是大于零的常數.通過IAE法則算出一個最優的權重λ1和λ2,使得積分絕對誤差最小.

例2 指數加權平均法在股市上的應用
在IAE法則下尋找一個最優的權重λ1和λ2.圖2是指數加權平均法給出的趨勢項的估計值.
在圖3中,虛線代表h-步平滑法提取趨勢項后的殘差波動,實線代表加權平均法提取趨勢項后的殘差波動.兩者相比,加權平均法的殘差波動近乎一條0均值的直線.注意,波動幅度越小不代表趨勢項的估計效果越好,亦可能是時間序列中的波動項沒有與趨勢項分離,加權平均法提取的趨勢項中必然含有方差較大的隨機因素.

圖1 h-步平滑法下針對兩類指數提取趨勢項Fig.1 Extracting trends of two indexes by h-step smoothing method

圖2 在加權平均法下分別對兩類指數提取趨勢項Fig.2 Extracting trends of two indexes by weighted average method

圖3 h-步平滑法與加權平均法針對兩類指數提取趨勢項后的殘差圖像的比較Fig.3 Comparison on residual error of extracting trends between the h-step smothing method and weighted average method
針對次貸危機下的美國證券市場系統,先從線性的角度來尋找函數關系,并進行預測.
模型如下:

其中p是正整數,根據經驗令p=3,α1、α2和α3是
未知參數,有如下形式:

例3 線性回歸法在股市上的應用
以例1中h-步平滑法估計出的趨勢項估計為原始數據,用趨勢項前半段數據得到了模型(5)的3個未知參數的估計和圖4是由該線性模型模擬的證券市場走勢的圖像.

圖4 線性回歸法對兩類指數提取趨勢項Fig.4 Extracting trends of two indexes by linear regression method
易見此方法估計出來的市場走勢明顯與事實不符,由此初步斷定美國證券市場系統是非線性的.

其中c1,c2,…,c6未知.應用h- 步平滑法求出趨勢項的估計值c^1,c^2,…,c^6,得二次多項式模型

例4 二次多項式法在股市上的應用
由例1中h-步平滑法估計趨勢項,得到趨勢項的估計值.用h-步平滑法得到的趨勢項估計值的前半段來估計二次多項式模型的6個未知參數.圖5是二次多項式模型趨勢項的估計值圖.
易知線性回歸法和二次多項式法對趨勢項估計很差,下面用分段線性函數來給美國證券系統建模.

圖5 二次多項式法對兩類指數提取趨勢項Fig.5 Extracting trends of two indexes by quadratic polynomials
對于來自非線性系統的時間序列來說,分段線性函數簡單易行,分段線性數學模型如下:
設α=t0<t1<…<tm=β是區間[α,β]上的一種分割,記Ij(t)=I(tj-1≤t<tj)(1≤j<m-1),Im(t)=I(tm-1≤t<tm),b= (b0b1…bm)T,記

為依次連接點 (t0,b0),(t1,b1),…,(tm,bm)的分段線性函數,稱b為Gm的系數.
例5 分段線性法在股市上的應用
由例1中h-步平滑法估計趨勢項,在本例中取m=4,用h-步平滑法得到的趨勢項估計值的前半段數值,來估計分段線性模型的5個未知參數,然后預測后半段并與實際進行比較,詳見圖6.
分段線性方法對趨勢預測比線性回歸法為好.不足之處:一是它沒有反映市場走勢的波動,二是真實市場是劇烈震蕩向下發展,而預測卻是在高位平緩.由此引入動力系統方法來研究美國股市,最終給出市場的走勢預測.

圖6 分段線性方法對兩類指數提取趨勢項Fig.6 Extracting trends of two indexes by piecewise linear method
對于未知數學模型的混沌動力系統,通過觀測或實驗手段可以獲得多變量時間序列[7].Takens和Mane的延遲嵌入定理證明了只要適當選取延遲時間間隔τ和嵌入維數m,原未知數學模型的混沌動力系統的幾何特征與重構的m維狀態空間的幾何特征是等價的,這意味著原來未知數學模型的混沌動力系統中的任何微分或拓撲不變量可以在重構的狀態空間中計算,并且可以通過在重構的m維狀態空間中建立數學模型對原未知數學模型的動力系統進行預測.
記觀測到的多變量時間序列為{xl,n}Tn=1(l=1,2,…,L),假設T=N+P,前N個數據作為構造模型所需的樣本,后P個數據作為預測精度的度量.采用延遲重構法,在相空間中重構的狀態向量為


或者得到多元函數Gl:Rm→R,滿足

例6 動力系統在股市上的應用
用標準普爾500和NASDAQ周收盤價作為時間序列觀測樣本.觀測的范圍從1988-01-04~2009-02-09,共1102組數據.將1988-01-04~2008-12-08共計1092組數據作為構造模型所需的樣本,將最后10個數據作為預測精度的度量,用這10個數據與動力系統模型的預測結果進行比較.
首先確定延遲時間間隔τ,采用自相關函數法,可得到兩類股市關于τ的圖像,觀察圖像,得到標準普爾500指數的CL(τ)第一次取0值時的時間間隔τ1=31,NASDAQ指數的τ2=30.
其次確定相空間的維數m,由于觀測數據是二維的,有m=m1+m2.于是用虛假鄰點方法估計,得m1=4和m2=5[7].進一步,對于原始時間序列{xl,n}1092n=1(l=1,2),采用延遲重構法進行相空間重構.通過局部多項式預測法對未知系數進行估計,并對系統的走勢進行了短期預測,為了便于分析截取了包含10個預測數值的后102個數據作圖,最終得到圖7.

圖7 動力系統對兩種指數短期預測Fig.7 Shortdated prediction on two indexes using dynamical method
圖7中最后一小段10個數值是動力系統方法對該系統預測值.從圖中直觀上可以看出動力系統方法對NASDAQ指數市場走勢預測得很好,但是對標準普爾500市場指數預測得不是很好.原因在于,NASDAQ指數的特點是收集和發布包含場外交易非上市股票的證券商報價的平均指數,股指中對股票的選擇變動不大.而標準普爾500是由上市公司股票500只成分股組成的,并且該指數的成分股是變動的,對美國證券市場的指數選擇不同對分析結果可能會有影響.從波動的同步性看,對最后10個數值預測的走勢與真實數值的走勢具有比較同步的波動,不論是震蕩的幅度還是方向都與真實的走勢相一致,只是數值上比真實數值普遍大400左右.數值上的差異可以用經濟環境的異常來解釋.最后10個數值所處的時間段是2008年12月至2009年2月初,這段時間內美國的經濟徘徊在崩潰的邊緣.銀行機構繼華爾投行后又掀起一輪破產潮,美國的實體經濟以三大汽車生產商為代表流動性枯竭,政治上美國總統換屆,經濟刺激方案面臨著極大的不確定性.面對如此惡劣的經濟環境,標準普爾500指數的走勢已經不再沿著歷史正常波動,所以用20 a的歷史數據來建立動力系統模型,是對處于正常狀態的指數走勢的預測,那么在異常狀態下必然會與真實值有所差別.對于異常狀態的美國股市,經濟分析師都會下調股指走勢的預期,預測值和真實值之間的差別可以很好地處理,用動力系統預測的指數震蕩的幅度和方向還是比較準確的,因此可以作為經濟決策的輔助數據.從這一點看來,動力系統方法在美國股市這個復雜系統上的預測還是很有意義的.
時間序列趨勢項的提取是時間序列分析研究中的重要課題.本文提出了一種基于Copula函數構造的誤差衡量模型,基于美國股票數據,對各種提取方法進行評判分析.運用動力系統方法,在美國金融危機的背景下,對兩種股票指數進行了短期預測,效果較好,為這一領域提供了一個新的研究視角.
[1]王海燕,盧 山.非線性時間序列分析及其應用[M].北京:科學出版社,2006:16-21
[2]王廣斌,劉義倫,金曉宏,等.基于最小二乘原理的趨勢項處理及其 MATLAB的實現[J].有色設備,2005(05):4-8
[3]高品賢.趨勢項對時域參數識別的影響及消除[J].振動、測試與診斷,1994(02):20-26
[4]NELSEN R B.An Introduction to Copulas[M].2nd ed.New York:Springer,2006:7-42
[5]魏 巍.MATLAB應用數學工具箱技術手冊[M].北京:國防工業出版社,2004:277-328
[6]張善文,雷英杰,馮有前.MATLAB在時間序列分析中的應用[M].西安:西安電子科技大學出版社,2007:20-27
[7]韓 敏.混沌時間序列預測理論與方法[M].北京:中國水利水電出版社,2007:80-91