(華南理工大學 廣東 廣州 510006)
商業,經濟,環境,醫學和其他科學領域的時間序列數據往往表現出趨勢,季節性波動、不規則周期以及偶爾的水平或變異性變化等模式。分析此類序列的目的通常是推斷數據中的動態模式,以預測未來的觀察結果,估計已知外源性干預措施的效果,并檢測未預料到的干預措施。本文概述了實現這些目標的一些有用方法。時間序列數據中的序列依賴性通常可以通過線性動態模型充分近似。許多觀察到的時間序列是非平穩的,通常表現出趨勢,可能以多種形式出現。通??梢酝ㄟ^將數據差分適當的次數來消除這種趨勢,在這種情況下,該系列被稱為集成過程。然后,通過均勻非平穩性的概念,這導致自回歸-積分-移動平均(ARIMA)過程,將非平穩時間序列轉化為平穩時間序列,然后將因變量僅對它的滯后值以及隨機誤差項的現值和滯后值進行回歸?;旌献曰貧w滑動平均(ARMA)模型,廣泛用于表示靜止和非平穩系列。對于單位根非平穩性,這導致了一類自回歸整合移動平均(ARIMA)模型。Box和Jenkins提出的迭代模型構建方法由臨時模型規范,有效估計和診斷檢查組成,由一個實際例子進行討論和說明。
以“佳訊飛鴻”2015年到2017年每日的股票收益率作為時間序列的分析數據,參考已有的研究文獻,從平穩性檢驗和數據預處理、模型識別(識別AR模型的階數(p),識別MA模型的順序(q))、參數估計、模型擬合優度、模型預測等5個方面,構建股票收益率的ARIMA(p,d,q)模型。采用構建的ARIMA模型對“佳訊飛鴻”的日股票收益率進行預測,一方面更好地反映其股票收益率的動態變化,從而進行風險管理;另一方面為在無法根據歷史信息實現超額利潤,歷史數據就會具有較強的預測能力的弱勢有效的股票市場的量化投資提供較大的應用價值,促進股票金融市場的理性投資。
萬建強,文洲(2001)[1]認為ARCH模型和ARMA模型在應用中并不存在絕對的優劣選擇,只是不同時期的股價波動率不同導致的擬合優度的更佳。
劉美霞(2011)[2]以2009年7月1日到2010年6月30日的每日深證指數收盤價格為原始數據,通過對數據進行平穩、零均值化處理,模型識別和模型定階,再使用最小二乘法估計參數后,最終建立了ARIMA(6,1,6)模型,并對模型檢驗證明有效后,對未來數據進行了短期預測。
代聰文(2011)[3]分別采用了ARIMA和灰色預測法對甘肅省的能源消耗進行建模和分析。組合預測結果的相對誤差小于以上兩個單獨模型的相對誤差,精度要高于單一模型。
盧懷營(2013)[4]運用2010年5月7日至2013年2月22日的時間序列數據,建立了滬深300指數的ARIMA預測模型,并對模型的預測效果進行了分析。并根據得到的結論構建ETF基金對滬深300指數進行期現套利。
夏麗(2013)[5]研究基于用電量的時間序列數據構建ARIMA模型進行短期預測,利用粗糙集理論對時序數據進行預處理,提高了ARIMA模型預測的精度。
袁磊(2015)[6]ARIMA模型是使用最廣泛的線性模型,結合LSSVM解決非線性回歸的問題,實證結論表明ARIMA-LSSVM的混合模型的預測性能比單一的模型、傳統的混合模型預測效果更好。
王永斌、鄭瑤、柴峰、李向文、田珍榛、袁聚祥(2015)[7]利用2004年1月-2014年12月我國甲肝月發病率資料,構建ARIMA模型和SARIMA模型基于周期分解的ARIMA模型擬合和預測效果優于SARIMA模型。
簡琦琛(2017)[8]構建了基于ARIMA的數據學習預測模型,對企業生產中的生產計劃的制訂、原材料的采購和庫存等供應鏈的過程進行精細化的預測。
葛娜、孫連英、趙平、萬瑩(2018)[9]以ARIMA模型對商業經營問題中的銷售建立預測模型,從數據檢驗及預處理、模型識別與定階、參數估計、模型適應性檢驗、模型預測和誤差分析6個方面對構建模型來解釋預測銷售量值與記錄值之間的關系。
管超宇(2018)[10]搜集浙江省1986-2017年GDP的數據進行分析,構建ARIMA模型對接下來今年浙江省的GDP進行預測,對經濟發展起到很好的幫助。
綜合以上2001年到2018年的學者的文獻研究,可以發現ARIMA模型的應用越來越廣泛,由原來的單一模型的預測擴展到了多元混合模型的預測,在股票市場、能源行業和生產消費行業都有較大的應用價值。
以“佳訊飛鴻”為研究標的,從同花順交易軟件下載2015年1月1日-2017年12月29日的每日交易開盤價和收盤價,然后對日收益率進行對數處理,總共有782個交易日收益率數據。
平穩性檢驗是對數據進行回歸的重要檢驗環節,如果數據不滿足平穩性檢驗,會出現隨機趨勢或確定趨勢導致的偽回歸的現象,統計意義并不明顯。常見的檢驗平穩性的檢驗方法有單位根檢驗和ADF檢驗,拒絕原假設,則為平穩數據,滿足平穩性。
(一)平穩性檢驗

表1 ADF測試
P值為0.00,拒絕原假設,數據為平穩數據。
原始數據的ACF和PACF都是拖尾的,因此,可對原始序列(是原始序列)建立ARMA(p,q)模型我們可以觀察這些圖并得出自回歸(AR)和移動平均(MA)。我們知道,對于AR模型,PACF將呈指數衰減,PACF圖將用于識別AR模型的階數(p)。對于MA模型,ACF將以指數方式衰減,ACF圖將用于識別MA模型的順序(q)。原始數據的ACF、PACF在第11階的時候落在2倍標準差的邊緣,很難使用傳統方法確定階數,本例通過反復對模型進行估計比較不同模型變量對應參數的顯著性來確定模型階數。
(二)模型參數估計

表2 模型參數比較
標黃的為0或接近于0的P值。通過對多個模型進行反復比較,發現只有ARMA(10,9)和ARMA(10,11)的參數估計值幾乎全部顯著。下面利用AIC信息準則對ARMA(9,11)、ARMA(11,9)、ARMA(10,10)、ARMA(10,9)、ARMA(10,11)進行模型的篩選。

表3 模型的AIC和BIC值
從表3的模型的AIC的比較值可以發現ARMA(10,11)的AIC值為最小,是比較適合的模型。ARMA(10,0,11)的各項參數估計值在0.01的水平下是顯著的。對殘差進行自相關檢驗,殘差小于0.01,接近于0,不存在ARCH效應,因此模型是比較合適的模型??傻肁RMA(10,0,11)模型為
Yt=-0.7432Y(t-1)-0.9103Y(t-2)-1.62663Y(t-3)-1.4075Y(t-4)-1.7548Y(t-5)-1.3845Y(t-6)-0.7002Y(t-7)-0.6142Y(t-8)-0.6142Y(t-9)-0.808Y(t-10)+0.8064?(t-1)+0.9606?(t-2)+1.7381?(t-3)+1.5581?(t-4)+1.9708?(t-5)+1.6249?(t-6)+1.576?(t-7)+0.9462?(t-8)+0.7187?(t-9)+0.9247?(t-10)+0.095?(t-11)-0.0005
(三)模型預測
樣本范圍內(2015-2017)的序列是已知的,因此,動態預測只是適應于樣本外(2017-2018)預測,樣本內(2015-2017)采用靜態預測。樣本內靜態預測和樣本外的動態預測擬合效果良好。
本文在同花順網站上收集2015年1月1日至2017年12月29日的佳訊飛鴻的每日收盤價,得到每日收益率數據,然后對數化處理。對每日收益率數據利用ARIMA(p,d,q)模型進行分析,通過平穩性檢驗,ADF檢驗,AIC準則,擬合預測,說明模型擬合效果較好,預測趨勢大致一致。目前,股票市場逐漸復蘇,隨著股票市場相關市場機制的完善,政府政策以及監管機構的調控,股票市場會逐漸走向更為理性的投資。對股票收益率的預測可以有效地進行風險預警和風險管理。