薛廣明,王 潔,盧若飛
(1.廣西財經學院信息與統計學院,廣西 南寧 530003;
2.湖南省祁東縣第一中學,湖南 衡陽 421600;
3.廣西民族大學理學院,廣西 南寧 530006)
關于阿里巴巴股票價格的實證研究*
薛廣明1,王 潔2,盧若飛3
(1.廣西財經學院信息與統計學院,廣西南寧530003;
2.湖南省祁東縣第一中學,湖南衡陽421600;
3.廣西民族大學理學院,廣西南寧530006)
基于時間序列分析理論研究基礎上,利用SAS統計軟件,系統地分析了2010年1月29日至2011年12月16日阿里巴巴港股價格的數據變化規律,擬合滯后變量及時間t模型,從而確定模型并進行預測,最后給出了日、周、月三種不同研究角度下的模型口徑及擬合圖對比.
阿里巴巴;ARCH模型;殘差;自回歸;時間序列分析
網絡的發展推動了電子商務的進程,目前,“淘寶”“58同城”“趕集”“聚劃算”風正在席卷,經濟的蕭條卻帶來了網上交易的熱潮.
阿里巴巴是全球企業電子商務的著名品牌,匯集海量供求信息,是全球領先的網上交易市場和商人社區,旗下的淘寶網和支付寶,其點擊率更是近年的熱門.近年來,國內外學者均從文學角度進行了一系列的學術研究,筆者通過SAS統計軟件,系統地分析了2010年1月29日至2011年12月16日阿里巴巴港股價格的數據變化規律,擬合滯后變量及時間t模型,從而確定模型并進行預測,最后給出了日、周、月三種不同研究角度下的模型口徑及擬合圖對比.
一些時間序列,特別是金融時間序列,在使用ARIMA模型擬合非平穩序列時,對殘差序列有一個重要的假定——殘差序列{εt}均值為零的白噪聲序列,換言之,即要滿足零均值、純隨機及方差齊性.
若方差齊性假定不成立,即隨機誤差序列的方差不再是常數,則被稱為異方差.
在這三個假定中,零均值通過對序列進行中心化處理就可以實現,純隨機假定,是為了說明殘差序列中信息是否提取充分,為了有效檢驗這個假定,統計學家們構造了許多適用于不同場合的自相關檢驗統計量,例如Q統計量、LB統計量、DW統計量等.
第三個假定——方差齊性,在金融序列中往往是不滿足的,忽視異方差的存在會導致殘差被嚴重低估,從而參數顯著性檢驗容易犯偽納錯誤,最終導致模型的擬合精度受影響.
實踐中,我們只能根據殘差圖及殘差平方圖所顯示出來的特點,大致判定殘差是否滿足方差齊性,而對數變換通常只能使絕大多數金融時間序列的異方差程度得到改善,但無法真正實現方差齊性.
為對異方差函數進行更準確估計,1982年Engle建立條件異方差的模型.


若ρk恒零時,即異方差函數為純隨機.當存在某個ρk不為零時,說明其自相關性存在,通過構造殘差平方序列自回歸模型對其擬合即可.

該模型即為ARCH(q),完整結構為:

當殘差序列的異方差函數有長期的自相關性,若進行ARCH模型擬合將會有很高移動的平均階數,同時對參數估計增加難度,且影響ARCH模型擬合度,為改進這一問題,Bollerslov在1985年提出了GARCH(p,q)模型,它的結構如下:

對殘差序列{εt}擬合GARCH模型時,有時回歸函數χt=f(t,χt-1,χt-2,…)不能充分提取原序列{εt}中的相關信息,殘差序列可能自相關,而非純隨機.此時需要先對{εt}進行自回歸擬合,再對自回歸殘差的序列{vt}進行方差齊性檢驗,若{vt}為異方差,則應擬合GARCH模型.這樣構造的模型稱為AR(m)-GARCH(p,q)模型:

3.1數據收集及說明
選取2010年1月29日至2011年12月22日阿里巴巴港股(01688)每日收盤價周度數據進行實證研究,數據從搜狐財經網站上獲取.其中前99個數據用來建模,后幾個數據用來檢驗模型的擬合程度.
3.2繪制序列時序圖
時序圖(圖1)顯示該序列有顯著的趨勢,為典型的非平穩序列,且看出序列的最大值為17.80,最小值為6.99,均值為13.5531.

圖1 2010年1月29日-2011年12月16日阿里巴巴收盤價趨勢圖Fig.1 On January 29,2010-December 16,2011 Alibaba's closing share price trend chart
3.3殘差序列異方差檢驗
對原序列進行一階差分,如圖2一階差分后的殘差序列具有均值平穩性,而方差是否顯著并不明顯:觀察圖3可以從圖形上直觀地得到結論:殘差序列為異方差.

圖2 一階差分圖Fig.2 First order difference figure

圖3 殘差平方圖Fig.3 Residual square figure
因為時序圖顯示序列具有顯著線性遞減趨勢,但波動幅度隨時間的變化趨勢并不明顯,所以筆者嘗試{χt}關于時間t的線性回歸模型及延遲因變量回歸兩個模型,最終確定一個擬合度較高的模型,并進行預測.
模型1:因變量關于時間t的回歸模型
使用AUTOREG過程建立序列{χt}關于時間t的線性回歸模型,為了從理論上證明殘差序列是異方差,我們做了殘差序列的Q和LM檢驗,檢驗殘差序列10階延遲的自相關性并輸出DW檢驗的P值,同時對殘差序列進行異方差檢驗.
DW檢驗顯示出殘差序列具有顯著的自相關性,建立殘差自回歸模型,由殘差序列10階延遲自相關圖,顯示殘差序列至少具有1階顯著自相關性.表1給出了線性回歸模型參數估計結果,參數估計結果顯示回歸模型參數均顯著.

表1 線性回歸模型參數估計結果Tab.1 Linear regression model parameter estimation results
由Q及LM檢驗,結果顯示殘差序列具有顯著的異方差性,且具有顯著的長期相關性,檢驗結果如表2所示.
綜合考慮殘差序列自相關性和異方差性檢驗結果,嘗試擬合GARCH(1,1)模型.模型最終擬合結果如表3所示.

最終模型口徑為:

最終輸出擬合效果圖及95%的置信區間預測圖如圖4所示:

表2 異方差檢驗結果Tab.2 Heteroscedasticity testing results

表3 最小二乘估計結果Tab.3 Least squares estimate results

圖4 ARCH模型擬合效果圖Fig.4 ARCH model fitting renderings
模型2:延遲因變量回歸模型
使用AUTOREG過程建立序列{χt}關于延遲因變量的回歸模型,建立帶有延遲因變量的回歸模型:χt=a+χt-1+ut.
同模型1,為了從理論上證明殘差序列是自相關的,做了殘差序列的Dh檢驗,結果如表4所示:

表4 帶延遲因變量回歸分析結果Tab.4 With a delay due to variable regression analysis
此處Durbin h統計量的分布函數達到0.1810,這表示殘差序列不存在顯著的相關性,不需要考慮對殘差序列繼續擬合自回歸模型.
再注意參數檢驗結果,如表5所示:

表5 參數估計結果Tab.5 Parameter estimation results
在顯著性水平默認為0.05的條件下,由表6看出截距項不顯著(P值大于0.05),所以考慮在模型擬合命令中增加NOINT選項,最后輸出擬合結果如表6、表7所示.

表6 普通二乘估計結果Tab.6 Ordinary least squares estimate results

表7 參數估計結果Tab.7 Parameter estimation results
從模型的擬合程度來說,模型2的擬合度明顯高于模型1,因而可以采用模型2進行擬合及預測.

圖5 延遲因變量回歸擬合效果圖Fig.5 Delay dependent variable regression renderings
用該模型對2011年12月23日至2012年1月27日進行預測,得到的擬合值見表8,然后用搜狐網中已統計的最新真實數據對該模型進行檢驗,證明其可行性以及預測的可靠性較高.由表8可以看出相對誤差在8%以內,證明了模型短期預測的可行性.

表8 2011年12月23日至2012年1月27日預測值與真實值的相對誤差Tab.8 On December 22,2011-January 27,2012,The relative error of the predicted values and the real value
筆者對阿里巴巴港股的日數據及月數據也進行了相應的實證研究,得到了日、周、月數據模型建立的對比(如表9所示),并分別給出了它們的擬合效果及95%的置信區間圖(如圖6~8所示).

表9 日、周、月度數據模型的比較Tab.9 The comparison of daily,weekly,monthly data model

圖6 日度數據擬合效果及95%置信區間圖Fig.6 Daily data fitting effect and 95%confidence interval

圖7 周度數據擬合效果及95%置信區間圖Fig.7 Weekly data fitting effect and 95%confidence interval

圖8 月度數據擬合效果及95%置信區間圖Fig.8 Monthly data fitting effect and 95%confidence interval
由日、周、月數據擬合圖可以看出,當數據越多時,95%的置信區間相對越小,精度越高,因而人們在股票的買賣過程中,需要全面地分析歷年數據,不應單純地將月度數據或周度數據的研究成果應用于實際中,否則將導致不必要的損失.
筆者根據2010年1月29日至2011年12月16日阿里巴巴港股價格的數據變化規律,分別建立{χt}關于時間t的線性回歸模型及延遲因變量回歸兩個模型,最終由擬合度確定延遲因變量回歸模型,并進行了預測.此外還結合阿里巴巴港股的日收盤數據與月收盤數據,可以給投資者一定的啟示,觀察數據量的多少能給投資者帶來不一樣的判斷角度,從而避免片面地觀察數據,減少投資中不必要的人為損失.
[1]王燕.應用時間序列分析[M].北京:中國人民大學出版社,2010.
[2]高惠璇,耿直,等.SAS系統·SAS/ETS軟件使用手冊[M].北京:中國統計出版社,1998:66-78.
[3]鄧祖新.數據分析方法和SAS系統[M].上海:上海財經大學出版社,2006:411-423.
[4]謝佳利,楊善朝,梁鑫.我國CPI時間序列預測模型的比較及實證檢驗[J].統計與決策,2008(9).
[5]杜普燕,宋向東,任文軍.ARCH模型在金融時間序列中的擬合應用[J].佳木斯大學學報:自然科學版,2009(2).
[6]梁鑫,龐麗,彭冬梅.桂林市汽車銷售量的時間序列預測模型[J].廣西科學,2008(4).
[7]梁鑫,謝佳利,李朝.廣西GDP的統計預測模型及其應用[J].經濟數學,2008(3).
[責任編輯 蘇 琴]
[責任校對 方麗菁]
An Empirical Study of Alibaba Stock Prices
XUE Guang-ming1,WANG Jie2,LU Ruo-fei3
(1.School of Information and Statistics,Guangχi University of Finance and Economics,Nanning530003,China;2.Hunan Province Qidong County First Middle School,Hengyang 421600,China;3.College of Science,Guangχi University for Nationalities,Nanning530006,China)
This article is based on time series analysis theory,by statistical software,systematically analyzed on January 29,2010-December 16,2011stock price data alibaba change rule,fitting lag variables and time t model to determine the model prediction,and finally gives the day,week,month three different research Angle of the model diameters and fitting contrast diagram.
alibaba;The ARCH model;Residual;autoregression;Time series analysis
F224
A
1673-8462(2015)01-0051-05
2014-09-20.
國家自然科學基金(11461008);教育部人文社科基金(13YJA910003);廣西自然科學基金(2013GXNSFAA019005);廣西高等學校科學技術研究重點項目(2013ZD010).
薛廣明(1985-),男,黑龍江齊齊哈爾人,碩士,廣西財經學院助教,研究方向:隨機分析、計量經濟與金融工程.