王 珺, 栗祥虎
(長春工業大學 數學與統計學院, 吉林 長春 130012)
隨著經濟全球化的發展,中國股票市場近年來發展狀況良好。上海證券交易所成立了30年,上證綜合指數的走勢在很大程度上代表了股票市場價格變動情況,這使得眾多金融經濟領域專家學者對其波動特性及走勢運用各種模型方法進行了研究與預測。孫碧波[1]通過技術分析研究發現,對于上證指數,持有期可變的移動平均線可以預測超額利潤;曾慧[2]運用GARCH模型對上證指數的波動性進行分析發現,中國股票市場有尖峰后尾性、信息不對稱等特點,表明中國股票市場行情與發達國家股票市場有相同的特點。
傳統的模型選擇方法是根據一些模型評價準則選擇能解釋現有數據的最佳模型,進而估計模型參數,其中最經典實用的就屬最小二乘回歸模型[3],張俞[4]運用最小二乘回歸模型分析了上證指數收盤價與股票成交量等股票價格指標之間的關系,擬合上證指數收盤價的效果良好。對于常見的多重共線性問題,嶺回歸模型是代替最小二乘回歸模型的有效模型。韓鳴等[5]以嶺回歸模型研究了影響物流業股票價格的主要指標因素。而模型平均法則是綜合考慮不同模型的分析結果,Buckland S等[6]首先創立了S-AIC和S-BIC方法,自此模型平均方法逐漸發展起來。近年來,Hansen B E[7]提出了Mallows極小化的權重估計準則來計算頻率模型平均估計量。由于Mallows準則與平方誤差漸近等價,因此最小化Mallows準則的模型平均估計量在大樣本中也最小化了平方誤差。在此基礎上,Liang H等[8]提出了OPT方法,該估計有較好的小樣本性質,結論證明,相對于其他模型選擇方法,OPT估計是漸近最優的。因此,運用頻率模型平均OPT權重選擇法對股票市場進行研究也有其重要的意義。
目前頻率模型方法主要應用于線性模型
y=Xβ+Zγ+ε,
ε~N(0,σ2In),
(1)


為選擇矩陣?;谝陨蠗l件,FMA系數估計表達式可表示為

(2)






(3)



(4)
其中
權重表達式為

(5)
式中:qi----各模型回歸變量的個數;
a(>0),b(>0),c(<0)----常數。
式(4)中


(6)
式中:A=Im-Wi;
B=Im-Wj。
由此計算式(4),令其最小化,此時再將得到的a,b,c值代入式(5),便得到了各模型系數的權重,即可得出式(2)的系數值。
數據來源于同花順軟件2016年1月4日至2020年10月22日上證指數日度數據,共1 168組,因變量y為當日上證指數收盤價數據,自變量x1~x8分別為振幅、總手、金額、DEA(異同平均數)、漲跌、DIFF、漲幅、5日平均值。各指標變量定義見表1。

表1 變量定義
對以上數據做統計描述,見表2。

表2 數據統計描述
為了消除量綱的不同,對數據進行標準化,標準化后的上證指數收盤價時序圖如圖1所示。

圖1 收盤價時序圖
由圖1可以看到,在2016年初收盤價暴跌后,直到2018年3月收盤價整體上來看是上漲的,期間有不同程度的波動,2018年3月起由于中美貿易戰加劇,至2019年2月中旬,上證指數收盤價一路呈現暴跌的趨勢,而近兩年時間,其走勢也是陰晴不定。2020年3月初,上證指數又迎來了最低點。由于美聯儲的無限量寬松,短期確實對市場起到穩定作用,同時美國財政紓困政策出臺也有助于緩解疫情和油價下跌給經濟帶來的沖擊,而國內銀保監會公布《保險資產管理產品管理暫行辦法》,有力引導長期資金參與資本市場,同時財政部長表示,中國積極的財政政策將更加積極有為,后續的政府刺激政策力度有望加大,上證指數又逐漸回暖,全球股指也持續反彈。在此,采用上述上證指數日度數據變量對收盤價進行模型擬合。
首先建立上證指數收盤價的回歸模型
y=β1x1+β2x2+β3x3+β4x4+β5x5+
β6x6+β7x7+β8x8+εi。
(7)
總體研究思路是:首先從所有擬合模型中挑選出合理有效的回歸模型,然后考慮所選模型中自變量是屬于X還是Z,再進行模型權重的選擇。
首先考慮的是最小二乘回歸模型,做回歸分析后發現,漲跌與漲幅的參數估計結果在模型中P值大于0.050表明不顯著,因此將其去除;由于總手、5日平均的相關性較高,DEA和DIFF的相關性也比較高,應分別去除一個變量,在此將5日平均值和DIFF去除。雖然總手與金額的相關性也高,但是結合模型的擬合優度,決定將總手與金額一并留在模型中。最小二乘回歸結果見表3。

表3 最小二乘回歸分析
通過表3可以發現,各變量參數估計的P值都小于0.050,表明各變量擬合效果對因變量收盤價顯著,即最小二乘回歸模型
y=-0.175 2x1-1.297 2x2+1.588 2x3+0.224 0x4。
(8)
接下來運用嶺回歸模型建模分析,把相關性強的變量都引入模型中,嶺跡圖如圖2所示。
由圖2可以看出,當最佳K值為0.1時,標準化回歸系數趨于穩定狀態,分析結果見表4。

表4 嶺回歸分析
通過表4可以發現,各參數的P值基本都在0.050以下,變量漲跌的P值雖然等于0.053 0,但是模型整體擬合效果良好,即嶺回歸模型
y=-0.212 7x1-1.123 9x2+1.586 3x3+
0.404 4x4-0.536 2x5-0.187 5x6+
0.561 2x7-0.168 3x8。
(9)
然后進行廣義線性回歸建模分析。廣義線性模型是線性模型的推廣,不需要令因變量服從特定的分布,相比一般線性模型要寬泛許多,剔除回歸分析中顯著性不強的變量,分析結果見表5。

表5 廣義線性回歸分析
以上變量都通過顯著性P值,即廣義線性模型
y=-0.204 5x1-1.115 5x2+1.588 2x3+
0.395 3x4-0.176 3x6-0.179 4x8。
(10)

y=-0.175 4x1-1.295 8x2+1.588 2x3+
0.225 3x4-(3.340 7e-5)x5-0.001 4x6+
(3.496 5e-5)x7-0.001 4x8。
(11)
通過最終模型可以看到,x1振幅越大,代表股票活躍度越高,相應地當日收盤價就變低;x2總成交量越大,收盤價也越低,通俗來講,中國股票市場中散戶投機者眾多,股票價格降低,股民就會順勢買入股票,相應地該股票活躍度就越高;而x3成交金額越大,說明收盤價越高,股民賣出的股票就越多;x4增大時,則說明收盤價走勢升高,可持倉也可近期賣出。x4~x8屬于輔助變量,同理可發現其估計系數的合理性,在此不一一贅述。短期內每個指標都或多或少與前后日走勢相關聯,綜合其日度增減情況,便可分析出上證指數的漲跌情況,甚至大膽預測未來其走勢。模型的擬合圖如圖3所示。

圖3 FMA模型擬合圖
從圖3可以發現,FMA模型擬合的走勢與上證指數收盤價走勢基本同步,前期二者擬合效果非常好,整體走勢基本相同,所以FMA模型對上證指數的分析有重要意義。
首先對最終得出FMA模型殘差進行觀察,FMA模型殘差、QQ如圖4所示。

(a) 殘差柱狀圖 (b) 殘差QQ圖
通過圖4可以發現,模型的殘差大部分都在0周圍分布,QQ圖也說明殘差基本呈現正態分布,說明模型擬合效果良好。然后對平均模型與候選模型進行比較,標準偏差、方差、均方誤差對照見表6。

表6 標準偏差、方差、均方誤差對照
通過表6可以發現,經過FMA過程的頻率平均模型的標準偏差、方差和均方誤差比最小二乘回歸模型小,雖然比其他兩個模型略大,但也是在小數點后兩位有所顯現,所以綜合來看,模型的普適性更強。
通過得出的頻率平均模型可以發現,當日上證指數收盤價與振幅、總手、漲跌、漲幅和五日平均值呈現負相關關系,與成交金額、DIFF、DEA呈正相關關系,因此當日上證指數收盤價的上漲和下跌可以通過觀察以上變量的增減來分析。由于目前選取的變量有限,模型擬合效果還不算完美,若加入更多可參考的變量或篩選更多的待選模型,分析結果可能會更精確,這也是今后工作的重點。