林政揚,倪肖婕,王 博
(杭州電子科技大學自動化學院,浙江 杭州 310018)
作為資本市場的長期信用工具,股票的存在可以在一定程度上反映當前的經濟形勢。對于投資者來說,預測越精確越能規避股票投資存在的風險。而對于監管機構來說,預測未來走勢越準確越能夠加強對股票市場的把控。由于股票波動趨勢受到多方因素的影響難以完全納入考慮范圍,因此相較于傳統方法,時間序列方法通過著重于其本身的概率或者隨機性質對未來做出短期預測。Adebiyi 通過ARIMA 模型預測股票價格,結果顯示該模型具有短期預測潛力,說明ARIMA 是一類經典且短期預測效果理想的時間序列模型?;瑒哟翱谑且环N簡單的降噪方法,其作用是限制窗口大小下不斷更新時間序列。一般ARIMA模型連續預測下始終保留所有數據,本文結合滑動窗口的方法,選用不斷更新的數據序列,并在新的序列下估計ARIMA模型參數。
隨著國家《第十四個五年規劃和2035年遠景目標綱要》的出臺,我國北京、上海等31地相繼發布光伏建筑一體化(下稱BIPV)未來三至五年相關政策,影響我國BIPV 和相關行業股市發展。本文以滬深股市中37家光伏建筑一體化相關企業的股票(見表1)為依據,對BIPV 板塊建立模型,并利用2021 年5 月6 日至5 月28 日數據進行誤差分析并修正模型,根據修正后的模型對該板塊未來發展趨勢做出預測。

表1 滬深股市中37家光伏建筑一體化相關企業
●在研究37 家光伏建筑一體化相關企業組成的BIPV 板塊時,本論文在模型建立過程中選取2019 年4 月1日作為計算BIPV板塊指數的基準日。
●在數據清洗過程對于缺失的交易數據,本文默認漲跌、漲跌幅、交易量、交易額為0,開盤價,收盤價保持上一個交易日的數據。
●市值計算中以交易量為權重,且以2019年4月1日的市值等價為1000點。
記M()為BIPV 板塊以2019 年4 月1 日為基準日第天的加權市值,有

其中P()表示第股對應的當日收盤價,W()表示第股的當日交易量,第天的板塊指數為

ARIMA模型與ARMA模型的區別在于ARMA模型研究的時間序列是平穩的,ARIMA模型研究非平穩時間序列,對于不平穩的時間序列,可以同通過適當階數的差分運算后變為平穩序列,從而用于ARMA模型。BIPV板塊時間序列的差分時間序列為

其中?稱為階差分算子,定義為

其中為(自回歸序列)模型中定義的滯后算子。

差分運算后的時間序列?I,要求是平穩時間序列,將差分平穩序列代入ARMA(m,n)模型中即有

其中,…,θ是()模型中的自回歸系數,,…,β是MA模型中的移動平均系數,η是MA模型中第期的誤差值。當為0 時,模型降為模型,為0 時則降為模型,對應預測的平穩差分序列可以通過式⑶推出原序列的預測值。
窗口大小為在第時刻的滑動序列窗口可定義為

如果時間序列確定,通過參數估計可以確定ARIMA 模型。一般ARIMA 模型連續預測下它始終保留所有數據,滑動窗口的作用是限制窗口大小下不斷更新時間序列,在新的序列下估計參數。這樣就能在保證受歷史數據作用的同時減少過舊的數據作用,起到一定降噪。
本文選用均方根誤差說明模型預測與實際數據的誤差程度:

對于大部分金融數據而言其時間序列數據是非平穩的,且具有非線性、波動聚集性和異方差性。如圖1 所示BIPV 板塊指數有一種趨勢,且數據偏度(Skewness)大于0,峰度(Kurtosis)大于3 即數據呈現“尖峰尾肥”的狀態。本文對數據進行單位根檢驗(即ADF 檢驗,實際操作中要分別對不考慮趨勢項和滯后項,僅考慮滯后項,考慮趨勢項和滯后項三個ADF 檢驗模型進行檢驗,但凡有一個模型拒絕原假設,時間序列視為平穩時間序列),檢驗可得T統計量為-2.8639,P值為0.1754大于0.05,BIPV板塊指數具有單位根,另外分析得自相關明顯,因此BIPV 板塊指數并非平穩時間序列。

圖1 BIPV板塊指數統計直方圖(統計分析軟件采用EViews 10)
本文選取2021 年4 月30 號前原I時間序列做一階差分處理(在股市中指數的一階差分是具有意義的,表示BIPV 板塊指數的對數收益率),確定差分后的時間序列為平穩且非白噪聲序列,即ARIMA(,,)中取值為1。確定好值后根據自相關和偏相關圖以及AIC、SBIC、HQIC 準則確定AR(p)和MA(q)模型的階次和參數(見表2),最后再對模型進行殘差正態分布檢驗,經過檢驗最終的修正模型為ARIMA(1,1,1)。

表2 ARIMA(1,1,1)模型中參數
傳統的ARIMA 模型對BIPV 板塊進行動態趨勢預測可以得出在2021年4月30號后BIPV 板塊指數呈現緩慢上升,180 天滑動窗口下的ARIMA 模型預測則是緩慢下降(見圖2(a))。利用2021 年5 月6 日至5 月28 日數據進行誤差分析可知實際指數總體變化情況基本在180天窗口下ARIMA 的動態預測置信區間內,而傳統的ARIMA 模型基本脫離模型預測區間,說明本文提出的新模型對BIPV 板塊指數動態預測具有更好的效果。在定量預測BIPV 板塊指數的時候,本文采用循環單步預測的方法的同時通過確定移動窗口的大小來預測該窗口約束下下一交易日的BIPV 板塊指數,要注意的是每一次新序列的生成均要重復前文的模型確定過程,重新進行新序列下的參數估計。從預測結果上看一般的ARIMA模型預測RMSE為219.5526,本文提出的模型預測RMSE 為206.5721,效果更優(見圖2(b))。

圖2 ARIMA和基于180天滑動窗口的ARIMA模型對BIPV板塊指數預測
本文提出的基于滑動窗口ARIMA 模型預測精確度受限于滑動窗口的大小,滑動窗口的選擇起到了數據降噪的作用,圖3 給出了不同滑動窗口下的指數預測,從表3 可知不同窗口選擇的預測結果有顯著性差異。

表3 不同窗口預測誤差

圖3 不同滑動窗口下ARIMA模型預測
本文提出一種基于滑動窗口的ARIMA 模型,該模型通過選擇窗口大小,對窗口內的時間序列進行ARIMA模型預測,最后得出光伏建筑一體化的相關股票在下半年短期內總體趨勢會有下滑,可能處于板塊發展的瓶頸期,未來仍然需要相關政策的扶持。本文模型的難點在于選擇合適的時間窗口長度,對于一類長期穩定的時間序列而言,可以深究能否優化出一個普適的時間窗口長度來實現用簡單的方法進行高精度短期預測。此外讀者還可以考慮采用模型組合的方法進行其他改進,從而將模型應用到糧食產量,水文變化,電力運輸等方面。