文/劉戀平,劉虹霓
將股票的移動平均值乘以各自權重與基準日市值k的比值再乘100得出板塊指數,從而計算出板塊指數的移動平均線。在這些數據的基礎上使用未經處理的ARIMA模型對板塊指數移動平均線進行預測。由于未經處理的ARIMA模型誤差較大,又對ARIMA模型中的(p,d,q)進行修正,得出準確的ARIMA模型。本文對上證指數和光伏建筑一體化板塊指數利用Eviews軟件進行相關性分析。
我國用能和碳排放形勢嚴峻,“碳達峰”與“碳中和”成為國家與社會關注的重要議題。[1]光伏產業作為一種節能的新能源產業運用在建筑行業中,成為一種良好發展的趨勢,與之相關的股票也有不斷上漲的趨勢。本文通過對歷史數據的運算,從大體上給出該板塊的發展趨勢。
本文對37家光伏建筑一體化相關企業的股票數據進行分析,將南玻A在1992年2月28日的收盤價k作為基準日市值,當前市值由各股票的收盤價與各股票的權重相乘再累加得到,通過給出的計算公式求解板塊指數。要得出光伏建筑一體化板塊指數的移動平均線,就需要計算出光伏建筑一體化板塊指數各個時間段的移動平均值,建立板塊指數移動平均值求解模型。根據2021年光伏建筑一體化板塊指數五日的移動平均線,建立ARIMA模型,預測出2021年5月6日至5月28日數據。在沒有做任何處理的情況下,ARIMA模型預測出來的數據存在較大的誤差。在進行一定的修正得到準確的ARIMA模型后,修正的模型預測該板塊指數5月28日后20個交易日的日移動平均線、3周的周移動平均線、2個月的月移動平均線。利用2019年4月1日至2021年5月28日各只股票的收盤價、成交量計算出光伏建筑一體化板塊指數以兩個月為周期的各個時間段的移動平均值。利用2019年4月1日至2021年5月28日上證指數的數據,以兩個月為周期計算出各個時間段移動平均值。最后對計算出上證指數和光伏建筑一體化板塊指數各個時間段的移動平均值數據利用Eviews軟件做相關性分析。
要得出光伏建筑一體化板塊指數的移動平均線,就需要計算出光伏建筑一體化板塊指數各個時間段的移動平均值,可以根據計算各個時間段各只股票的移動平均值乘以它們各自的權重與基準日市值k的比值再乘100得出。公式如下:

式中,SiTj表示第i只股票第j個時間段的成交總量;SiCPj表示第i只股票第j個時間段的收盤價;N表示以N天為一周期,可取5、10、20。
ARIMA方法的基本理念是,要預測的時間序列是由某個隨機過程生成的,進而可以利用過去的觀測值來推出未來的序列值。[2]考慮到板塊指數的移動平均值數據通常是缺乏平穩性的,因此對其進行一階差分處理,使數據保持平穩性,接著建立AR(自回歸模型)。p階回歸公式如下:

式中,yt為當前值;u為常數項;p為階數;γi為自相關系數;εt為誤差。
MR(移動平均模型)公式如下:

自回歸模型AR和移動平均模型MA模型相結合,就可得到自回歸移動平均模型ARMA(p,q),計算公式如下:

將自回歸模型、移動平均模型和差分法結合,就可得到差分自回歸移動平均模型ARIMA(p,d,q),其中d是需要對數據進行差分的階數。
1.d的確定
沒有做差分的數據不平穩,經過一階差分處理過的數據變得平穩,故確定d=1。
2.p、q的確定
由PYTHON程序畫出ACF、PACF圖,如圖1、圖2所示:

圖1 ACF圖

圖2 PACF圖
可以看出,p=0,q=1,因此確定模型為ARIMA(p=0,d=1,q=1)。通過此模型預測2021年5月6日至5月28日數據圖像,如圖3所示。

圖3 2021年5月6日至5月28日板塊指數的MA5預測和實際值
在Eviews中,通過輸入上證指數和光伏建筑一體化板塊指數,把光伏建筑一體化板塊指數當作解釋變量,設為x;上證指數當作被解釋變量,設為y。通過plot操作,由趨勢圖觀察出經濟變量x、y的發展趨勢大體都是增長的,但是存在異常值,兩變量之間的關系不明顯。
再畫出回歸線去檢驗x、y的線性相關性,根據相關圖,大多數點都沒有落在回歸線上,因此基本判斷x、y變量相關類型應該是非線性的曲線相關關系。接著初步將模型設定為雙對數函數模型、對數函數模型、指數函數模型和二次函數模型,并分別從以下四個方面考慮并估計出準確的模型:
(1)回歸系數的符號、值的大小;
(2)改變模型形式之后是否使判定系數的值明顯;
(3)各個解釋變量t檢驗的顯著性(是否能通過);
(4)系數的估計誤差較小。
在Eviews命令窗口中鍵入命令來估計模型,選擇二次函數模型、雙對數函數模型、對數函數模型、指數函數模型。通過Eviews比較以上模型可見,除二次函數模型中x^2的回歸系數為負數,與實際情況存在一定的偏差外,其他模型回歸系數的符號及數值較為合理,因此我們舍去二次函數模型。另外,雙對數函數模型、對數函數模型、指數函數模型的解釋變量及常數項都通過了t檢驗,模型都較為顯著。除了指數模型的擬合優度較低外,其余模型都具有高擬合優度,因此可以首先剔除指數模型。再檢驗雙對數函數模型、對數函數模型、指數函數模型的殘差,這三種模型的殘差在較長時期內呈連續遞減趨勢又遞增,然后又轉為連續遞減又遞增的趨勢。而通過殘差圖比較得出,雙對數模型和指數模型的殘差落在虛線框里的比對數模型的要少,可以初步判斷雙對數函數和指數函數形式設置是不當的。另外,這兩個模型的擬合優度也較對數模型低,所以可舍棄雙對數模型和指數模型,選擇對數函數模型。
最終確定模型為對數模型,方程如下:

通過Eviews得出y,log(x)的相關性是0.951565,是比較高的,模型是合理的。
面向“碳中和”目標的低碳轉型,將對社會經濟系統和自然系統產生深遠的影響。[3]而建筑領域一直是碳排放大戶,在國家“碳達峰”和“碳中和”的遠景目標指引下,光伏建筑一體化具有廣闊的發展前景。
板塊指數是將同一板塊的個股按不同的權重方式生成的相關指數,是對各板塊走勢的整體反映。通過對37家光伏建筑一體化相關企業的股票數據對光伏建筑一體化板塊指數的分析與預測,由繪制出的板塊指數移動平均線,我們可以看出,2019年4月1日 至2021年4月30日,板塊指數一直處于相對穩定的動態變化之中;在交易天數約為200天的時間點,出現了板塊指數的一個小高峰,在這一時間段內,板塊指數雖然有所增長,但變化不大;在這個時間點往后的一段時間內,大約進入2020年,板塊指數處于動態變化中,但呈現出爆發式上升的趨勢;在交易天數約為430天的時間點,大約在2020年9月,出現了板塊指數的最高點。