耿立艷 張占福
摘?要:將自適應神經模糊推理系統(ANFIS)引入到股指期貨合約收益波動率預測中,構建基于四維輸入變量的ANFIS股指期貨波動率預測模型。將前一期的收益波動率、開盤價格、最高價格、收盤價格作為輸入變量,以當期收益波動率作為輸出變量。以滬深300指數高頻期貨合約為例進行實證研究。根據RMSE、MAE、HRMSE、MPE、Theil、LLF和LELF值,四維輸入變量ANFIS的高頻收益波動率預測性能優于RBFNN和一維輸入變量ANFIS。
關鍵詞:股指期貨;波動率;預測;自適應神經模糊推理系統
中圖分類號:F830 TP183文獻標志碼:A
1引言
隨著人工智能技術的不斷發展,人工神經網絡在金融波動率預測領域得到應用[1-2]。但在實際應用中,人工神經網絡由于自身的一些缺陷,難以得到推廣。自適應神經模糊推理系統(ANFIS)?[3]是以T-S型模糊推理系統[4]為基礎構建的一種自適應神經網絡。ANFIS既具有神經網絡的自學習、自適應能力,在功能上又與模糊推理系統等效,其隸屬度函數參數與結論參數均能夠通過數據樣本的訓練實現自主確定和更新[5]。因此,ANFIS不需要專家的經驗與知識建模,更適應用于特性難以掌握的復雜系統建模。此外,ANFIS理論上能夠以任意精度逼近任意非線性連續函數,充分利用這一優勢可實現高精度的非線性逼近與預測[6]。考慮到金融市場波動的復雜性與非線性特點,本文將ANFIS引入到金融資產收益波動率研究中,構建波動率的ANFIS預測模型,并通過滬深300指數期貨的實證研究檢驗ANFIS有效性。
2金融波動率的ANFIS預測模型
構建ANFIS時,首先要選取合適的輸入變量和輸出變量。本部分要解決的是金融資產收益波動率的預測問題,所以將ANFIS的輸出變量設為金融資產收益波動率的當期值,預測值則由ANFIS訓練出的參數與規則外推下一期的收益波動率。由于收益波動率數據無法從金融市場交易數據中直接獲得,這里以股指收益平方的當期值及前四期的移動平均值之和作為收益波動率的估計值。輸入變量的選取應當包含盡可能多的相關歷史信息量,以體現不同影響因素對輸出變量產生的作用。進行金融資產收益波動率預測時,通常是根據金融市場的歷史數據進行建模與預測,這里將前一期的收益波動率、開盤價格、最高價格、收盤價格作為輸入變量。基于四維輸入變量的ANFIS表達式如下:
其中,和分別為ANFIS的輸出變量和輸入變量;代表第期的收益波動率;代表第期的收益波動率;分別為第時期的開盤價格、最高價格和最低價格;表示輸入變量與輸出變量之間的非線性關系,即ANFIS通過一些模糊規則,建立它們之間的非線性映射關系。
四維輸入變量ANFIS預測波動率的步驟設計如下:
步驟1:數據預處理。以開盤價格、最高價格、收盤價格、前一期的收益波動率作為輸入變量、當期收益波動率作為輸出變量,分別對輸入變量和輸出變量的原始數據進行預處理;將預處理后的數據樣本分為兩部分:訓練樣本集和檢驗樣本集,訓練樣本集用于構建ANFIS,檢驗樣本集用于檢驗ANFIS-的預測性能。
步驟2:ANFIS隸屬度函數選擇。根據經驗選擇隸屬度函數的類型和數目,生成初始的ANFIS,通過反復試驗選擇最優的隸屬度函數類型和數目。
步驟3:ANFIS構建。利用訓練樣本集訓練ANFIS,確定隸屬度函數參數與結論參數,根據獲得的參數構建ANFIS。
步驟4:ANFIS預測。基于檢驗樣本集,利用構建的ANFIS預測波動率,并將得到的預測值反歸一化為原始波動率的預測值。
3實證研究
3.1 數據選取與描述
以中國金融期貨交易所滬深300指數期貨合約(Hushen 300 index futures contract, HS300IFC)為研究對象,選取時間跨度為2011年1月31日到2011年3月4日的5分鐘交易數據,共包括958組觀測值,每組觀測值包括開盤價格,最高價格,最低價格,收盤價格,成交量五個觀測量。根據連續復合對數收益率公式計算HS300IFC收益,得到957個數據樣本,計算公式如下:
(2)
其中,
為五分鐘收益,
和
為第
個五分鐘和第
個五分鐘的收盤價格。
表1為HS300IFC收益序列描述性統計量。由表1可知,首先,HS300IFC收益序列的均值和中位數相對較小,僅為0.0077和0.0160,而標準誤差則相對較大,為0.1664,表明HS300IFC收益序列的數據趨于集中,偏離均值的程度較大,反映出HS300IFC收益序列具有較大的波動性特征;其次,從偏度和峰度可以看出,HS300IFC收益序列的偏度小于零、峰度大于正態分布的峰度值3,說明HS300IFC收益序列是左偏的,且凸起的程度高于標準正態分布,同時J-B統計量顯示,HS300IFC收益序列在1%、5%和10%水平下都顯著拒絕零假設,可以得出,HS300IFC收益序列呈現出“尖峰厚尾”且向左偏的非正態分布;第三,HS300IFC收益序列的LB(16)統計量在1%、5%和10%水平下均顯著拒絕了零假設,說明HS300IFC收益序列不存在線性自相關性,為白噪聲序列;從LB2(16)統計量可以看出,HS300IFC收益平方序列在1%、5%和10%水平下顯著拒絕了非自相關性假設,表明HS300IFC收益序列具有非線性自相關性;最后,HS300IFC收益序列的LM(16)統計量在1%、5%和10%水平下均顯著拒絕零假設,這就拒絕了不存在ARCH效應的原假設,說明HS300IFC收益序列存在“波動聚集性”特征,因此,LM檢驗結果與偏度和峰度的檢驗結果是一致的。
注:J-B表示Jarque-Bera正態性檢驗;LB(16)和LB2(16)分別表示對收益序列和收益平方序列作滯后16階的Ljung-Box序列相關性檢驗;LM(16)代表對收益平方序列作滯后20階的ARCH檢驗;*、**和***分別代表統計量在1%、5%和10%水平下顯著。
3.2 ANFIS學習與預測
首先,將輸入變量和輸出變量的原始數據樣本均歸一化到[0,1]區間,再分為兩個部分:前600組數據作為訓練樣本集,后358組數據作為檢驗樣本集。其次,選擇隸屬度函數。輸出變量隸屬度函數的類型只有兩種:常數和線性函數,這里為輸出變量選擇線性函數;輸入變量隸屬度函數類型與數目的選擇,目前尚無統一的方法。研究發現,T-S型模糊推理系統更適合采用非線性隸屬度函數[7],因而這里為四個輸入變量選擇非線性隸屬度函數。經過多次試驗,將輸入變量的隸屬度函數選為雙邊高斯型隸屬度函數,同時,為輸入變量的模糊集設置四種模糊變量:低于、等于、中等、高于。輸入變量隸屬度函數的數目通常根據訓練數據的多少和輸入變量的維數確定,通過試驗,選取2個輸入變量隸屬度函數。第三,采用模糊聚類法劃分輸入變量空間,生成初始的參數化ANFIS結構。將訓練次數設為100次,根據訓練樣本集訓練ANFIS,采用誤差最小作為停止收斂準則,即當誤差不再變化時結束訓練。最后,利用訓練好的ANFIS向前一步預測HS300IFC收益波動率,以減少累計誤差。再將預測值反歸一化為原始波動率的預測值。
為驗證ANFIS的有效性,基于相同的訓練樣本集與檢驗樣本集,構建徑向基神經網絡(RBFNN)預測HS300IFC收益波動率,并將RBFNN的預測結果與ANFIS相比較。其中,RBFNN的結構由輸入、輸出變量維數確定,即輸入層包含4個結點、輸出層有1個結點,隱含層包含2個結點;自由度設為5,期望誤差設為0.00001。
3.3 .結果分析與比較
以股指收益平方的當期值及前四期的移動平均值之和作為真實波動率的估計值,選用選用均方根誤差(RMSE)、平均絕對誤差(MAE)、異方差調整的均方根誤差(HRMSE)、平均百分比誤差(MPE)、西爾統計量(Theil)、對數損失函數(LLF)和線性指數損失函數(LELF)七項指標評價ANFIS和RBFNN模型的預測性能七項評價指標值越小,表明模型的預測性能越好。
表2為ANFIS和RBFNN預測性能比較結果。由表2可知,在所選擇的樣本期內,?ANFIS對HS300IFC的RMSE、MAE、HRMSE、MPE、Theil、LLF和LELF均小于RBFNN的對應值,因此,根據所考察的評價指標,ANFIS的HS300IFC收益波動率預測性能優于RBFNN。
圖1為HS300IFC收益波動率預測值比較曲線圖。由圖1可以看出,ANFIS和RBFNN均較好地預測出HS300IFC收益波動率的變化特征,相比于RBFNN,ANFIS則更準確地捕捉到了HS300IFC收益波動率的某些峰值和谷值。

圖1 HS300IFC收益波動率預測值比較曲線圖
為進一步驗證ANFIS的有效性,基于相同的訓練樣本集與檢驗樣本集,將前一期的收益波動率作為輸入變量,構建基于一維輸入變量的ANFIS預測當期波動率。為使預測結果具有可比性,將一維輸入變量ANFIS的輸出變量隸屬度函數、輸入變量隸屬度函數與數目、模糊規則、訓練次數等參數設置為與四維變量ANFIS相同。
表3為不同維輸入變量的ANFIS預測性能比較結果。由表3可知,在所選擇的樣本期內,四維輸入變量ANFIS對HS300IFC收益波動率預測性能明顯優于一維輸入變量ANFIS,表現在其RMSE、MAE、HRMSE、MPE、Theil、LLF和LELF值均明顯小于一維輸入變量ANFIS的對應值。
圖2不同輸入變量ANFIS收益波動率預測值比較曲線圖
圖2為不同維輸入變量ANFIS收益波動率預測值比較曲線圖。由圖2可以看出,基于四維輸入變量的ANFIS獲得了比一維輸入變量的ANFIS更接近于實際值的預測值,且更準確地捕捉到了HS300IFC收益波動率的峰值和谷值。因此,從提高波動率預測精度角度出發,本文構建的四維輸入變量ANFIS預測模型更加合理,是一種有效的高頻股指期貨收益波動率預測方法。
四、結論
本文將ANFIS直接用于高頻股指期貨收益波動率預測。鑒于高頻股指期貨收益波動率的復雜性和非線性特點,以前一期的收益波動率、開盤價格、最高價格、收盤價格作為輸入變量,構建基于四維輸入變量的ANFIS。實證研究結果表明,四維輸入變量ANFIS的高頻股指期貨收益波動率預測性能優于RBFNN和一維輸入變量ANFIS,獲得了比一維輸入變量的ANFIS更接近于實際值的預測值,且更準確地捕捉到了收益波動率的峰值和谷值,為高頻股指期貨波動率預測提供一種新思路。
參考文獻
基金項目:河北省2018年度引進留學人員資助項目(編號:C201820)。
作者簡介:通訊作者:耿立艷(1979-),女,天津寶坻人,博士后,教授,碩士生導師,研究方向:金融工程。