崔金鑫, 鄒輝文
(福州大學 經濟與管理學院, 福州 350116)
(福州大學 投資與風險管理研究所, 福州 350116)
原油期貨作為一種非常關鍵的能源金融衍生品,其價格變化幅度較大, 且具有較高的時變特征, 原油期貨價格的變化對全球經濟都產生著顯著的影響[1].因此, 對其價格作出準確的預測, 不僅可以為期貨投資者以及市場監管者提供決策參考, 同時也利于原油期貨市場的長期健康發展.然而, 與其他金融價格序列相類似, 原油期貨價格序列具有非平穩、非線性、多頻率等典型特征, 因此, 對其價格作出精準預測較為困難.即便如此, 國內外依然有學者對其展開了預測研究.
傳統的金融時間序列預測方法主要包括ARMA(AutoRegressive Moving Average)模型、ARIMA(AutoRegressive Integrated Moving Average)模型和GARCH (Generalized AutoRegressive Conditional Heteroskedasticity)模型, 然而它們無法完全挖掘出金融時間序列的非線性特征, 預測效果往往不佳.隨著數據統計科學以及計算機技術的發展, 神經網絡模型受到了學者們的青睞, 并在金融時間序列預測領域得到了大量的應用, 例如: ANN (Artificial Neural Network)人工神經網絡模型[2]、SVR (Support Vector Regression)支持向量機回歸模型[3]、BPNN (Back-Propagation Neural Network)神經網絡模型[4]、ELM(Extreme Learning Machine)極限學習機模型[5]、ANFIS (Adaptive Network-based Fuzzy Inference System)自適應模糊推理系統[6]、LSTM (Long Short-Term Memory)長短記憶神經網絡模型[7]等.隨著預測研究的不斷深入, 學者們發現單一機器學習預測模型的預測性能仍有提升的空間, 因此學者們探尋出了一種更加有效的預測模型: 數據分解技術與機器學習算法相結合的預測模型.遵循著“分解”、“預測”、“集成”的整體建模架構, 國內外學者們針對金融價格時間序列展開了大量的預測研究, 例如: 將經驗模態分解算法與前饋神經網絡相結合的EMD-FNN (Empirical Mode Decomposition-Feed forward Neural Network)模型[8];將集合經驗模態分解算法與粒子群算法優化的最小二乘支持向量機進行結合的EEMD-PSO-LSSVM(Ensemble Empirical Mode Decomposition Particle Swarm Optimization Least Square Support Vector Machine)模型[9]、將集合經驗模態分解方法、長短期記憶模型和Adaboost 算法相結合的EEMD-LSTMAdaboost 模型[10]、將互補集合經驗模態分解與改進的極限學習機相結合的CEEMD-EELM (Complete Ensemble Empirical Mode Decomposition-Extended Extreme Learning Machine)模型[11]等.
CEEMDAN 完全自適應集合經驗模態分解是由Colominas 等[12]提出的, 利用一種自適應的噪聲生成算法對EEMD 集合經驗模態分解算法進行改進, 由于CEEMDAN (Complete Ensemble Empirical Mode Decomposition with Adaptive Noise)分解算法所具備的優異性能, 因而近些年來被大量學者所采用, 并且將其與機器學習預測模型相結合并應用到各個領域, 例如: 股市預測[13]、風速預測[14]、交通流預測[15]、電力負荷預測[16].然而, 目前尚未有學者將其運用于原油期貨價格預測.基于此, 本文采用CEEMDAN 分解算法對原始的原油期貨價格序列進行分解, 以期更好地挖掘出原始價格序列的內在特征.
PSO-ELM 基于粒子群優化的極限學習機模型目前在二氧化碳排放量預測[17]、太陽能光伏發電量預測[18]、交通流量預測[19]、碳排放權交易價格預測[20]等領域均已顯示出其優異的預測性能.然而, 還未曾見到將PSOELM 模型用于原油期貨價格預測的文獻.因此, 本文將PSO-ELM 模型作為基礎預測模型, 探究其是否可以提升原油期貨價格預測的精準性.
綜合已有文獻, 多數學者針對石油現貨價格展開預測研究.然而, 隨著商品金融化程度的不斷加深和商品期貨市場規模的不斷擴大, 商品現貨價格逐漸參照期貨進行定價, 尤其是石油現貨價格的定價完全參照期貨價格[21].因此, 對原油期貨價格序列展開預測研究將更具現實意義.基于以上認識, 將CEEMDAN 數據分解算法和PSO-ELM 粒子群優化的極限學習機模型進行組合, 本文構建出了一種CEEMDAN-PSO-ELM預測模型, 以期進一步提升原油期貨價格預測的精準性和穩健性.
在經典的集合經驗模態分解過程中, 一定次數的平均并不能完全抵消所添加的白噪聲序列, 并且重構誤差的大小與集成的次數有關.盡管重構誤差會隨著平均次數的增多而逐漸地減小, 但是所耗費的時間也會增加[16].而在本文采用的CEEMDAN 分解流程中,在每個階段添加有限次數的自適應白噪聲序列, 即可使得重構誤差在較少的平均次數逼近于零.
將原始的原油期貨價格序列記為 x(n ), 則第t(1,2,···,T)次 所添加的白噪聲序列記為λt( n), 因此, 第t次分解的原油期貨價格序列可以被表示為xt(n)=x(n)+λt(n) .將第i 個由EMD 分解算法和CEEMDAN分解算法產生的模態分量記為: Ei(·)和.參照已有研究[15,16], CEEMDAN 分解步驟如下:
第1 步: 先通過EMD 分解算法對原始原油期貨價格序列進行分解, 從而得到第一個模態分量:

第2 步: 在第一個階段 ( i=1)計算第一個唯一的余量信號:

第3 步: 將實驗重復 t(1 ,2,···,T)次, 在每次實驗過程中, 對信號 r1( n)+ε1E1(λt(n))進行分解, 當得到第一個EMD 模態分量時停止.此時得到第二個模態分量:

第4 步: 在剩下的每個階段中 (i= 2,3,···,I), 計算第i 個余量信號, 其計算方法與第三步相同.此時, 就可以得到第 i+1個模態分量:

第5 步: 判斷余量信號的極值點個數是否至多不超過兩個, 如果是, 則算法停止, 也即此時的余量序列無法繼續進行分解, 則一共得到 I個模態分量.最終的余量信號可以表示為:

因而, 原始的原油期貨價格序列 x(n) 最終可以被分解成為式(7):

極限學習機 (Extreme Learning Machine, ELM)是Huang 等[22]構建的一個只含有單個隱含層的前饋神經網絡, 對其輸入權重以及偏置進行隨機的初始化, 并且得到相應的權值.另外, 在訓練流程中并不需要對參數進行調整, 僅需對隱含層的神經元個數進行設置, 就可以得到唯一的最優解.具有簡潔高效, 無需調整參數,學習速度快的優點[23], ELM 極限學習機的基本網絡結構如圖1 所示.

圖1 ELM 模型結構圖[23]
極限學習機模型由輸入層、隱含層和輸出層構成.輸入層有n 個 神經元, 分別對應著n 個輸入變量; 隱含層有 l 個神經元; 輸出層有 m個 神經元, 分別對應著 m個輸出變量.
PSO 參數優化算法主要是對ELM 模型第i 個輸入層神經元與第 j個隱層神經元之間的連接權值 ω以及第j層隱層神經元的閾值b 進行尋優, PSO-ELM 模型的主要步驟包括[24]: 第1 步, 初始化粒子群算法的參數以及ELM 模型的參數, 其中第i個粒子的位置可以被表示為Xi=[ω11,···,ωh1,···,ω1n,···,ωhn,b1,···,bn]; 第2 步,尋找初始極值, 基于粒子的初始位置以及訓練集數據對ELM 模型進行訓練, 從而獲取ELM 的輸出值, 進一步算出粒子的適應度值.另外, 還需搜尋到個體及群體極值, 并且記錄它們的位置及適應度值; 第3 步, 選取慣性權重, 在經歷一定次數的迭代后, 粒子位置逐步趨于最佳, 此時慣性權重隨著迭代次數的增加而不斷減小; 第4 步, 進行迭代尋優操作, 在每一個迭代流程中,粒子依據個體和群體極值對自己的速度及所處的位置進行更新.不斷地重復迭代流程, 最后即可獲得最優個體的粒子位置及適應度值; 第5 步, 最優個體所對應的粒子位置即為ELM 模型的權值以及隱含層閾值.
Lempel-Ziv 復雜度指數是由Lempel 和Ziv[25]通過構建算法程序實現的, 由于其良好的性能在非線性科學中得到了廣泛的應用[26-28], 其主要被用來衡量序列的復雜性特征, 序列的Lempel-Ziv 數值越大, 表明序列的復雜度越高, 其所包含的周期成分越少, 規律性越弱,隱含的頻率信息越豐富; 反之, 序列的復雜度越低, 呈現出一種規律性特征, 序列會按照一定周期波動, 頻率相應較低.本文依據各個分量的Lempel-Ziv 數值來進行分量的重構操作, 以期提高分量重構的合理性.由于Lempel-Ziv算法流程較為復雜和冗長, 鑒于篇幅限制,此處不再贅述, 詳細流程可見文獻[25].
本文的CEEMDAN-PSO-ELM 原油期貨價格預測模型構建流程如圖2 所示.

圖2 CEEMDAN-PSO-ELM 預測模型構建
遵循已有的“分解”、“重構”、“預測”和“集成”的整體構建流程.第1 步, 數據分解階段, 先采用魯棒性更優的CEEMDAN 分解算法對原油期貨原始價格序列進行分解, 進而得到若干個IMF (Intrinsic Mode Function)本征模態分量和一個殘余項; 第二步, 分量重構階段, 先計算各個分量的Lempel-Ziv復雜度指數, 然后按復雜度數值的高低進行歸類, 從而將分解出的分量進行重構, 最終得到高頻、中頻和低頻分量; 第3 步,重構分量預測階段, 利用PSO-ELM 粒子群優化的極限學習機模型對高頻、中頻和低頻分量分別建立相應預測模型, 采用PACF (Partial Auto Correlation Function)偏自相關系數選擇預測模型的輸入變量, 進而得到3 個重構分量的預測結果; 第四步, 預測結果集成階段, 也即將高頻、中頻和低頻分量的預測結果進行加總集成, 進而得到最終的原油期貨價格預測結果.
本文的預測模型在理論上具備以下3 點優勢: (1) 本文采用了更為穩健有效的CEEMDAN 分解算法, 它在分解流程的每一個步驟增添自適應噪聲, 然后計算單一的余量信號從而獲取各個模態分量, 可以有效解決EMD 模態混疊及EEMD 分解不徹底的問題[16]; (2) 本文選取ELM 極限學習機作為基準預測模型, 在其訓練過程無需調整參數, 運行效率較高, 預測性能較優.并且, 采用PSO 粒子群優化算法對輸入層權值及隱含層閾值進行參數尋優, 進一步提升ELM 預測模型的性能.(3) 本文預測模型遵照已有的“先分解后集成”的經典預測模型建模思路, 將智能分解算法及機器學習預測模型進行組合, 以期充分利用二者的優勢, 較經典的計量模型及單一智能預測模型, 本文的預測模型在理論上更具穩健性和有效性.
本文參照龔旭和林伯強[1]的研究設定, 選取世界上交易量最大, 影響最廣泛的原油期貨合約之一的WTI西德克薩斯中質原油月連續期貨交易合約.樣本區間跨度從2015 年3 月24 日至2019 年1 月31 日, 共包含1000 個交易日; 參照已有研究[29,30]的區間劃分方法,將總樣本的前80% (2015-3-24 至2018-4-24, 800 個交易日)作為模型的訓練集, 用于訓練PSO-ELM 預測模型, 將剩余的20% (2018-4-25 至2019-1-31, 200 個交易日)作為模型的測試集, 用來測試模型的預測性能.本文的數據均來自WIND 萬德數據庫, 文章的實證過程均基于Eviews10 和Matlab 2014 (a)完成.
圖3 給出了WTI 原油期貨價格序列圖, 可以明顯看出, 原油期貨價格序列呈現出明顯的波動性和非平穩性.表1 為原油期貨價格序列描述性統計, 其結果也說明, 原油期貨價格序列較離散, ADF (Augmented Dickey-Fuller)統計值P 值為0.4271, 表明原油期貨價格序列非平穩.
為了進一步檢驗原油期貨價格序列是否存在非線性特征, 本文對其進行了BDS (Brock-Decher-Scheikman)檢驗, 從表2 的檢驗結果可以看出, 嵌入維數從2 增加到10, P 值均為0, 表明原油期貨價格序列呈現出典型的非線性特征.

圖3 原油期貨日度價格序列圖

表1 原油期貨價格序列描述性統計
樣本的描述性統計和BDS 檢驗表明原始的原油期貨價格序列呈現出典型的波動性、非平穩性和非線性特征.為了進一步挖掘價格序列的內在特征, 本文采用CEEMDAN 分解算法對原油期貨價格序列進行分解, 共得到9 個IMF 本征模態分量和1 個殘余項, 如圖4 所示.

表2 原油期貨價格序列非線性檢驗結果

圖4 原油期貨價格序列CEEMDAN 分解結果
為了使分量重構過程更加科學, 此處依據Lempel-Ziv 復雜度指數的數值來對分量進行重構, 從表3 的復雜度計算結果可以看出, IMF1~IMF4 的復雜度數值較大, 說明前4 個分量所包含的周期成分較少, 變化規律性低, 序列趨于一種隨機狀態; IMF5~IMF7的復雜度數值處于中等水平, 表明中間3 個分量存在一定的規律性,包含的頻率成分相對較少; IMF8、IMF9和殘余項的復雜度數值均小于0.1, 表明這3 個分量的周期性和規律性較強, 序列復雜度較低.因此, 本文將前4 個分量IMF1~IMF4 重組為高頻分量, 中間3 個分量IMF5~IMF7 重組為中頻分量, 剩余的兩個分量以及殘余項重組為低頻分量, 分量重構結果如圖5 所示.

表3 Lempel-Ziv 復雜度指數計算結果

圖5 原油期貨價格序列分量重構結果
圖5 所給出的分量重構結果同樣具備一定的經濟含義[10], 高頻分量呈現出十分復雜的序列特征, 代表著短期的市場波動因素, 這種短期因素所引起的原油期貨價格序列的波動是不可持續的, 且方向不定, 頻率較高; 中頻分量的波動特征相對平緩, 代表著重大事件對原油期貨價格序列的影響, 這種因素使得原油期貨價格發生大幅度變化, 且持續時間較長, 但是最終會恢復到長期趨勢線上; 低頻分量呈現出非常平緩的趨勢特征, 代表著原油期貨價格的長期走向, 不易受到市場及外部環境因素的沖擊, 可以通過低頻分量預測未來的原油期貨價格的大致走勢.
在完成了分量重構以后, 便可以對高頻、中頻和低頻重構分量分別建立PSO-ELM 預測模型, 而在機器學習模型初始訓練階段, 參數的設定以及模型輸入變量的選取都會對模型的預測效果造成顯著影響,在參考了大量研究后, 本文的預測模型參數設定如下: PSO參數尋優算法的初始種群大小為25, 最大迭代次數為200, 慣性權重 wmin=0.8,wmax=1.2 ,加速因子c1=c2=2.0.利用PSO 對ELM 極限學習機模型進行參數尋優操作; ELM 模型的隱含節點設定為30, 隱含層節點輸出權值范圍為[-1, 1], 隱含層節點閾值取值范圍為[0, 1], 輸入層個數即為輸入變量的個數 (需根據具體的預測分量而定).在預測模型的參數設定好了以后, 還需要確定高頻、中頻和低頻分量預測模型的輸入變量,本文采用PACF 偏自相關系數[29,31]來進行判定.本文最終的輸入變量選擇結果如表4 所示.

表4 輸入變量選擇結果
圖6-圖8 分別給出了高頻、中頻和低頻分量的預測結果.
從圖6-圖8 可以明顯地看出, 中頻分量和低頻分量的預測效果顯著優于高頻分量.原因可能是高頻分量的序列復雜度較高, 序列中所包含的規律性特征較少, 因而利用極限學習機模型對高頻分量進行預測仍然存在一定的誤差.將高頻、中頻和低頻分量各自的預測結果進行加總集成, 便得到了最終的原油期貨價格預測結果.
圖9 顯示CEEMDAN-PSO-ELM 模型的預測結果.
從圖9 可以清晰地看出, CEEMDAN-PSO-ELM 模型的預測值與真實值高度接近.為了更加科學穩健體現本文所構建模型的優異預測性能, 還需與本文所選取的基準預測模型進行預測效果的對比分析.

圖6 高頻分量預測結果

圖7 中頻分量預測結果

圖8 低頻分量預測結果

圖9 CEEMDAN-PSO-ELM 預測結果
為了科學穩健地體現出本文所構建的CEEMDANPSO-ELM 模型的優越性, 本文另外選取了15 個基準對比預測模型.在對比模型的選取上, 本文主要基于以下3 個方面的考量: (1)選取BPNN、SVR、ANFIS 和ELM 4 種單一的機器學習預測模型, 利用模型自身內部算法學習能力對原油期貨價格進行預測; (2)采用PSO 粒子群參數優化算法對4 種單一預測模型的參數進行尋優, 以期提升它們的預測性能; (3)分別將EEMD 和CEEMDAN 兩種分解算法與經過PSO 參數優化的4 種預測模型相結合.
通過分組對比, 可證明本文構建的預測模型性能的優越性, 也可體現出CEEMDAN 分解算法及PSO 粒子群參數優化算法的有效性, 還能體現出組合預測較單一預測模型的優勢.另外, 此處采用均方根誤差(RMSE)、平均絕對誤差(MAE)、平均絕對誤差百分比(MAPE)、Theil 不等系數(TIC)以及平均方向精準度(MDA)作為各模型預測效果評價指標, 本文相關計算公式如式(8)-式(12).其中, T 表示預測樣本數, Yt代表t 時刻的原油期貨價格真實值, Pt代表t時刻的原油期貨價格預測值.RMSE、MAE、MAPE 和TIC 都是預測誤差衡量指標, 值越小表明模型的預測效果越好;MDA 是衡量原油期貨價格預測結果趨勢與真實原油期貨價格趨勢一致程度的指標, 值越大說明模型預測結果方向精準度越高.

圖10 和表5 給出了本文16 種預測模型的預測效果對比.

圖10 模型預測結果對比圖
從圖10 和表5 中可以清晰地看出: 各個機器學習預測模型均具備一定的預測性能; PSO 粒子群優化算法提升了BPNN、ANFIS、SVR 和ELM 等4 種單一預測模型的預測性能; 將機器學習預測模型與數據分解算法相結合可以顯著地提升單一預測模型的預測性能; 本文所采用的CEEMDAN 數據分解算法的表現,在一定程度上優于常用的EEMD 數據分解算法; 而ELM 極限學習機模型在單一預測模型中的預測性能最佳, 表明本文選取ELM 模型作為基礎預測模型具備一定的合理性; 本文構建的CEEMDAN-PSO-ELM 預測模型不僅預測誤差指標數值最低, 且方向精準性指標數值最高, 表明其預測性能最佳.為了保證本文實證結果的穩健性, 還需要進一步進行MCS (Model Confidence Set)以及DM (Diebold-Mariano)預測性能穩健性檢驗.
MCS 檢驗是由Hansen 等[32]提出的衡量模型預測性能的一種方法, 相較SPA (Superior Predictive Ability)更穩健.由于篇幅限制, MCS 檢驗的理論框架及流程詳見Hansen 等[32]、Zhang 等[33].為了得到MCS 檢驗中的各統計量以及 p值, 本文參照雷立坤等[34]的做法,將MCS 檢驗的參數設置如下: d=2 (block length), 模擬次數B=10 000 次作為Bootstrap 過程的控制參數,MCS 檢驗的顯著性水平 α取值為0.1, 也即 p值大于0.1 的模型將幸存下來.
DM 檢驗是由Diebold 和Mariano[35]提出一種衡量模型預測效果的方法, DM 檢驗的原假設是目標模型A 的預期預測精準性與基準模型B 的預測精準性一致, 因此原假設可以表示為:


式中,

表6 和表7 分別給出了模型預測結果的MCS 穩健性檢驗和DM 穩健性檢驗結果, 從中可以看出, 本文所構建的CEEMDAN-PSO-ELM 原油期貨價格預測模型相較于其他15 種基準模型預測性能最佳, EEMDPSO-ELM 模型的預測性能僅次于CEEMDAN-PSOELM 模型, 其余結論與3.4 節一致, 此處不再贅述.

表5 模型預測效果對比表
原油期貨價格序列具有典型的非平穩、非線性以及多頻率特征, 鑒于原油期貨價格序列預測的復雜性,本文構建了一種CEEMDAN-PSO-ELM 預測模型, 在本文的樣本區間內, 得出以下實證結論: (1) 利用PSO粒子群參數優化算法對SVR、ANFIS、BPNN 和ELM等4 種單一預測模型參數進行優化, 可以顯著提升單一預測模型的預測性能; (2) ELM 極限學習機的預測性能優于SVR、ANFIS 和BPNN 等3 種單一預測模型;(3) 將數據分解算法與機器學習預測模型相結合可以顯著提升其預測性能; (4) 本文所構建的CEEMDANPSO-ELM 原油期貨價格預測模型與其余基準預測模型相比預測性能最佳, 并且具備一定穩健性.本文的研究成果可以為期貨市場投資者及監管者提供有力的決策參考, 同時為原油期貨價格預測領域提供一種的新的視角和方法.
不可否認的是, 本文的預測模型也存在一定的不足之處: 第一, PSO 粒子群參數優化算法在運行過程中可能會陷入局部極值, 導致參數尋優效果不佳; 第二,在輸入變量的選取上, 本文沒有考慮到現實中影響原油期貨價格變動的因素.因而, 可以從以下兩方面改進預測模型: 第一, 將粒子群算法與其他的參數優化算法相結合 (例如粒子群算法與引力搜索算法結合-PSOGSA算法)對機器學習預測模型進行參數尋優; 第二, 優化預測模型輸入變量的選取方法, 可以在模型輸入變量選取上考慮更多的現實影響因素.

表6 MCS 檢驗結果

表7 DM 檢驗結果