熊 濤,鮑玉昆
(1.華中農業大學經濟管理學院,湖北 武漢 430070; 2.華中科技大學管理學院,湖北 武漢 430074)
我國大豆期貨合約于1993年12月在大連商品交易所上市交易,是我國最早上市的農產品期貨之一。自上市以來,大豆期貨成交量逐年增加,2016年,大豆期貨合約的成交額和成交量分別高達2448億元和651萬手。經過近25年的發展,我國大豆期貨價格已成為重要的大豆市場價格表現指標,對大豆生產經營者提供了較準確的遠期價格波動信息,也是大豆產業鏈從業者進行套期保值決策的重要依據。然而,大豆期貨在發揮其市場功能的同時仍難以擺脫衍生品固有的高風險特征,保證金交易和強行平倉制度等,使得大豆期貨價格波動會造成套期保值者與投機者獲利或損失成倍放大,使用不當不僅容易誘發金融市場的極端風險,也將危害大豆生產經營活動。因此,深入分析大豆期貨價格波動規律、明晰大豆期貨價格決定機制、進而準確預測大豆期貨價格走勢,對于大豆產業鏈套期保值者規避價格風險,期貨投機者理性投資以及有關政府管理部門科學合理發揮大豆期貨的市場功能具有重要意義[1]。
人們在進行套期保值和追逐風險收益的同時,越發關注農產品期貨市場潛在的價格風險及可能帶來的經濟損失和對農業生產經營的沖擊,因此大量學者積極投身到農產品期貨市場預測研究中,相繼提出多種預測理論與方法。早期主要以統計學為學科基礎的自回歸(Wen和Wang[2])、移動平均(Weng和Shy[3])、指數平滑模型(Weng和Shy[3])為主,模型簡單且具有較好的解釋性,但因其本質視數據規律服從線性特征而很難準確地預測復雜多變的農產品期貨價格。鑒于此,從非線性特征(Onour和Sergi[4])、價格跳躍(Schmitz等[5])、長記憶性(Power和Turvey[6];Wu等[7])、時頻分析(Power和Turvey[6];Yang和Zhang[8];He和Wen[9])、混合模型(王書平和朱艷云[10];楊科和田鳳平[11];Xiong等[12])、高頻交易信息(Huang等[13];楊科和田鳳平[14])等視角對農產品期貨價格進行預測建模成為近年來的熱點。例如,Power和Turvey[6]運用小波分析對農產品期貨價格的長記憶性、長依賴性與可預測性進行研究。Schmitz等[5]整合隨機波動率、價格跳躍、季節性和持有隨機成本,構建考慮價格跳躍的隨機波動率模型對農產品期貨價格進行預測。He和Wen[9]從量價分析的視角,運用小波相干分析對農產品期貨市場的可預測性與市場有效性進行研究。楊科和田鳳平[14]對我國農產品期貨市場已實現波動率的長記憶性與區制轉換性進行分析,進而構建長記憶馬爾科夫區制轉換模型對已實現波動率進行預測。然而,上述研究局限于從農產品期貨價格本身的波動特征構建預測模型,忽視了農產品期貨市場的內外部因素對該價格的影響。
作為典型的糧油兼用農產品,大豆具有糧食作物、飼料作物和能源作物等多重屬性,使得大豆期貨價格易受供需因素與宏微觀經濟因素等的影響。因而,有學者從多變量時間序列分析出發,探討某種(類)因素對農產品期貨價格波動的影響,進而構建預測模型(Garcia[15];Sanders等[16];Karali和Power[17];劉慶富和張金清[18];Zhang和Qu[19])。例如,Garcia[15]運用同步估計方法研究期貨期權對農產品期貨價格的預測性能。基于Spline-GARCH模型,Karali和Power[17]分析宏觀經濟因素對農產品期貨價格波動率的短期與長期影響機理。Sanders等[16]對美國商品期貨交易委員會發布的交易員持倉報告對農產品期貨價格波動的預測性能進行研究。Zhang和Qu[19]構建ARJI-AGRCH與ARMA-GARCH模型研究國際原油價格沖擊對中國農產品期貨價格的影響。劉慶富和張金清[18]采用基于蒙特卡洛馬爾科夫鏈模擬的貝葉斯技術研究大豆和小麥期貨隔夜信息對日內交易的預測能力。但是,上述研究局限于探討某種(類)因素對農產品期貨價格的影響,并在預測建模中受限于固定解釋變量及系數的預測模型,系統全面地考察期貨市場和宏微觀經濟環境等因素對農產品期貨價格的時變性影響程度,進而構建預測模型相對空白,也更加復雜,需要統籌考慮解釋變量及其回歸系數時變性。
2010年,Raftery等[20]初創性地提出動態模型平均(Dynamic Model Averaging,DMA)理論,以解決包含大量解釋變量的多變量時間序列預測問題。動態模型平均理論根據預測表現動態選擇解釋變量和系數時變程度,在有效控制模型和系數不確定性的同時,最大限度地綜合利用各種內外部信息(郭永濟等[21])。因此,動態模型平均可以有效降低單變量預測模型不能兼顧不同外部環境對于目標時間序列的影響所導致的預測結果的不確定性。目前,動態模型平均已在通貨膨脹(崔百勝[22];Koop和Tole[23];Filippo[24];郭永濟等[21])、外匯市場(Gupta等[25];Bruyn等[26])、商品市場(Buncic和Moretto[27];Bork和M?ller[28];Wei等[29];Risse和Ohi[30])等預測場景得到成功的應用。動態模型平均能夠有效地捕捉解釋變量及其回歸系數的時變特征,并在此基礎上構建預測模型,對于大豆期貨價格這類波動特征復雜化與影響因素多元化的預測建模問題,動態模型平均理論在識別大豆期貨價格影響因素的時變特征、進而提升大豆期貨價格預測性能和穩定性上具有重大潛力。
鑒于此,本文提出一套基于動態模型平均理論的大豆期貨價格影響因素與預測分析框架。本文以大連商品交易所上市的黃大豆1號期貨價格為研究對象;考慮到大豆的多重屬性與我國大豆較高對外依存度,本文從期貨市場和和經濟環境等方面選擇美國大豆期貨價格、中國大豆期貨注冊倉單量、換手率和成交量、中國大豆現貨價格、美國西德克薩斯(WTI)輕質原油現貨價格和美元兌人民幣匯率等7個變量作為解釋變量。通過分析以上7個解釋變量對大豆期貨價格的時變性影響特征,并在此基礎上構建大豆期貨價格預測模型,探究允許解釋變量及其回歸系數隨時間變化的大豆期貨價格預測效果。
本文的主要貢獻如下:(1)首次將動態模型平均理論引入到農產品期貨市場價格分析與預測研究中,拓展動態模型平均理論應用領域的同時,為農產品期貨市場分析提供一種新的分析框架。(2)提出一套基于動態模型平均理論的大豆期貨價格影響因素與預測分析框架,通過解決解釋變量及其回歸系數的時變性問題,構建準確的大豆期貨價格預測模型。(3)針對我國大豆期貨價格影響因素的多元性問題,本文從期貨市場與經濟環境兩方面選取7個經濟變量用做大豆期貨價格預測,并首次明晰以上7個經濟變量對大豆期貨價格的時變性影響特征,增進對我國大豆期貨價格決定機制的了解。(4)基于預測誤差指標和Diebold-Mariano檢驗法,本文構建的基于動態模型平均的大豆期貨價格預測模型明顯優于基準模型,為大豆期貨價格預測提供一種新的建模框架。
自Raftery等[20]提出動態模型平均理論以來,該理論已成為復雜經濟環境下探究經濟變量影響因素的時變特征及預測經濟變量未來走勢的重要基礎性分析框架。本節對動態模型平均理論進行簡要闡述,首先從時變參數模型(Time Varying Parameter,TVP)入手。TVP允許回歸系數隨時間變化,能有效的捕捉各解釋變量對被解釋變量的時變影響程度,進而提升建模與預測準確度,已被成功的應用于宏觀經濟預測等諸多領域。然而,在經濟預測實踐中,經濟變量中的結構突變,可能導致某些時點需要大量的解釋變量而另一些時點僅需要少量的解釋變量,TVP不能解決此類解釋變量的動態選擇問題,也難以捕捉結構突變對預測建模的影響(Koop和Tole[23])。此外,待估參數的增加將導致TVP出現過擬合現象,降低預測的推廣性(Koop和Tole[23])。
動態模型平均理論能高效地解決以上問題。假設存在m個解釋變量,則將有K=2m個時變參數模型(k=1,2,…,K):
(1)

針對第一個問題,可利用卡爾曼濾波更新方法,采用遞歸方法進行預測。設
(2)

yt|Yt-1
(3)
(4)

(5)
其中κ為衰減因子。根據文獻(RiskMetrics[31]),本文設定κ=0.94,其表示20個交易日之前預測誤差最多達到上一期預測誤差權重的30%;
至此,通過引入遺忘因子λ和衰減因子κ,有效地解決了各時變參數回歸模型的估計問題。接下來探討模型選擇概率的估計問題。設πt|t-1,k表示在t-1時刻,πt|t-1,k表示模型k是進行yt預測的正確模型的概率。在模型k(k=1,…,K)的預測密度和轉移概率pk(yt-1|yt-2,yt-3…y1)可知的情況下,如果采用馬爾科夫鏈描述K個模型的演化過程,則得到
(6)

(7)
其中α(0<α≤1)為Raftery等[20]引入的另一個遺忘因子,與λ具有相似的功能。根據Koop和Tole[23]的建議,本文設定α=0.99。通過公式(8),可更方便的理解遺忘因子α對模型選擇的影響。
(8)
其中,pk(yt-i|yt-i-1…y1)為模型k的預測密度,該值由卡爾曼濾波所得,用于衡量模型的預測表現。在t-1時刻,如果模型k對t時刻的觀測值預測效果較好,則對該模型k賦予較大的權重。
(1)變量描述
大豆期貨合約價格序列的選取和影響因素的確定是本文數據選擇的關鍵。黃大豆1號期貨合約以食用品質非轉基因大豆為標的物,黃大豆2號期貨合約以榨油品質轉基因、非轉基因大豆為標的物。由于我國實行嚴格的轉基因大豆管理制度,使得黃大豆2號合約自2004年上市以來成交量持續低迷,故本文采用近交割日法生成黃大豆1號期貨合約日度收盤價格序列,作為被解釋變量。
借鑒已有研究農產品期貨價格預測理論與實證文獻,本文從期貨市場與經濟環境兩方面選取7個經濟變量用做中國大豆期貨價格預測。美國大豆期貨作為全球最重要的大豆期貨合約,顯著影響我國大豆期貨價格波動(夏天和程細玉[32]);而大豆期貨注冊倉單量、換手率和成交量等交易行為變量也將明顯影響大豆期貨價格波動(Etienne等[33]),因而期貨市場方面包括美國大豆期貨價格、中國大豆期貨注冊倉單量、換手率和成交量等4個變量。我國大豆現貨價格對期貨價格存在顯著的因果關系(夏天和程細玉[2]);而作為典型的糧油兼用農產品,大豆期貨價格與國際原油價格也存在明顯的動態關聯性(Zhang和Qu[19]);此外,作為對外依存度高達90%的農產品,外匯市場也將影響我國大豆期貨價格(熊正德等[34]),因而經濟環境方面包括中國大豆現貨價格、WTI原油現貨價格、美元兌人民幣匯率等3個變量。
除了以上7個經濟變量以外,滯后1期至3期的大豆期貨價格也做選作解釋變量(根據施瓦茲信息準則確定),但該滯后3期解釋變量的回歸系數不隨時間變化。以上所有變量均為日度數據,來自Wind資訊金融終端,時間跨度為2008年10月10日至2017年6月15日,共1878個樣本,其中2008年10月10日至2009年7月29日作為初始樣本區間(共100個樣本),為模型預測提供先驗信息。從2009年7月30日開始向前一步滾動預測,即根據初始樣本區間估計2009年7月30日的大豆期貨收盤價,然后將2009年7月30日的大豆期貨收盤價真實值加入初始樣本,估計2009年7月31日的大豆期貨收盤價,以此類推,直到估計出2017年6月15日的大豆期貨收盤價,因此,滾動預測區間的樣本量為1778。由于時變參數模型的估計要求解釋變量與被解釋變量均滿足平穩性,因此本文首先運用ADF檢驗探究各變量的平穩性,進而對非平穩變量進行相應的平穩性轉換。平穩性檢驗結果和平穩性轉換方法見表1。

表1 變量的平穩性檢驗結果和平穩性轉換方法
注:***表示在99%置信度上顯著。轉換代碼T code分別表示為:1-不做轉換,2-做一階差分。
(2)預測誤差評價
為有效評價模型預測表現,本文選取均方根誤差(Root Mean Square Error,RMSE)和對稱平均絕對百分比誤差(Symmetric meanabsolutepercentageerror,SMAPE)作為模型預測的評價指標,RMSE和SMAPE越小,表示預測準確度越高。RMSE和SMAPE表達式如下:
(9)
(10)

除了上述預測誤差指標,本文運用Diebold-Mariano(DM)檢驗法(Diebold等, 1995)進一步探究基于動態模型平均的大豆期貨價格預測模型與基準模型的預測表現是否存在顯著差異。在DM檢驗法中,損失函數設定為均方預測誤差(mean square prediction error),原假設為被檢驗預測模型te的均方預測誤差優于參照預測模型re的均方預測誤差。具體的,DM統計量定義為
(11)

如上節所述,本文選擇美國大豆期貨價格、中國大豆現貨價格、WTI原油現貨價格、中國大豆期貨注冊倉單量、換手率、成交量和美元兌人民幣匯率等7個經濟變量(解釋變量)用于我國大豆期貨價格預測。因此,基于動態模型平均理論,本文共需構建27=128個預測模型,各預測模型的解釋變量及其系數各不相同,能夠準確地捕捉各解釋變量對大豆期貨價格影響程度的時變特征。本節著重描述大豆期貨價格影響因素的時變特征,下節將分析基于動態模型平均的大豆期貨價格預測模型與基準模型的預測表現。
動態模型平均理論可以根據模型的預測表現在不同的時點選擇最優的解釋變量,因此,各預測時點的平均解釋變量個數存在明顯差異。本文設定Sizek為模型k的解釋變量個數,πt|t-1,k為模型k是進行yt預測的正確模型的概率,其中k=1,2,…,K,K=8192為預測模型總數。那么,各預測時點的平均解釋變量個數定義如下:
(12)
動態模型平均可以根據模型的預測表現在不同的時點選擇最優的解釋變量和時變系數,所以,在各時點的平均解釋變量個數也將發生變化。圖1描述了各時點的平均解釋變量個數。可以看出,各時點平均解釋變量的個數變化較大,解釋變量個數集中在3和4左右,均值為3.2。考慮到解釋變量總數為7個,動態模型平均傾向于選擇較少的解釋變量,在保證預測準確度的前提下可簡化預測模型,提升預測模型的可解釋性。

圖1 各時點平均解釋變量個數
更進一步,可根據各時點預測模型選擇概率的大小,將選擇概率最大的預測模型所選用的解釋變量個數提取出來,以表示各時點最優預測模型的解釋變量個數,如圖2所示。可以發現,在各時點,最優預測模型的解釋變量個數集中在1至3個,均值為1.8,進一步佐證了動態模型平均傾向于使用較少的解釋變量進行預測建模。此外,有213個時點(占比11.9%),最優預測模型不選用任何經濟變量,僅根據滯后1期至3期的大豆期貨價格進行預測建模。此外,分別僅有29個和1個時點,最優預測模型選用了5個和6個經濟變量進行預測建模,而未有選擇所有7個經濟變量的情況。

圖2 各時點最優預測模型的解釋變量個數
圖3展示了各解釋變量在各時點被用于預測建模的選擇概率。由圖3可知,總體而言,各解釋變量均呈現出明顯的時變特征,選擇概率波動劇烈,但變化模式不盡相同。首先聚焦期貨市場方面,美國大豆期貨價格的選擇概率經歷了高位運行、低位運行和高位震蕩的變化階段。具體的,在2008年低至2012年低的近845個交易日期間(占比47.5%),美國大豆期貨價格的選擇概率近似于1,說明在此期間美國大豆期貨價格對我國大豆期貨價格的影響程度很高;但隨后其選擇概率急劇下降,維持在0.4左右;其選擇概率低位運行近3年后,于2016年初迅速上升至0.8左右,并持續高位震蕩。較美國大豆期貨價格,我國大豆期貨注冊倉單量的選擇概率呈現出完全不同的變化態勢,注冊倉單量的選擇概率在2008年底于0.7迅速下跌至0.02,此后呈現出震蕩上揚的變化態勢,并于2013年初達到最大值0.92,此后平穩下跌至2017年中的0.38。我國大豆期貨換手率和成交量的選擇概率呈現出相似的震蕩上行變化態勢,波動尤為劇烈。

圖3 各解釋變量在各時點的選擇概率
聚焦經濟環境方面,中國大豆現貨價格的選擇概率呈現出震蕩下行的變化態勢,其在2008年底至2009年初的近196個交易日期間(占比11.1%)近似于1,隨后震蕩下行,保持在0.4至0.7的區間內波動。這說明,總體而言,近十年來我國大豆現貨價格對期貨價格的影響程度逐年下跌。相對于其他解釋變量,WTI原油現貨價格的選擇概率呈現出完全不同的變化態勢,其在樣本初期達到最大值0.91,繼而急劇下跌至0.08左右,此后平穩上升,雖然在2011年底經歷了一個短暫的急劇下跌階段,但迅速回到穩步上升的模式,維持在0.45左右。美元兌人民幣匯率的選擇概率波動較大,相繼經歷了低位震蕩、高位震蕩、急劇下跌和平穩上漲的變化階段,最小值為0.07,最大值達到0.73。
如第二章所述,本文構建的基于動態模型平均的大豆期貨價格預測模型的參數設定如下:λ=α=0.99。為評估該模型的預測表現,本文選擇如下6個預測模型作為基準模型,具體如下:
(1)動態模型選擇:λ=α=0.99;
(2)動態模型平均:λ=α=0.95;
(3)動態模型選擇:λ=α=0.95;
(4)貝葉斯模型平均:λ=α=1;
(5)時變參數模型(TVP);
(6)零漂移隨機游走模型;
模型(1)為動態模型選擇,其各時點最終預測值由各時點選擇概率最大的模型的預測值所得,參數取值與動態模型平均一致。模型(2)和(3)分別為動態模型平均和動態模型選擇,但參數取值為λ=α=0.95,與本文構建的基于動態模型平均的大豆期貨價格預測模型的參數取值不同,旨在進行穩健性分析,以探究參數取值的不同是否顯著影響預測表現。模型(4)為貝葉斯模型平均,其使用模型后驗概率加權平均單一模型,是一種特殊的動態模型平均(當λ=α=1時,動態模型平均轉變為貝葉斯模型平均)。模型(5)為時變參數模型(TVP),其不允許解釋變量時變,但允許解釋變量的系數時變,在各預測時點,TVP的解釋變量包括全部7個經濟變量和滯后1期至3期的大豆期貨價格。模型(6)為不帶漂移項(零漂移)的隨機游走模型。
各模型的預測表現如表2所示。由表2可得到如下結論:(1)動態模型平均(λ=α=0.99)與動態模型選擇(λ=α=0.99)的預測表現明顯優于其他預測模型,預測準確度相對較高,但以上兩個模型的預測表現相當。(2)無論參數設定為λ=α=0.99或λ=α=0.95,動態模型平均與動態模型選擇的預測表現均優于貝葉斯模型平均、TVP和隨機游走模型,這說明動態模型平均理論能夠根據預測表現動態選擇解釋變量和系數時變程度,在有效控制模型和系數不確定性的同時,最大限度地綜合利用各種內外部信息,進而明顯提升預測準確度。(3)隨機游走模型的預測表現最差,可能的原因是其忽視了重要影響因素對大豆期貨價格的解釋性。

表2 各模型的預測誤差
更進一步,本文分別將動態模型平均(λ=α=0.99)和動態模型選擇(λ=α=0.99)作為被檢驗預測模型,其他模型作為參照預測模型,進行DM檢驗,以探究基于動態模型平均的大豆期貨價格預測模型與其他模型的預測表現是否存在顯著性差異,DM檢驗結果如表3所示。

表3 DM檢驗結果
注:*和**分別表示在0.1和0.05的顯著性水平下顯著。
由表3可得到如下結論:(1)在0.1的顯著性水平下,動態模型平均(λ=α=0.99)或動態模型選擇(λ=α=0.99)的預測表現均顯著優于時變參數模型和隨機游走模型。(2)在0.1的顯著性水平下,動態模型平均(λ=α=0.99)的預測表現顯著優于貝葉斯模型平均;動態模型選擇(λ=α=0.99)的預測表現雖然優于貝葉斯模型平均,但不存在顯著性差異。(3)無論參數設定為λ=α=0.99或λ=α=0.95,在0.05的顯著性水平下,動態模型平均與動態模型選擇的預測表現均無顯著差異。
準確的大豆期貨價格預測指出了未來給定時間窗口中價格的波動幅度,不僅為度量極端價格風險、優化交易策略提供重要信息,還可以籍此設計有效的期貨市場風險管理工具。針對大豆期貨價格波動的復雜性及影響因素的多元性,本文將動態模型平均理論引入農產品期貨價格分析與預測研究中,通過動態選擇解釋變量和系數時變程度,在有效控制模型和系數不確定性的同時,最大限度綜合利用各種內外部信息,進而提高大豆期貨價格預測準確度。
具體的,本文構建基于動態模型平均的大豆期貨價格預測模型,考慮到大豆的多重屬性與我國大豆較高的對外依存度,本文從期貨市場和經濟環境等兩方面選擇美國大豆期貨價格、中國黃大豆1號注冊倉單量、換手率和成交量、中國大豆現貨價格、WTI原油現貨價格和美元兌人民幣匯率等7個影響因素用做中國黃大豆1號期貨價格預測,通過準確地識別出大豆期貨價格影響因素的時變特征,進而構建大豆期貨價格預測模型,并通過預測誤差指標和DM檢驗法評估其與基準模型的預測能力。研究結果表明,大豆期貨價格的影響因素存在明顯的時變特征,但變化模式不盡相同。通過準確地捕捉影響因素的時變特征,基于動態模型平均的大豆期貨價格預測模型的預測表現明顯優于基準模型。