李文君



關鍵詞:螺紋鋼期貨價格 CAM模型 預測
一、引言
期貨是一種金融工具,對于經濟的平穩運行起著重要作用。隨著市場對螺紋鋼需求的不斷擴大,信息不通暢、交易市場不透明所帶來的螺紋鋼價格變動風險不斷擴大,為了規避價格變動帶來的風險,2009年我國推出了螺紋鋼期貨。螺紋鋼期貨自上市以來已有十多年,在這期間我國鋼鐵行業發生了較人的變化,2012年鋼鐵行業供人于求,面臨經營困難,2016年供給側結構性改革又為鋼鐵行業帶來了希望,螺紋鋼期貨的價格曾一度劇烈波動,如何規避價格波動所帶來的市場危機亟待解決。螺紋鋼期貨是否發揮了其規避風險的能力、引導現貨價格的作用,如何對期貨價格做出準確的預測以便國家根據期貨價格的變化出臺相關政策來調整供求關系,鋼鐵企業怎樣合理安排生產、機構投資者與個人投資者理性投資是我們所要解決的問題。
螺紋鋼期貨價格在一定程度上是對未來螺紋鋼現貨市場供需情況的一個體現,對螺紋鋼現貨價格具有一定的引導作用。在市場價格出現惡意變動時,螺紋鋼期貨價格發現功能能夠適當減弱其引發的價格風險,同時對于提高市場的透明度、建立公平公正的期貨市場有著重要意義。進行螺紋鋼期貨價格研究能夠檢驗螺紋鋼期貨是否起到了規避風險、引導現貨價格的作用,同時鋼鐵企業、投資者、政府可以根據研究結果對未來的決策做進一步的規范。GAM模型可以最大限度地擬合變量值,很好地刻畫自變量和因變量之間的非線性關系,對于高頻波動的期貨價格能夠有一個很好的刻畫,基于此,本文采用GAM模型對螺紋鋼期貨價格預測進行研究,為鋼鐵企業、投資者、政府更好地把握市場,進行穩健決策提供依據。
二、GAM模型介紹
線性模型簡單、直觀、便于理解,解釋性能和推斷理論相對成熟,但是,在現實生活中,模型的線性假設只是對真實函數的一種近似,通常近似效果不理想,甚至違背實際情況,從而很人一部分模型難以用線性模型進行刻畫。
1990年,Hastie和Tibshirani擴展了加性模型的應用范圍,提出了廣義加性模型(CJeneral-izeci Ad(iitive Mo(iels,簡稱為CAM模型),它是廣義線性模型的擴展,是一種自由靈活的統計模型,可以最大限度地擬合各變量的散點圖,使其光滑化,用來探測非線性同歸的影響,直接處理響應變量與多個解釋變量之間的非線性關系,GAM模型允許在單個解釋變量和響應變量之間建立靈活的關系。
三、數據選擇與處理
在對影響螺紋鋼期貨價格的因素進行分析時,本文從以下三個方面選取變量作為影響螺紋鋼期貨價格的因素進行分析。
(1)供給相關變量:螺紋鋼產量、螺紋鋼社會庫存量、鋼材進口量。
(2)需求相關變量:房地產開發投資額、房屋新開工面積同比增速、鋼材出口量。
(3)期貨市場相關變量:持倉量、成交量。
成交量、持倉量數據來自上海期貨交易所官網,俠給和需求因素相關變量數據來自西本新干線( http://www.96369.net/indices/67)。以螺紋鋼主力合約收盤價格作為螺紋鋼期貨價格,價格選取的均為日價格。供給和需求因素相關變量數據與期貨價格數據存在著不同的時問頻率問題,為了解決這一問題,對于非日度數據如螺紋鋼產量、螺紋鋼社會庫存量、房地產開發投資額、房屋新開工面積、鋼材進出口量進行如下處理:月度數據度量的是一個月內的產量、投資、進出口量總量,因此在對月度數據處理時,首先取得月度數據的均值,然后進行線性插值,將月度數據轉化為日度數據進行分析,對于周庫存數據是直接做線性插值轉化為日度數據進行分析。
對數據時間段的選取仍要考慮成交量對數據的影響問題,2016年之前的期貨成交量較少,期貨發展不穩定,影響預測模型,因此各變量數據選擇范圍與期貨價格數據范圍一致,取2016年1月4日至2019年12月31日的數據進行分析。表1所示為各指標變量在論文中的表示。
四、螺紋鋼期貨價格影響因素分析
1.相關性分析
建立螺紋鋼期貨價格預測模型之前,首先需要對影響螺紋鋼期貨價格的各因素與螺紋鋼期貨價格之間的相關性進行判斷。因為各因素均不服從正態分布,所以采用spearman相關系數法,表2為各影響因素與期貨價格以及價格波動率之間的相關系數。
根據表2可知,螺紋鋼期貨價格與鋼材出口量高度負相關,但與其他各因素之間的相關系數均較低,說明螺紋鋼期貨價格與其他各影響因素之見的線性關系很小,因此可采用非線性模型進行擬合。變量間的相關關系還需要進一步的分析。表2中持倉量、鋼材出口量與螺紋鋼期貨價格的波動相關性相對較強,說明持倉量與鋼材出口量的變化會引起螺紋鋼期貨價格的劇烈波動。
2.灰色關聯分析
為了進一步對期貨價格與各因素之間的關系進行研究,為期貨價格預測提供理論依據,接下來將計算期貨價格與各因素之問的關聯度,以此判斷各變量與期貨價格的關聯程度。關聯度是考察變量間的關聯程度,如果兩個變量同步變化且變化趨勢一致,則可以說明兩個變量間關聯程度較高。表3所示為期貨價格與各變量之間的關聯度。
關聯度越接近1說明各自變量與螺紋鋼期貨價格這一因變量的關聯程度越高,對螺紋鋼期貨價格變動的影響越大。上述結果表明各變量與螺紋鋼期貨價格之間的關聯度均很高,說明各變量對螺紋鋼期貨價格變動均會產生較大影響。
3.變量解釋程度分析
為深入探討各影響因素與螺紋鋼期貨價格的關系,首先利用GAM模型對單個解釋變量進行擬合分析,各變量對螺紋鋼期貨價格的解釋程度如表4所示。
表4中的EDF為解釋變量光滑化時的自由度,理論上,當自由度接近1時,表示變量間近似為線性關系;當自由度大于1時,則表示變量間為曲線關系,根據表4可知各變量與螺紋鋼期貨價格之間的EDF值均大于1,說明各變量與螺紋鋼期貨價格之間的關系不是線性關系,不能建立線性回歸模型,建立廣義可加模型是合理的。
由表4可知,對螺紋鋼期貨價格的解釋程度最主要集中在房地產開發投資、房屋新開工面積以及鋼材出口量上。因為螺紋鋼是建筑房屋最主要的材料且主要應用于房屋建筑,因此螺紋鋼期貨價格由二者解釋程度較高。進出口作為調節供需關系的一個方面對期貨價格的解釋程度鋼材出口量占85. 8%,而鋼材進口量只占15. 3%。根據第二部分對我國鋼材進口量分析巾發現,我國鋼材進口景一直穩定在一個水平上,波動幅度很小。這就很好地說明了鋼材進口量對期貨價格的解釋程度僅占15. 3%,而鋼材出口量并不穩定且存在著較火的波動,說明我國鋼材出口量是根據國內供需現狀一直進行調節的。因此鋼材出口量對期貨價格的解釋程度為85. 8%是符合實際情況的。根據第二部分對螺紋鋼持倉量的分析可知在2009年至2016年年初,螺紋鋼持倉量一直在一個低水平波動,有一定的上升趨勢,2016年至今持倉量一直在一個較高水平波動,沒有明顯的上升或者下降趨勢,這就解釋了持倉量的解釋程度只有2. 35%,處在一個較低的解釋水平。
圖1所示曲線為螺紋鋼期貨價格與各影響因素擬合的效應曲線圖,其中實線為擬合的曲線,虛線表示兩倍標準差曲線。圖1中曲線反映的是各影響因素對螺紋鋼期貨價格的人體趨勢。
圖1(左上)中所示,當螺紋鋼社會庫存量在400萬噸以下時,隨著庫存量的增加,螺紋鋼期貨的價格是在不斷下降的;當螺紋鋼庫存量達到400萬噸之后,隨著庫存量的增加,期貨價格也是在不斷上漲的。螺紋鋼產量(右上)和房地產開發投資額(左下)與期貨價格的變動關系較為復雜,曲線也很接近,均是先上升然后小幅同落再上升。這是因為現有的期貨價格是在對市場新信息的綜合分析之后得到的一個合理價格,這個價格受到多方面因素的影響。期貨價格與房屋新開工面積同比增速(右下)擬合的曲線圖是在房屋新開工面積增加時,螺紋鋼期貨價格小幅降低然后迅速增長,接著出現了小幅下降,然后迅速下降。
在圖2鋼材進口量(左)與螺紋鋼期貨價格擬合圖顯示,當鋼材進口量大于3.1萬噸時,隨著鋼材進口量的增加螺紋鋼期貨價格不斷提高。鋼材進口增加,說明國內鋼材供不應求,螺紋鋼期貨市場針對這一新信息作出反應,期貨價格上漲。鋼材出口量(右)與期貨價格的擬合圖顯示隨著鋼材出口量的增加,螺紋鋼期貨價格在不斷降低。鋼材出口量增加說明我國供火于求,這與2012年我國出現的產能過剩現象相一致。產能過剩對于期貨市場是一個不利的消息,投資者對于未來鋼鐵行業的發展是不看好的,螺紋鋼期貨市場針對這一信息及時作出反應,期貨價格下降。
隨著持倉量(左)的不斷增加,期貨價格在不斷上升,中間雖然存在著小幅的下降,但是螺紋鋼期貨價格總體上是呈現上升趨勢的。隨著成交量(右)的增加,期貨價格是先上升再下降然后緩慢上升。螺紋鋼期貨價格隨著成交量的變化呈現出先上升再下降然后緩慢上升的趨勢,可能是在各成交量所對應的同時期其他影響因素對螺紋鋼期貨價格的影響更火(見圖3)。
五、GAM模型建立
首先將所有變量納入CAM模型的白變量中,建立Model 1進行分析。在擬合的Model 1中鋼材進口量這一變量并不顯著,因此采用后向剔除法將鋼材進口量因素剔除重新建立Model 2。并將新建立的Model 2與Model 1進行方差分析比較,比較結果如表5所示。
與Model 1進行比較,剔除鋼材進口量這一因素使得偏差顯著增加,因此剔除鋼材進口量這一因素不合理,此時考慮變量間的交互作用影響。鋼材進口量的變化取決于我國鋼材的產量,當產量不足時進口量會增加,因此考慮鋼材進口量與螺紋鋼產量的交互作用,將交互項納入變量建立Model 3進行分析。Model 3的結果表明在將鋼材進口量與螺紋鋼產量的交互項納入變量建模之后,鋼材進口量不再顯著,說明交互項的存在抵消了鋼材進口量的影響,因此剔除鋼材進口量這一變量,重新建立Model 4分析。
新的模型中房地產開發投資額這一變量在給定顯著性水平0. 01的情況下顯著,其他變量均在給定顯著性水平0. 001的情況下顯著,考慮剔除房地產開發投資額這一變量建立新的Mociel 5,并對Model 4和Moclel 5進行分析,判斷剔除房地產開發投資額這一變量是否合理。
檢驗結果表明剔除房地產開發投資額之后使得偏差顯著增加(見表6),因此剔除房地產開發投資額這一因素不合理,此時考慮變量間的交瓦作用影響。房地產開發投資額在一定程度上受到房屋新開工面積的影響,因此,考慮需求因素房地產開發投資額與房屋新開工面積同比增速之間的交互作用影響,將這一交互項納入變量建立模型分析,結果表明各變量均顯著,所以建立Model 6作為最終的模型進行分析。
六、模型檢驗
模型擬合之后還需要對其進行檢驗,因為GAM模型是廣義線性模型的延伸,因此對于線性模型的檢驗方法仍然適用于CJAM模型。
模型檢驗結果各變量均顯著,因此最終建立的模型為Model 6,納入模型巾的變量為螺紋鋼社會庫存量、房屋新開工面積同比增速、成交量、持倉量、螺紋鋼產量和鋼材進口量的交瓦項、鋼材出口量、房地產開發投資額和房屋新開T面積同比增速的交互項。各解釋變量在給定0. 001的顯著性水平下均是顯著的,模型的R2為0. 917,擬合效果很好,表明螺紋鋼期貨價格變動的92%均可以用模型來說明。
在表7中各光滑函數的F檢驗均顯著,說明擬合的光滑函數通過了顯著性檢驗,常數項通過了T檢驗,說明模型的系數檢驗也通過了,還需要對模型的正態性及異方差性進行檢驗。
根據圖4結果表明殘差服從正態分布,驗證了模型的實用性,而殘差圖中各點比較均勻地分布在0的兩側,沒有明顯的趨勢性,BP檢驗也通過,證明了模型通過異方差性檢驗。利用通過檢驗的模型對螺紋鋼期貨價格進行樣本內預測,同時對2019年12月23日至31日的螺紋鋼期貨價格數據進行樣本外預測。
七、螺紋鋼期貨價格預測與評價
1.螺紋鋼期貨價格預測
通過以上模型的擬合結果對期貨價格進行樣本內預測,預測結果與真實值比較如圖5所示。可以直觀地看到真實值與預測值整體上走勢是一致的,在某些點出現較人偏差。
為了探究模型的實用性,選取2019年12月23日至31日的期貨價格數據作為預測數據集,利用擬合的GAM模型對樣本外的期貨價格進行預測,并對預測結果進行分析(見表8)。
2.螺紋鋼期貨價格預測模型評價
為了進一步分析預測結果與真實值的差距選用壓軸同歸法( RMA)來進行同歸分析以評估預測結果。根據壓軸同歸法建立螺紋鋼期貨價格預測值與真實觀測值之間的簡單線性回歸模型,以此來對GAM模型的預測結果進行簡單評判。
如圖6所示壓軸同歸擬合圖,其中黑色散點與紅色擬合線表示的是以預測值為自變量擬合的散點圖與擬合線,藍色散點和綠色擬合線表示以真實值為自變量的擬合直線。當兩條直線重合且位于圖上對角線上時,表示預測值與真實值是完全一致的,在圖6中當期貨價格偏高或者偏低時兩條直線的重合度不高,當螺紋鋼期貨價格處于中間值時,兩條直線的重合度較高,說明預測得較為準確。
為了進一步檢驗GAM模型的實用性與有效性,采用神經網絡模型對螺紋鋼期貨價格進行樣本外預測,并與GAM模型預測結果進行比較。
圖7中GAM代表廣義加性模型對2019年12月23日至31日的期貨價格的預測結果,BP代表神經網絡模型的預測結果,TRUE代表螺紋鋼期貨價格的真實值。根據圖中結果表明神經網絡模型預測結果比較平緩,未能很好地表現冉期貨價格的波動趨勢及走勢。而廣義加性模型對期貨價格波動及走勢擬合得更好。
如表9所示,在分析樣本外預測結果時,仍然采用預測相對誤差值反映預測結果的可信程度。在利用CJAM模型進行樣本外預測時,預測相對誤差最大值為1. 54%,預測相對誤差最小值為0. 09%,說明CAM模型的預測值與真實值的偏差不會太大。雖然神經網絡模型預測相對誤差最小值較小,但是最大值較大,說明神經網絡模型預測結果相較于GAM模型不穩定,GAM模型預測結果更為穩定。
八、結論
本文選取現在廣泛應用的神經網絡模型對螺紋鋼期貨價格預測進行研究,分別從供給、需求和期貨市場的方面進行考慮,分析影響螺紋鋼期貨價格的供給及需求因素以及影響螺紋鋼期貨價格波動的相關因素,并探討螺紋鋼期貨價格、期貨價格波動率與各因素之間的關系。基于變量問的非線性關系,本文選取了CJAM模型進行研究,并與神經網絡模型進行對比分析。研究結果表明兩種模型的預測結果均比較好,GAM模型預測精準度較神經網絡模型略低,但是GAM模型預測值很好地刻畫了螺紋鋼期貨價格的波動與走勢,同時能夠很好地解釋各影響因素與螺紋鋼期貨價格的關系。
樣本內預測結果表明各模型對變量間的信息利用程度較高,擬合結果較好。但是樣本外預測結果整體較樣本內預測結果偏差,其原因可能是由于螺紋鋼期貨價格單向引導現貨價格。在對螺紋鋼期貨價格與現貨價格引導關系研究時,格蘭杰因果檢驗結果表明螺紋鋼期貨價格單向引導現貨價格,這就會造成現貨市場遭受惡意控制,但未能引導期貨市場,造成期現貨市場的失衡。同時國家政策下預對于期貨市場的影響很大,會對期貨價格變動產生影響。