陳 雪,申建紅,2*,徐文慧,朱 琛
(1.青島理工大學 管理工程學院,山東 青島 266520;2.山東省高校智慧城市建設管理研究中心,山東 青島 266520)
近年來,隨著我國城鎮化步伐的加快,建筑產業不斷發展,工程承包企業之間的競爭日趨激烈。鋼材作為工程建設的主要原材料,其價格直接影響著工程承包企業的成本和利潤。科學合理地運用價格預測技術,準確把握鋼材價格的變化趨勢,是工程承包企業制定合理采購策略和庫存優化的依據。
目前,國內外針對鋼材價格的預測研究相對薄弱。陳海鵬等人綜合考慮螺紋鋼原材料結算價與貨幣匯率等因素對螺紋鋼價格變動的影響,提出了一種基于嶺估計法的線性回歸預測模型,通過與未來螺紋鋼的交易價格進行對比驗證,得到該模型預測精度較高[1]。陳希等人針對鋼材價格變動性較大的現象,利用Levenberg-Marquardt方法改進的BP神經網絡建立了鋼材價格預測模型,同時結合1990—2008年的數據對模型進行訓練預測,結果顯示所建立的鋼材價格預測模型有較好的預測精準度[2]。胡六星為提高工程造價效率以鋼材價格為研究對象,在提煉出其趨勢項的基礎上利用殘差序列建立了自回歸移動平均模型(Auto-Regressive Moving Average Model,ARMA),并應用該模型對鋼材價格進行分析預測,同時結合真實價格進行精度驗證,得到其預測結果誤差低于5%[3]。王雪飛等人通過建立差分自回歸移動平均模型(Autoregressive Integrated Moving Average model,ARIMA),對多種鋼材價格進行預測分析,實驗結果表明該模型的短期預測效果較好[4-5]。王松等人應用廣義自回歸條件異方差(GARCH)模型與ARMA模型相結合的組合模型對近十六年Myspic鋼材價格的變動率進行實證分析,發現鋼材價格的時間序列中含有著明顯的長短記憶特征[6]。Kaijian He等人對初始時間序列進行空間重構,并采用曲線去噪方法分離和剔除噪聲干擾,實現了對原始時間序列中的動態混沌數據特征進行建模。其所提出的模型在統計上比傳統的標桿模型具有更強的魯棒性[7]。Tsung-Yin Ou等人提出了一種極限學習機器(ELM)法與灰色關聯分析(GRA)法相結合的材料價格組合預測模型,其預測能力優于ARIMA和GARCH模型,可以更準確、快速地預測原材料價格[8]。
目前關于鋼材價格預測的研究只考慮了鋼材價格變動的短記憶性,并未考慮其價格變動的長記憶性對預測結果的影響。為此,本文從螺紋鋼價格時間序列出發,引入鋼材價格變動的長記憶性指標,從而建立了基于分數差分自回歸移動平均(Autoregressive fractionally integrated moving average,ARFIMA)模型的鋼材價格預測模型,通過對鋼材價格時間序列變動特性的分析并借助MATLAB軟件編程進行了鋼材價格的預測[9]。并利用ARFIMA模型和ARIMA模型的預測值與真實值進行對比分析,實驗結果顯示,ARFIMA模型的鋼材價格預測精準度更高。
ARMA模型可認為由自回歸模型(AR)和移動平均模型(MA)組成,通常可記為ARMA(p,q),其形式為:
Xt=φ0+φ1Xt-1+φ2Xt-2+…+φpXt-p+
εt-θ1εt-1-θ2εt-2-…-θqεt-q
(1)
式中:{εt}是白噪聲序列,p為自回歸模型階數,q為移動平均模型階數,φ1,φ2,…,φp和θ1,θ2,…,θq為參數,且φp≠0,θq≠0。
若使用后移算子B表示,ARMA模型可簡寫為:
Φ(B)Xt=Θ(B)εt
(2)
BXt=Xt-1
(3)
ARMA模型適合于分析平穩時間序列,即其均值不受時間影響且方差收斂的狹義平穩過程。目前,由于多數時間序列呈現出非平穩性,因此ARMA模型不再適用。而ARIMA模型則適用于分析非平穩時間序列,它是在ARMA模型的基礎上加入差分處理,通過剔除時間序列中非平穩趨勢,得到平穩時間序列,從而展開分析研究。其模型ARIMA(p,d,q)形式為:
φ(L)(1-L)dXt=θ(L)εt
(4)
式中:L為滯后算子,d為差分參數,{εt}是白噪聲序列,φ(L)和θ(L)分別為p階與q階平穩的滯后算子,可表示為:
φ(L)=1-φ1L-φ2L2-…-φpLp
(5)
θ(L)=1-θ1L-θ2L2-…-θqLq
(6)
式中:p,d,q均為非負整數。
在ARIMA模型中,當0 (7) 對于任何d>-1的實數,上式都可以用一個超幾何函數表示為: (8) 式中:Γ(x)為Gamma函數。差分參數d可以通過赫斯指數(H)來確定[10],d=H-0.5。 對于一個由N個數值組成的時間序列集合Xt,將其劃分成長度為n的m個子序列,并將這m個子序列的均值都定義為: (9) 式中:xk,l為第l個時間序列中第k個觀測量。 計算每個子序列的累計均值離差為: (10) 根據上式,計算出每個子序列的極差為: (11) 則其重標極差均值可表示為: (12) 式中:Sl表示第l個子序列的標準差為: (13) 如果時間序列滿足: (R/S)n=αnH (14) 則該時間序列符合赫斯特率,式中,α為系數,H為赫斯指數。其中H可以由公式(14)兩側取對數,并結合最小二乘法擬合得到。當0≤H<0.5時,則表示時間序列具有反持久性,其表現出強烈的異變特性;當H=0.5時,則表示時間序列為隨機序列;當0.5 因此,ARFIMA模型能夠避免過度差分,最大限度地保留時間序列在低頻處的信息,更適用于具有長記憶性的時間序列分析研究。 本文在借助SPSS軟件缺失值分析功能對鋼材價格原始數據進行補齊的基礎上,通過平穩性檢驗、長記憶性檢驗、數據擬合等過程利用ARFIMA模型對青島市直徑為18 mm的HRB400螺紋鋼價格進行了分析預測,同時結合ARIMA模型對該鋼材價格的預測結果進行對比分析。 本文數據選用青島市2014年1月1日到2019年6月30日直徑18 mm的HRB400鋼材價格作為研究對象。共采集到樣本數據1 875個,由于各種因素導致收集的原始數據存在部分缺失,共缺失131個。 為保證預測結果的準確性,本文采用SPSS軟件缺失值分析功能對缺失數據進行了分析,并在此基礎上將數據補齊。其中單變量統計結果見表1,通過SPSS數據分析中的多變異分析(MVA)得到鋼材價格變動時間序列服從正態分布,且多變量檢驗(Little's MCAR)的顯著性水平小于5%,由此可判斷原始數據為隨機缺失型數據。本文采用期望-最大似然估計法(EM)對存在缺失的原始數據進行填補。 表1 單變量統計 利用經數據處理后的鋼材日價格共得到287個周價格樣本作為初始時間序列,記為Xt。圖1為利用SPSS軟件對該時間段內青島市直徑為18 mm的HRB400螺紋鋼價格數據繪制的時序圖,其價格在早期呈現出下降趨勢,后期呈現出上升趨勢,初步識別為非平穩時間序列。并利用單位根檢驗-ADF方法檢驗時間序列Xt是否含有單位根。 圖1 螺紋鋼價格時序圖 單位根檢驗結果如圖2所示,初始時間序列Xt檢驗統計量大于各個臨界值,此時原假設成立,即認為初始時間序列Xt是非平穩時間序列。 圖2 時間序列Xt的ADF檢驗結果 圖3為時間序列Xt的自相關函數圖,圖中表明鋼材價格的變動沒有明顯的季節性變化,且自相關系數逐漸減小呈緩慢下降的趨勢,在滯后80階后才開始小于0,表現出長期相關特性,可初步判斷時間序列Xt含有一定程度的長記憶性。根據公式(8)—公式(13)計算得到H為0.835,赫斯指數大于0.5進一步表明時間序列Xt確實具有較強的長記憶性。 圖3 時間序列Xt自相關函數圖 將樣本數據分為兩部分,取2014年1月1日到2019年5月12日的周價格數據,即前280個樣本數據作為建模序列,記為Yt,用來構建ARFIMA模型和確定模型參數。取2019年5月13日至2019年6月30日的周價格數據,即后7個樣本數據用來驗證所建立的ARFIMA模型的可行性與精確度。 應用R/S分析法求得時間序列Yt的赫斯指數為0.835,則所建模型中的分數差分參數d為0.335。對時間序列Yt進行分數差分剔除其中存在的長記憶性,從而獲得只含有短記憶的時間序列,記為Zt。圖4為時間序列Zt的時序圖,由圖可知經分數差分后的時間序列Zt中的數據基本圍繞基準線零線進行上下波動,并不存在顯著的趨勢或周期,此時可初步判斷時間序列Zt已達到平穩。 圖4 時間序列Zt時序圖 采用ADF方法檢驗時間序列Zt是否還含有單位根,結果如圖5所示,可以看出經過分數差分處理后的時間序列Zt檢驗統計量小于各個臨界值,此時可判斷該時間序列為平穩時間序列。通過利用混成檢驗(LB)法對該時間序列純隨機性進行檢驗,可知在前6階和前12階延遲下Q檢驗統計量的p值均小于0.05,于是時間序列Zt為純隨機序列的假設不成立,即認為時間序列Zt屬于非白噪聲序列。 圖5 時間序列Zt的ADF檢驗結果 通過分數差分處理后的時間序列Zt的自相關系數在滯后2階時其值小于2倍的標準差,同時偏自相關系數在滯后1階時其值小于2倍的標準差,于是可以確定模型參數p=2,q=1。由此可建立模型為ARFIMA(2,0.335,1),并對時間序列Zt進行數據擬合,同時采用LB檢驗其殘差序列,可知在前6階和前12階延遲下Q檢驗統計量的p值均大于0.05,此時認為該殘差序列是白噪聲序列,即可表明ARFIMA(2,0.335,1)是顯著有效的。為了與ARIMA模型的預測結果進行對比分析,本文同時利用ARIMA模型對時間序列Yt進行數據處理,模型參數對比如表2所示。 表2 ARFIMA和ARIMA模型參數估計值 為了驗證ARFIMA模型的適用性,根據以上模型參數估計,確定以ARFIMA(2,0.335,1)模型對直徑為18 mm的HRB400鋼材價格進行擬合預測。圖6為ARFIMA(2,0.335,1)模型的擬合預測結果與真實值的比較,結果顯示ARFIMA(2,0.335,1)具有很好的擬合效果。 本文通過分別利用ARIMA模型和ARFIMA模型對2019年5月13日至2019年6月30日,7周的鋼材周價格進行預測分析,同時結合7周的真實值進行累計差值和相對誤差的精度驗證,如表3所示。從表中可以看出,ARIMA模型預測值較真實值的累計差值為777元,平均相對誤差為2.08%;ARFIMA模型預測值較真實值的累計差值為175元,平均相對誤差為0.38%。綜上所述,在鋼材價格預測中ARFIMA模型較ARIMA模型預測結果精度更高。 表3 ARFIMA模型和ARIMA模型預測結果 圖6 ARFIMA(2,0.335,1)模型預測擬合圖 本文以2014年1月~2019年6月青島市直徑18 mm的HRB400鋼價格數據為樣本,建立了ARFIMA(2,0.335,1)鋼材價格預測模型,并與ARIMA模型進行對比分析,得出以下幾點結論: 1)ARFIMA模型中的分數差分較ARIMA模型的整數差分能更好地保證鋼材價格原始時間序列信息的完整性,避免有效信息的缺失。 2)螺紋鋼價格時間序列具有較強的長記憶性,ARFIMA模型在保持ARIMA短期預測精度的基礎上,充分考慮了鋼材價格變動的長記憶性。 3)實驗結果顯示,ARFIMA模型預測值較真實值平均相對誤差僅為0.38%,相較于ARIMA模型的鋼材價格預測精準度提高了1.7%,且模型擬合度更高、預測效果更穩定。對于房地產企業及時掌握市場動向,降低庫存資金占用率,制定短期鋼材采購計劃有一定的參考意義。2 基于ARFIMA模型的鋼材價格預測
2.1 原始數據處理

2.2 ARFIMA模型


2.3 長記憶性檢驗

2.4 模型建立



2.5 模型預測


3 結論