張耀杰,王玉東
(南京理工大學 經濟管理學院,南京 210094)
原油價格預測一直都是學術界和業界的研究熱點與難題。在錯綜復雜的全球經濟環境下,原油價格表現出高波動性的特點。圖1描繪了1986-01~2022-05期間的美國西德克薩斯中間基原油(West Texas Intermediate,WTI)1)WTI也經常翻譯為西德克薩斯輕質原油或西德克薩斯中質原油,又稱為德州輕質低硫原油和英國北海布倫特(Brent)原油的現貨價格變化情況。在進入21世紀以來,油價波動愈加劇烈,并且與經濟周期和地緣政治事件緊密聯系。特別地,在2020 年4 月20 日,WTI原油5月期貨合約的最終結算價為-37.63美元/桶,引發了金融市場的強烈反響與恐慌。在原油價格波動劇烈的背景下,其預測研究顯得尤為重要。

圖1 WTI和Brent原油現貨價格時間序列(1986~2022)
為了分析原油價格預測的研究趨勢,本文檢索了該主題下的學術論文發表情況。一方面,利用Web of Science數據平臺以“Forecasting oil price”為主題詞進行相關英文論文的檢索;另一方面,利用中國知網以“原油價格預測”為主題詞進行相關中文論文的檢索2)本文并沒有在初步檢索的基礎上對每一篇文獻進行排查。理由如下:①大部分檢索結果是與主題完美契合的文獻;②小部分檢索結果雖然不是與主題完全相關,但也基本貼近;③檢索過多或過少的文獻對每年的趨勢判斷影響甚小。最后,需要說明的是,雖然僅檢索了一個最核心的主題詞匯,但檢索結果還是包含了相關衍生詞或近義詞,如“Oil price forecasting”“Forecasts”“Prediction”和“Crude oil”等。圖2給出了1990~2021 年該主題學術論文的數量變化趨勢。首先,英文論文數量明顯多于中文論文數量。主要原因是大家都更加關心以WTI和Brent原油為代表的國際原油基準價格。以人民幣計價的原油期貨合約在2018年才開始上市交易,尚處于起步階段,而中文期刊相對偏好中國問題的研究。其次,原油價格預測的論文數量呈現出逐年上升的趨勢,說明學術界對此研究的積極性正在不斷提高。圖3進一步給出了發表原油價格預測論文數量排名前20的英文期刊以及發表數量超過3 篇的中文期刊。能源經濟學領域主流期刊Energy Economics發表了244篇相關論文,在數量上遙遙領先。總體而言,能源類期刊發表數量最多,占據榜單的前5名。此外,經濟學和金融學綜合期刊的上榜數量有7個,占該榜單期刊總數約1/3,說明原油價格預測也受到經濟學和金融學領域的關注。這是符合預期的,因為原油價格預測是宏觀經濟及金融領域重要的研究議題之一。最后,兩本預測領域的重要期刊Journal of Forecasting(第6名)和International Journal of Forecasting(第8名)也發表了大量油價預測的論文。截止目前,只有兩本中文期刊的發文量在3篇以上:《北京理工大學學報(社會科學版)》(10篇)和《中國科學院院刊》(8篇)。

圖2 近30年(1990~2021)以原油價格預測為主題的中英文論文數量

圖3 以原油價格預測為主題發表的論文數量前20名的英文期刊及論文數量超過3篇的中文期刊
本文的研究目的是:一方面,對原油價格預測的基礎知識、技術細節、理論模型和預測方法進行綜合回顧,幫助感興趣的讀者加深對這一研究領域的理解;另一方面,給出一些未來值得研究的方向,以供參考討論。
第1節主要介紹原油價格的預測對象。這部分的內容較為基礎,但非常重要。預測原油價格的第一步就是確定預測的具體對象。從廣義上講,原油價格預測的對象包含了很多維度,具有很多分類。①討論了油價基準的對象選擇問題,對WTI和Brent等多種原油品種進行了詳細介紹。②區分了名義價格和實際價格的差異,討論它們之間不同的經濟含義和預測機理。③結合不同的研究背景和研究目標,分析了原油價格和收益率之間的對象選擇問題。④依然從研究背景和研究目標的角度分析了原油交易的平均價格和收盤價格之間的對象選擇問題。⑤從樣本時間范圍的角度討論了不同歷史時期下原油價格變動的主要驅動因素,并給出了相關樣本時間范圍的選擇建議。⑥討論預測頻率和預測周期的對象選擇問題,給出了多周期預測的過程細節和注意事項。上述討論對后續預測建模和理論解釋都是有幫助的。最后,正如Kilian等[1]所強調的,某一種原油價格對象難以滿足所有的研究目標,應該根據不同的研究目標選擇合適的預測對象;如果實證結果對不同的原油價格對象都是一致或相似的,那么,研究結論也會更加穩健可靠。
第2 節介紹了原油價格的影響因素和預測變量。原油定價也符合普通商品的定價規律,受到市場供求的影響。在需求端,原油作為經濟生產中必要的工業原材料商品,其需求與全球經濟周期有緊密的聯系。當經濟行情好的時候,原油需求旺盛。在供應端,原油具有“石油外交”的政治屬性,戰爭和恐怖主義等地緣政治風險對中東等地區產油國的原油生產和運輸造成極大的影響。此外,原油期貨市場及原油相關產品的價格信息也對原油現貨價格有指導意義和預測能力。隨著原油相關金融交易市場的發展和完善,原油商品表現出金融化的屬性。因此,基于交易價格和交易量的技術指標和金融市場預測變量都提供了豐富的預測信息。
第3節介紹了原油價格的預測模型和方法。首先分析了樣本內預測和樣本外預測的聯系與區別,并討論了實時預測的問題;然后介紹了幾種流行的原油價格預測基準模型,并在統計和經濟意義層面分別給出了預測表現的評價標準。繼續介紹了兩種傳統預測方法:專家調查預測和傳統計量模型。進一步,回顧了結合經濟理論的約束方法和組合預測方法在原油價格預測上的成功研究。最后,討論了降維、變量選擇、神經網絡和其他混合模型等一系列的機器學習方法。
第4節從實踐角度出發,分別討論了政府、企業和個人投資者能夠從原油價格預測中獲得哪些實際的幫助。政府可以從原油價格預測中了解經濟的現狀和走勢,制定合理的經濟調控政策。相關企業可以依據原油價格預測,合理調整投融資決策以提高企業價值。投資者可以根據油價預測進行投資組合或市場擇時以提高投資收益或降低投資風險。
第5節提供了3個值得進一步研究的方向。首先,在 “雙碳”目標的背景下,本文推薦研究各類氣候風險對原油價格長期變化的預測作用;其次,研究者可以考慮從文本、圖像和音頻等多源異構數據中提取油價預測信息;最后,本文提醒避免機器學習方法在原油價格預測領域的“過度”使用,要結合經濟理論解釋,爭取打開機器學習的“黑箱”,剖析出令人信服的內在預測機理。
國際上公認的原油基準價格是WTI和Brent原油價格。WTI原油在美國德克薩斯州、路易斯安那州和北達科他州的油田開采提取,通過管道運輸的方式將原油輸送到俄克拉荷馬州庫欣的油庫中,再進一步依靠管道或鐵路將其運送到墨西哥灣沿岸地區的煉油廠,最后精煉后的原油產品運往美國及世界各地。相比之下,Brent原油主要以海運的方式進行運輸,成本更低。Brent原油的產地為歐洲北海,主要通過海上石油平臺的方式進行開采提取,通過浮式生產儲油卸油船(Floating Production Storage and Offloading,FPSO),原油可以直接從該設備方便地卸到油輪上,從而低成本的海運至世界各地。
在原油品質方面,WTI和Brent原油都是輕質低硫的高品質原油。WTI原油的含硫量為0.24%,API3)美國石油學會(American Petroleum Institute,API)。API度表示石油的密度,即輕質度。石油的API度越高,意味著其密度越低,越輕質,即品質越高輕質度為39.6,而Brent 原油的含硫量為0.37%,API輕質度為38。因此,WTI原油的品質略高于Brent原油,這也基本反映在這兩種原油的早期定價中。由圖1可以發現,在2011年之前,更高品質的WTI原油價格略高于Brent原油。但是,2011年之后出現了反轉的價格關系,即Brent原油價格略高于WTI原油。具體原因是:①北海Brent原油逐漸枯竭,出現供應不足的局面;②金融危機之后,全球經濟開始復蘇,全球原油需求增加,而相比之下,Brent原油以亞歐等美國以外地區原油需求驅動為主,WTI原油則以美國國內原油需求驅動為主;③隨著21世紀初美國頁巖油革命的成功,美國國內的油氣產量大幅提高。
在影響因素方面,Brent原油價格在需求端受以歐洲和亞洲為主的全球石油需求影響,在供應端主要依賴于石油輸出國組織(OPEC)的原油產量變化。因此,Brent原油價格的主要影響因素是亞歐國家的經濟行情和中東地區等產油國的地緣政治風險。相比之下,WTI原油價格的主要驅動因素是美國國內的原油產量與需求。因此,庫欣地區的原油庫存量會對WTI原油價格造成直接影響。當然,WTI也是全球重要的原油價格基準,其價格在一定程度上受到全球原油供需的影響。
在交易方面,WTI原油的期貨合約在紐約商品期貨交易所(NYMEX)交易,Brent原油期貨合約在倫敦國際石油交易所(ICE)交易。WTI原油期貨憑借其報價透明和高流動性的優勢以及美國超級原油買家的地位和紐交所的世界影響力,在全球商品期貨的成交量方面占據龍頭地位。但是,全球約2/3的原油交易量是以Brent原油作為基準進行定價的。表1總結了上述對WTI和Brent原油的對比情況。

表1 WTI原油和Brent原油對比
與Brent原油相比,原油價格預測的研究更加偏愛WTI原油。此外,美國煉油商進口原油的購置成本(U.S.Refiner’s Acquisition Cost for Imported Crude Oil,以下簡稱RAC)也是文獻中經常考慮的原油價格[2-6]。相比于同為美國的WTI原油,RAC通常被認為是更好地反映全球行情的原油價格代理[2,7-9]。但是,RAC 存在兩個缺點:一是價格數據公布有延遲,通常延遲3個月左右;二是存在數據修正問題,和CPI等經濟數據類似,會在首次公布后,對RAC價格數據進行調整修正。
在亞洲的原油交易市場,阿聯酋迪拜商品交易所(DME)的阿曼原油和新加坡國際金融交易所(SIMEX)的迪拜原油也是國際上較為公認的原油價格基準,具有較為廣泛的影響力。特別地,阿曼原油期貨合約具有目前國際上最大的原油實物交割量。但是,這些亞洲原油期貨的國際地位正受到挑戰。
2018年3月26日,以人民幣計價的原油期貨在上海國際能源交易中心(INE)掛牌交易,交易代碼為SC。SC 期貨合約的交割標的為中質含硫原油,含硫量為1.5%,API輕質度為32。在原油品質上,SC原油期貨是對WTI和Brent輕質原油期貨的補充。彭博新聞社專門發布了題為“中國即將撼動石油期貨市場(China Is About to Shake Up the Oil Futures Market)”的新聞報道,認為以人民幣計價的中國原油期貨將對以美元計價的原油定價體系發起挑戰。在上市交易百日之內,SC原油期貨交易量迅速攀升,日均成交量很快超過了迪拜原油期貨合約和阿曼原油期貨合約,成為僅次于WTI與Brent原油期貨的全球第三大原油期貨合約。Wei等[10]研究了上海SC原油期貨、紐約WTI期貨和倫敦Brent期貨之間的動態關系,發現三者之間的價格收益率和波動率均存在顯著的溢出效應和很強的聯動關系,SC期貨價格在其中扮演了重要的信息傳遞和接收作用。基于上海SC 期貨的成功上市與積極作用,越來越多的學者開始研究其價格收益率[11-12]和波動率[13-16]的可預測性。
預測原油的名義價格還是實際價格? 在回答這個重要問題之前,先給出名義價格和實際價格之間的轉換公式:


由式 (1)和式(2)可以得出:當原油名義價格的未來走勢不可預測時,如果CPI的變化是可預測的,則原油實際價格的變化是可預測的,但其可預測性僅僅來源于通貨膨脹率的可預測性;反之,當原油實際價格不可預測時,名義價格可能因通貨膨脹率的可預測性而變得可預測。特別地,經典的經濟理論告訴我們:通貨膨脹可以影響商品(包括原油)的名義價格,但不能影響實際價格。因此,通貨膨脹的相關因素在理論上可以預測原油的名義價格。Gillman等[17]和Alquist等[7]通過格蘭杰因果檢驗給出了相關實證證據,發現通貨膨脹率和貨幣供應量都領先于原油名義價格的變化。反之,許多學術研究也經常論證原油名義價格上升是否加劇了通貨膨脹[18-19]。在現實中,該問題被多次經濟危機所證實:高油價引發高通脹,造成需求下降,從而引發經濟危機。
不同于原油的名義價格,其實際價格在經濟理論上應該受實際經濟情況的影響,例如實際利率和實際GDP等。換言之,貨幣增發如果不能刺激真實經濟,只會造成原油名義價格的上升;只有實際經濟狀況好轉,需求增加,才能提高原油的實際價格。Alquist等[7]給出了對應的綜合實證結果,他們發現,芝加哥聯儲全國經濟活動指數(Chicago Fed National Activity Index,CFNAI)、工業生產指數和Kilian[20]的全球真實經濟活力指數4)該指數的構造在學術界存在一定的爭議都是能夠提前捕捉原油實際價格變化的預測變量。反之,原油的實際價格也經常被視為真實經濟狀態的代理指標和驅動因素[21-25]。
原油價格是宏觀經濟狀態的內生變量還是外生變量? 長期以來,這是一個比較有爭議的話題。基于上述分析,本文認為原油價格是內生的5)原油價格內生性的特殊情況討論見1.5節,其價格變化是受經濟活力或經濟周期所驅動的。具體而言,宏觀貨幣政策和通貨膨脹水平會影響原油的名義價格;而真實的經濟活力與需求會影響原油的實際價格。由于原油實際價格更加適合經濟理論建模,越來越多的研究開始關注實際價格的預測問題。但是預測名義價格和實際價格的相關學術論文在數量上是接近的。這是因為原油名義價格不僅是政府實施宏觀調控政策的依據6)當然,政府監管部門也關心原油的實際價格。實際價格與真實經濟情況聯系更加緊密,還是原油消費者在貨幣幻覺下的關注重點,也是相關企業財政預算和管理決策的依據。
本文討論的原油價格預測是一個廣義籠統的概念,既包括價格預測,又包括收益率預測。那么,應該預測原油的價格還是收益率? 如果沒有任何限制條件,這個問題的答案很簡單:預測價格或收益率都可以。因為預測未來的價格(或收益率)可以輕松地通過價格和收益率之間的計算公式轉換成未來的收益率(或價格)。
首先,價格預測在技術上存在一些局限性。如果使用傳統的計量模型進行原油價格預測,時間序列的平穩性是必要的前提條件。但是,以圖1的原油價格序列為例(1986~2022),無論是WTI還是Brent原油價格,其實際價格和名義價格,或是原始價格和對數價格,都不能通過單位根檢驗。因此,預測原油價格的對數差分(即收益率)是一個更好的選擇。但是,在學術研究中,直接對原油價格或對數價格進行預測或建模也是較為常見的[2,9,20,26-30]。其可能的原因是,部分研究的原油價格序列在對應的樣本時間范圍內是平穩的。例如,圖1的原油價格序列在1986~2003年的時間范圍內是平穩的。此外,在一些研究中,原油價格與其他變量的時間序列存在協整關系。再或者,序列的非平穩性是時間趨勢造成的,引入時間趨勢變量就可以解決該問題。最后,有些預測方法不受平穩性的限制,例如基于原油期貨價格的現貨價格預測模型、專家調查預測和部分機器學習方法等(詳見第3節)。但是,一般而言,平穩的時間序列更有利于預測建模,因為其本身存在一定的分布規律,時序的前后具有較為穩定的自相關性。而非平穩序列過于雜亂無章,例如隨機游走序列完全無規律可循,從而難以預測。
其次,基于不同的預測目標,應當對原油價格和收益率進行有選擇的預測。原油是一種能源商品,其價格受經濟活力的影響,也會對經濟行情產生影響。因此,央行等政府部門在實施宏觀調控政策時,航空公司和汽車生產廠商等原油價格敏感企業在做成本預算和管理決策時,都更加關注的是原油價格而非收益率。此外,原油也是金融交易市場的交易品種。在以投資決策為目標時,原油價格收益率,特別是普通超額收益率而非對數超額收益率7)需要注意的是,原油期貨的超額收益率在計算時無需再減去無風險收益率。因為原油期貨的收益包含保證金和抵押物的收益,而這個收益通常被視為無風險收益,是投資者更加關心的預測對象。
雖然價格預測和收益率預測之間可以相互轉換,但是在根據研究目標確定預測對象后,應該直接對關心的對象進行預測評價和檢驗。因為價格和收益率預測在轉換前后可能得到不一致的評價結果。具體而言,在經濟層面,應該直接對價格(而非收益率)預測值的準確性進行評價;而在金融層面,應該直接對收益率(而非價格)預測值的準確性進行評價。相關評價方法見3.2節。
在金融預測領域,資產價格數據一般是基于收盤價。但在能源經濟領域,原油的平均價是研究人員更關心的對象。對應的解釋和上一節的話題是類似的。在金融層面,投資者關心的是資產的收益率,因此,需要用收盤價來計算收益。為了實現投資目的,應該使用原油期貨價格而非原油現貨價格。因為在實際投資方面,期貨比現貨的可操作性更強,更加靈活。特別地,由于保證金制度,期貨投資杠桿顯著高于股票等其他普通金融資產。Zhang等[4]考慮了期貨投資的杠桿問題,并給出了改進后的最優投資組合構建方法和對應的評價標準。在經濟層面,監管部門、消費者和相關企業關心的是原油在一段周期內的平均價格,因為平均價格更加能夠反映這一周期內的經濟狀況、購買成本和生產利潤等。這與CPI和GDP等經濟指標的構建思想是一致的。
在統計性質方面,平均價和收盤價的時間序列呈現出一些有趣且值得考慮的差異。Working[31]指出,相比于周期末尾的收盤價,周期內平均價的一階差分表現出更低的方差和更高的自相關性。Schwert[32]進一步指出,相比于收盤價,周期內平均價的差分序列與其他變量的協方差表現出向下的偏誤。這些統計推斷也得到了股票市場[32-34]和原油市場[35]的實證結果支持。特別地,Conlon等[35]強調,在現有文獻中,大部分變量和模型對原油價格的預測能力依賴于數據的選取,可預測性通常只在原油平均價下有效,但在月末收盤價上幾乎無效。
最后,需要提醒讀者一項關于數據下載的問題。美國能源信息署(Energy Information Administration,EIA)是最權威的原油價格數據來源之一,其周期性的原油價格數據都是平均價格而非收盤價。例如,EIA 提供了WTI和Brent原油的月度期貨和現貨價格。所有相關的月度價格數據都是當月每天收盤價的算術平均值。如果想要得到當月的收盤價數據,需要下載對應的日度數據進行提取,或者直接從金融數據庫進行月度數據下載。財經網站和金融數據庫的原油月度數據大部分都是當月的收盤價格。請根據不同的研究目的,下載使用對應的原油價格數據。
在預測原油價格時,應該選擇多長的樣本時間范圍? 由于小樣本偏差的問題[36],實證研究通常傾向于選擇盡可能長的時間樣本。Gupta 等[37]和Salisu等[38]在研究原油價格預測時,使用了從1859年開始的跨越一個半世紀以上的原油價格數據樣本。但是原油價格預測并非樣本越長越好。WTI價格是實證研究中最流行的代理變量,但是WTI原油價格在1985年之前并不是由市場決定的,而是由美國政府的相關部門嚴格監管控制的。圖4展示了1948~1985年之間的WTI價格時間序列,其中實際價格以1970年1月為基期。在圖4(a)(1948~1973)中,WTI的名義價格在相當一段時期內都是恒定不變的常數8)該圖中涉及的WTI價格和CPI數據來自FRED經濟數據庫(https://fred.stlouisfed.org/),并不能反映出該時期內真實的原油供需情況。即使在經濟衰退時期,原油的名義價格也是幾乎恒定不變的,這與圖1形成了鮮明的對比。雖然圖4(a)中的實際價格是連續變動的,但和1.2節的討論類似,這時的實際價格變動大部分反映的是通貨膨脹的變化情況而非真實原油市場的行情變化。圖4(b)描繪了WTI價格在1974~1985年之間的變化情況。由圖4(b)可以發現,WTI原油價格雖然還是階梯式的變動,但變動頻率越來越快。

圖4 WTI原油的名義價格和實際價格(1948~1985)
接下來,對原油價格在圖1和圖4之間的不同變化形態給出相關解釋。在1973年之前,美國國內的原油基本是自給自足的。但是在1973年后,美國的原油進口量急劇上升,不受價格管制的國外進口原油和美國國內的管制原油之間的價格偏離壓力不斷加大,從而驅使美國國內原油價格的調整頻率不斷提高。在1985年之后,WTI原油價格基本不再受美國政府的管制,可以客觀反映出原油市場的供需情況和宏觀經濟行情。這可能是EIA 的下載數據和絕大部分相關論文的使用數據起始于1986年的主要原因。另一個值得一提的原因是,在1973~1985年期間,第四次中東戰爭、伊朗的伊斯蘭革命和兩伊戰爭等地緣政治事件主導了原油價格的變動。期間,OPEC成員國紛紛宣布對美國禁運并持續減產,導致原油價格飆升。兩次石油危機導致全球失業率和通貨膨脹率同時上升,引發了世界范圍內的經濟大衰退。在此期間,OPEC 對全球油價有直接的定價權和絕對的影響力。但是經濟衰退伴隨著原油需求的下降,OPEC慢慢陷入囚徒困境,逐漸對原油產量和定價做出讓步和妥協。
把研究樣本的時間范圍放寬之后,重新討論原油價格的內生性問題(之前的相關討論見1.2節)。根據圖4(a),可以發現,原油的名義價格在1973年之前應該是外生的,不會對經濟行情的變化做出響應。油價的外生性在油價恒定不變的時間段內是基本成立的。Hamilton[22]和Gillman等[17]利用20世紀50年代和60年代的樣本,發現通貨膨脹等經濟變量確實對原油名義價格沒有影響。但是,在1973~1985的OPEC控制油價時期,油價變化的外生性是存在爭議的。雖然OPEC 成員國的原油禁運和減產有時是基于戰爭等外生事件,但也常常會對美國非預期的通脹、降息和美元貶值做出減產提價的回應。因此,原油價格在1973年后表現出一定程度的內生性。Barsky等[21]給出了相關實證來支持這一結論。
最后,新冠疫情和俄烏戰爭等突發事件的爆發可能會造成原油價格的結構突變。但是,不同于排除原油價格管制時期的一般做法,我們總是將最新的研究樣本包含進來。為了解決突發事件可能引起的結構突變問題,一方面可以通過識別結構斷點,劃分獨立的子樣本,進行分樣本的樣本內分析;另一方面可以運用滾動窗口、時變參數和機制轉換等技術進行樣本外預測研究。
第2個與時間有關的對象選擇問題是原油價格的預測頻率。現有文獻對原油價格預測的頻率一般為月度、季度和年度[5,7,39-42]。其主要原因是,大部分經濟基本面的預測變量都只能在月度等低頻率上獲取相關數據。另外,學者們也會對更高頻率的原油價格進行預測研究,如周度[40]、日度[43]以及日內高頻[12,44]。現有研究認為更高頻率的原油價格更加不穩定,因而更難預測[40,43]。此外,也有學者使用混合頻率的數據對原油價格進行預測[3,45-47]。基于Ghysels等[48]提出的MIDAS 模型,研究發現,混合頻率的數據可以提高對原油價格預測的準確度。
本文討論的最后一個與時間有關的對象選擇問題是預測周期。一部分原油價格預測文獻專注于單期預測[4,39-41],另一部分則同時進行了單期和多期預測[5,7,49-50]。多期預測就是在t時刻預測未來h(h>1)期的價格或收益率。正如1.4 節的討論,有必要對平均價和收盤價的多期預測進行區分。
如果關心的是原油收盤價,則可以直接預測第t+h期的原油價格,即Pt+h,或者預測第t+1期至t+h期的多期收益率,即rt+1:t+h=lnPt+h-lnPt,亦或預測第t+h期的單期收益率rt+h=lnPt+hlnPt+h-1。預測rt+h是間接的多期預測,因為還需要分別單獨預測rt+1,rt+2,…,rt+h-1,才能真正實現多期預測的實際作用,所以預測rt+1:t+h是多期預測的直接實現。基于對數收益率的時間序列可加性,相關文獻一般將該多期收益率表示為

如果關心的是原油的平均價,則可以直接預測第t+1期至t+h期的多期平均價格,即

或者預測第t+h期的單期價格,即Pt+h,亦或預測第t+1期至t+h期的多期收益率,即rt+1:t+h=lnPt+1:t+h-lnPt-h+1:t(注意,此處不是rt+1:t+h=lnPt+h-lnPt)。此時,預測Pt+h是間接的多期預測,因為還需要分別單獨預測Pt+1,Pt+2,…,Pt+h-1,才能真正實現多期預測的實際作用。
最后,給出多期預測的實際操作過程。以如下最簡單的一元線性回歸模型為例:

首先,在第t期末,利用i=1至t-h的ri+1:i+h和xi數據回歸得到系數估計值。此時,因變量和自變量所用到的最后一期數據分別為rt-h+1:t和xt-h,均不涉及第t期以后的未來信息。然后,將xt代入回歸方程,可得對應的多期收益率預測值此時,注意不要將樣本內擬合數據的下一期,即xt-h+1,代入回歸方程,否則本質上還是單期預測。
原油作為一種常見的商品,其價格也是由供應和需求所決定的。如果原油供應越少(越多),需求越大(越小),則原油的價格就會越高(越低)。眾多實證研究證實了該供求理論。Ye等[26]發現,原油庫存量作為同時反映供給和需求的變量,可以有效預測原油價格。
在需求層面,原油作為一種重要的經濟發展的工業原料,經濟活力直接決定了原油的需求9)除了經濟活力以外,還有其他影響原油需求與消費的因素。Considine[51]指出,氣候條件會顯著影響能源的需求;特別地,溫暖的氣候會降低取暖油的消費。在經濟繁榮時期,原油需求較大,原油價格上升;而在經濟衰退期,原油需求較小,原油價格下降。Kilian[20]通過航運數據構造了全球真實經濟活力指數以反映原油需求,并發現該指標對原油價格有顯著的影響。Kilian等[52]發現,全球經濟增長可以預測原油真實價格的上升。類似地,Baumeister等[24]研究了2014年以來的原油價格下降,認為其中一部分可預測的價格下跌是由于全球經濟放緩造成的原油需求下降。
在供應層面,由于“石油外交”的政治屬性,地緣政治風險直接決定了原油的供應。Caldara等[30]利用新聞報紙的文本數據構建了地緣政治風險指數。Bouoiyour等[53]研究了其中兩個子類指標,發現地緣政治行動比地緣政治威脅對原油價格的影響更加顯著。Akram[54]發現,地緣政治的不確定性風險上升會伴隨著原油價格的上升,并且該關系會在原油出口國的貨幣貶值時進一步加強。Su等[55]強調了原油的政治屬性,發現戰爭會導致原油價格上升,并且原油市場與地緣政治事件是緊密聯系的。Phan等[56]發現,將恐怖襲擊作為變量可以預測油價,恐怖襲擊對油價會產生正向影響,并且影響效應主要集中在產油國的恐怖襲擊。Ozcelebi等[57]發現,巴西、俄羅斯和印度的地緣政治風險上升(或下降)會導致原油價格的上升(或下降)。此外,通過觀察圖1中油價和戰爭的聯系以及1.5小節的相關討論,可以發現,產油國(特別是中東地區)的戰亂和恐怖襲擊是油價變化的重要推手。
對于原油的需求和供應,哪一個因素對油價變化的影響更大? 學術界一直在嘗試回答這個問題。相關研究一致認為,油價變化主要是由原油需求沖擊而非供給沖擊引起[20,58-59]。但是,Baumeister等[60]給出了正好完全相反的結論,認為原油供給才是油價的主導者。Kilian[61]正面反駁了該觀點,給出了全新的實證以證明需求沖擊確實是原油真實價格變動的主要驅動者。Herrera等[62]基于需求和供給的油價爭論指出,不同識別假設和模型設定可能會導致不同結論。目前,該問題的爭論還在繼續。
在期貨定價中,預期理論認為期貨價格是未來現貨價格的無偏估計。因此,部分學者直接將原油期貨價格作為未來現貨價格的預測,并認為其是一個有效的預測基準[2,7,50,63]。程剛等[64]研究發現,在2004年之前,原油期貨價格對到期日現貨價格的預測基本都是無偏的,能夠為預測提供比較有效的信息;在2004年之后,期貨價格對相應到期日現貨價格的預測是有偏的。Bai等[65]則檢驗各種預測指標對WTI原油月度價格密度預測的貢獻,發現WTI原油期貨價格是唯一能夠在不同時間范圍內都產生良好的樣本外密度預測的有效變量。Chu等[66]研究發現,簡單的無變化基準預測在短期(小于1年)的原油價格預測表現優于基于期貨價格的預測;然而,從長期(1~5年)預測來看,基于期貨價格的預測比無變化的基準預測表現得更好。
相比之下,持有成本理論認為期貨價格應該等于現貨價格加上持倉費用。持倉費用包括現貨倉儲費、運輸費、保險費以及借款利息。換言之,使用期貨價格作為原油價格預測時應考慮一個合理的調整項。Coppola[67]基于持有成本模型考慮期貨和現貨的協整關系,構建向量誤差修正模型(Vector Error Correction Model,VECM)以預測原油價格,結果表明,考慮期貨信息的模型在樣本內外的原油價格預測都有較高的精度,其中樣本外預測可以打敗隨機游走模型。信息逐步擴散理論則認為信息首先在期貨市場上有所反應,然后逐步擴散到現貨市場上。換言之,期貨市場領先于現貨市場,可以為現貨市場的預測提供有價值的信息。相應地,學者們將原油期貨價格作為預測指標對原油價格進行預測[5,49]。此外,也有學者認為相關產品價差可以為原油價格預測提供信息。Baumeister等[68]認為原油產品價差對原油價格具有預測能力,通過實證分析發現,考慮汽油和取暖油現貨價差的時變參數模型是預測原油價格最準確的模型,優于無變化預測模型。總體而言,期貨市場信息和相關產品價差可以為原油價格預測提供信息。
原油具有金融屬性,其價格與金融市場的狀況緊密相關。因此,學者們考慮使用金融市場變量對原油價格進行預測。首先介紹的金融市場變量是技術指標。考慮到異質信息、異質投資者以及反應不足和反應過度等原因,Neely等[69]證明技術指標在股票市場上具有預測能力。相應地,在原油市場上,Yin等[70]直接考察了技術指標對原油價格的預測能力,實證結果表明,技術指標在統計和經濟意義上對原油價格都有顯著的預測能力。此外,技術指標的預測能力超過常用的宏觀經濟變量。Yin 等[70]認為預測能力部分來自于投資者情緒的變化,這與Neely等[69]的觀點一致,表明了原油市場的金融化。隨后,Liu等[71]從投資者的視角,使用技術指標對原油價格進行預測。具體而言,他們基于流行的移動平均線規則構建技術指標,結果表明,基于技術指標的組合預測優于基于宏觀變量的組合預測,可以為投資者帶來更高的經濟收益。此外,他們還發現,技術指標和宏觀經濟變量之間具有互補的信息,這與Neely等[69]的發現也是一致的。最近,Wen等[72]對傳統的移動平均技術指標進行了改進,實證結果表明,改進的技術指標相比于宏觀經濟變量和傳統的技術指標預測能力更強。此外,Wen 等[41]、He等[40]和Zhang 等[39]基于技術指標分別從經濟約束、擴散指數和變量選擇的角度對原油價格進行預測。值得注意的是,基于技術指標對原油價格的預測大多針對于原油平均價格而非原油收盤價格。當對原油收盤價格的收益率進行預測時,技術指標往往并未顯示出較好的預測能力。換言之,原油市場是弱勢有效的。
另有一些研究直接使用金融市場變量對原油價格進行預測。Degiannakis等[46]將高頻金融信息與石油市場基本面相結合預測原油價格,發現盡管原油市場基本面對長期預測是有用的,但是結合高頻金融數據后仍可進一步提高預測精度。Zhang等[73]使用眾多預測指標對原油價格波動進行預測,結果表明,股票類指標被選擇使用的頻率最高,能提供最多的預測信息,其中最有用的單個變量是股市隱含波動率指標。Ma等[74]也同樣發現,金融類變量對原油價格波動具有較強的預測能力。總體而言,隨著原油金融化程度的不斷加深,金融市場變量,包括技術指標和股市變量等,都能夠為原油價格預測提供有用的信息,甚至超過原油的基本面信息。
從經濟理論的角度看,供求關系是原油價格變化的基礎。經濟基本面是需求端的主要驅動因素,而地緣政治風險經常引起原油生產和運輸的供應沖擊。根據預期理論和持有成本理論,原油的期貨價格能夠為未來的原油現貨價格提供有價值的預測信息。此外,基于投資者的有限關注和信息逐步擴散理論,與原油相關的其他產品或商品市場的價格信息對原油價格預測也有幫助。從金融的角度看,原油價格的可預測性探究也是對有效市場理論的一種檢驗。相比于經濟變量,技術指標表現出更強的預測能力。隨著原油金融化的不斷加深,原油市場與其他金融交易市場的關系變得更加緊密,市場之間的信息溢出效應更加明顯。因此,金融市場變量也表現出對原油價格的良好預測能力。相關原油價格理論的綜述可參考文獻[75],該文獻從投機、供求關系、OPEC壟斷和稀缺租金等多個視角,討論了原油定價的經濟理論基礎。
現有文獻對原油價格的預測可以分為樣本內和樣本外預測兩個方面。樣本內預測是指利用全部樣本對模型進行擬合,然后基于模型的估計結果進行預測效果的解釋,故樣本內預測也通常被稱為樣本內估計。樣本外預測是指在保證觀測值時序性的前提下,將全部觀測值分成兩部分,前一部分用來對模型進行樣本內估計,后一部分用來迭代預測和評價。在1.6節給出了樣本外預測過程的例子。
大量文獻表明,良好的樣本內預測效果并不能保證樣本外預測的準確性[76-78]。Welch 等[76]通過對文獻中的眾多預測指標進行實證分析,發現這些預測指標不能提供優于簡單歷史均值模型的樣本外預測。樣本內可預測性無法保證樣本外可預測性的原因包括過度擬合、虛假回歸和結構突變等[78]。過度擬合導致模型樣本內性能較好,樣本外拓展能力較差[6,79]。Hansen等[80]通過考慮一系列數據挖掘的例子,發現樣本外分析比樣本內分析更能解決數據挖掘導致的模型過擬合問題。Granger[81]指出,模型與數據的擬合度較高可能是虛假回歸的原因,這使得模型變得不再可靠。此外,數據中結構突變的存在也導致不能進行有效的建模[5,82]。一般而言,樣本內預測提供了更有效的參數估計,因此,對目標的預測會更準確;而樣本外預測則隱含地對數據生成過程的穩定性進行檢驗,同時采用樣本內和樣本外預測有助于得到更可靠的結果[69]。應當注意的是,樣本內可預測性是樣本外可預測性的必要條件[78]。
實時預測也是原油價格預測研究中重點關注的問題。數據的滯后公布和修正是實時預測的兩個重要問題。Baumeister等[50]指出,并非所有的預測數據都能實時得到,并且許多預測原油價格的指標會受到數據修正的影響。例如,RAC原油價格只有在延遲3個月左右才能獲得,而用于構建原油實際價格的CPI數據只有在延遲1 個月后才能獲得;并且,因統計誤差等原因,這些期初公布的初始數據可能會在之后的幾個月中被調整修正。Baumeister等[50]首先對這一問題進行了研究,并構建了一個用于月度原油價格預測的實時數據庫,研究發現,即使在實時預測的真實預測環境下,原油價格依然具有較好的可預測性,利用實時數據的預測模型可以打敗基準模型;此外,他們還發現,數據修正在一定程度上也反映了有價值的預測信息。Baumeister等[2]則基于實時數據庫對原油的季度價格進行預測研究。隨后,Wang等[5]和Liu等[71]也構建了實時數據庫,基于改進模型對原油價格進行實時預測。最近有關原油價格預測的文獻也對此問題進行了考慮[39-41]。
基準模型的選擇對于原油價格的預測評價是非常重要的。文獻中常用的原油價格預測基準包括無變化(No-change)預測[5,41,49-50]、基于期貨價格的預測[2,7,50]以及歷史均值預測[39-40,71-72]等。
假設原油市場是有效的,即原油價格不可預測,則隨機游走模型就為原油價格提供了一個有效的預測基準。基于無漂移項的隨機游走模型,未來原油價格的預測值就是當前的價格水平,即無變化預測,可以表示為

式中:Pt為第t期的原油價格;為在第t期對t+h期原油價格的預測;h為預測周期。
學者們也普遍認為,原油期貨價格是預測未來原油價格的最佳指標[5,49,83]。期貨市場價格發現理論中的預期理論認為,期貨價格是未來現貨價格的無偏估計,其預測值可以表示為

歷史均值一直是股票收益率預測的基準模型[69,76-77,84],在原油價格收益率預測中也被廣泛使用。歷史均值預測的核心思想同樣是基于有效市場和隨機游走,其預測值表達式為

式中:ri為第i期的原油價格收益率;為在第t期對t+h期原油收益率的預測值。
為了比較基準模型和其他模型對于原油價格預測能力的優劣,選擇合適的預測評價指標是必要的。常用的評價指標包括均方預測誤差比率(Mean Square Prediction Error Ratio,MSPE Ratio)[5,7,42,49-50]、樣本外R2(Out-of-sampleR2,以及成功率[5,39,49-50]等。
MSPE比率衡量了其他模型相對于基準模型均方預測誤差的比例,可以表示為

式中:Pt+h為第t+h期的原油真實價格;為基準模型預測的t+h期的原油價格;為其他模型預測的t+h期的原油價格。顯然,MSPE比率小于1表明,其他模型的預測結果比基準模型的預測結果更準確。
樣本外R2由Campbell等[86]提出,衡量了其他模型相對于基準模型MSPE的減少程度,可以表示為

式中:rt+h為第t+h期的原油真實收益率為基準模型預測的t+h期的原油收益率為其他模型預測的t+h期的原油收益率。顯然,樣本外R2>0,說明其他模型相對于基準模型的MSPE較小,即預測結果更準確。樣本外R2的統計顯著性可以基于Clark等[87]統計值進行檢驗。此外,由MSPE比率和樣本外R2的定義可知,如果預測對象都是收益率或價格,這兩個評價指標是一致的、可相互轉換的[39,88]。
在實際應用中,預測市場的漲跌走勢有時比獲得準確的點預測更為重要[89]。因此,檢驗市場走勢預測精度的成功率指標被用于原油價格預測的評價,其可以表示為

式中:Dt為啞變量,當對第t期原油價格漲跌走勢的預測和真實漲跌走勢一致時,其值為1,否則為0;N為評價樣本的長度。成功率的統計顯著性可以基于Pesaran等[90]統計值進行檢驗。
上述3個指標評價了原油價格預測的統計精度。然而,投資者在利用原油價格預測構造投資組合時,更加關心原油價格預測能否帶來經濟收益。現有文獻對原油價格預測經濟收益的評價指標包括確定性等價收益(Certainty Equivalent Return,CER)和夏普比率(Sharpe Ratio,SR)等。CER是投資者不采用有風險投資組合時愿意接受的無風險回報率[39,69-70,86];夏普比率可以被解釋為單位風險帶來的投資超額收益。Yin 等[70]、Liu等[71]和Zhang等[39]的研究都使用了這兩個指標對原油價格預測的經濟效益進行評價。
專家調查預測是利用專家的專業知識、判斷、意見和直覺,分析研究并尋求原油價格的變動規律,推測未來原油價格的一種預測方法10)類似地,Anderson等[91]利用了消費者調查數據進行原油價格的預測。專家通常更熟悉原油相關的短期經濟動態,以及可能的長期演變或整體經濟將發生的結構性變化。長期以來,原油價格長期預測一直尋求專家的意見和建議[92-93]。提供原油價格專家調查預測的組織和機構有美國能源信息署 (Energy Information Administration,EIA)11)https://www.eia.gov/、經濟學人智庫(Economist Intelligence Unit,EIU)12)https://www.eiu.com/以及共識經濟公司(Consensus Economics,CE)13)https://www.consensuseconomics.com/等。
相關文獻將專家調查預測與其他模型進行比較,分析其預測的準確度。基于共識經濟公司的原油價格預測,Reitz等[94]發現,專家調查預測與隨機游走預測相比表現不理想。相似地,Alquist等[95]研究發現,專家調查預測不如無變化預測準確。Alquist等[7]則評估了不同來源的專家調查預測的表現,通過將其與無變化預測進行比較,發現專家調查預測對于原油價格預測精度的提升是有限的。Kunze等[96]從短期和長期預測的角度對專家調查預測進行評估,發現其在短期預測時不如天真的基準模型預測準確,然而,其長期的預測表現好于天真的基準預測。Figuerola-Ferretti等[97]對彭博社的原油價格專家調查預測進行了分析,結果表明,基于期貨價格的預測比基于分析師的預測更準確。專家調查預測表現不佳的原因可能是因為專家并不是完全理性的[98-100]。相比之下,Zhou 等[101]發現,專家調查預測相對于定量方法的預測是一種有效的補充。Cortazar等[102]也指出,可以從眾多專家預測中提取出有用的油價預測信息。總體而言,專家調查預測并沒有給出令人信服的原油價格預測。
傳統計量模型在原油價格預測中被廣泛使用。其中,有代表性的模型主要包括自回歸模型(Autoregressive Model,AR)、自回歸移動平均模型(Autoregressive Moving Average Model,ARMA)、自回歸綜合移動平均模型(Autoregressive Integrated Moving A verage Model,ARIMA)、廣義自回歸條件異方差模型(Generalized Autoregressive Conditional Heteroscedasticity,GARCH)、向量自回歸模型(Vector Autoregressive Model,VAR)以及其他普通的線性回歸模型。
AR 模型利用過去若干期原油價格數據來預測未來的原油價格。Baumeister等[50]、Alquist等[7]和Gupta等[37]在進行原油價格預測時都考慮使用AR模型,然而,得到的預測結果并不理想。ARMA模型以AR 模型與移動平均模型為基礎組合構成。AR模型是一種特殊的ARMA 模型,而ARIMA 模型則是為了保證ARMA 模型中數據平穩而得到的模型。Xie等[103]利用ARIMA 模型預測WTI原油價格,發現ARIMA 表現一般。Moshiri等[104]運用ARIMA 和GARCH模型,對1983~2003 年在NYMEX 交易的原油期貨價格進行建模和預測,結果表明,ARIMA 和GARCH 模型的表現不如其他被考慮的模型。雖然這些模型預測表現一般,但是它們在預測原油價格的文獻中非常流行[7,50,105-107]。
由Sims[108]提出的VAR 模型是一個線性回歸方程組。在VAR 模型中,特定的變量對自身的滯后項和模型中其他變量的滯后項進行回歸。Alquist等[7]發現,VAR 模型能夠比AR 和ARMA模型產生更準確的短期原油價格預測值。考慮到原油市場和經濟活動之間的非線性關系,Gupta等[37]使用定性VAR 模型對WTI原油價格進行預測,發現定性VAR 模型的預測表現優于隨機游走、AR 以及傳統VAR 模型。基于預測變量構建一元線性回歸模型也是一種流行的原油價格預測方法。Yin等[70]利用線性回歸模型比較了經濟變量和技術指標的預測能力,發現技術指標對原油價格的預測能力更強。其他預測原油價格的文獻也考慮了簡單的線性回歸模型[4,40,49,109]。總體而言,傳統計量模型無法捕捉原油市場的非線性等特征,并且其前提假設較為嚴格,對原油價格的預測存在一定的限制。
在預測過程中,統計模型有時會違背經濟理論。在這種情況下,對統計模型施加合理的經濟理論約束能夠提高預測效果。例如,在股票收益率預測時,Campbell等[86]認為理性的投資者出于賣空約束等理由會拋棄負的收益預測,因此,當收益預測為負值時,將其約束為零。同時認為預測變量回歸系數的正負性應該符合理論預期,否則放棄該預測變量,直接使用基準模型進行預測。此后,Pettenuzzo等[84]在非負收益的基礎上繼續使用合理的夏普比率對收益預測加以約束。類似地,Zhang等[110]使用3σ準則對收益率預測的極大值進行合理約束。這些研究都發現,施加經濟約束后可以進一步提高股票收益率的預測表現。
受此啟發,學者們在進行原油價格的預測時也嘗試考慮施加經濟約束以提高預測精度。Wang等[49]在進行原油價格預測時,同時考慮了經濟約束和統計約束。在經濟約束方面,他們借鑒Campbell等[86]的思想,對預測指標回歸系數的符號進行約束,保證模型中得到的回歸系數與經濟理論預期是一致的,結果表明,施加該經濟約束可以提高原油價格預測的準確性。最近,Wen等[41]在使用技術指標進行原油價格預測時也考慮經濟約束方法,并提高了原油價格的預測表現。其他原油價格預測的文獻也考慮了經濟約束的作用[39,42,111]。總體而言,施加經濟約束可以使得原油價格預測更符合經濟理論,進而提高原油價格的預測精度。
金融預測研究經常存在模型不確定性的問題,導致單個模型的預測性能有限,預測精度較差。Stock等[112]和Rapach 等[77]都對這一問題進行了探究,并推薦使用組合預測方法來解決這一問題。Rapach等[77]指出,組合預測方法能夠有效降低預測誤差方差,進而提高預測表現。
Baumeister等[9]較早在原油價格預測的研究中考慮預測組合的作用,發現實時預測組合會比無變化預測的原油價格更加準確,如基于成功率的預測精度高達72%,因此,他們建議構建合適的組合預測以代替傳統的原油價格預測方法。隨后,Wang等[5]基于時變參數模型的多種組合方法對原油的實際價格進行預測,結果表明,在長達24個月的預測周期內,基于時變參數模型的預測組合方法的原油價格預測精度高于無變化預測、單個模型預測以及基于恒定系數模型的預測組合方法。這一結果的原因是不同時變參數模型預測誤差之間的相關性較低。Zhang等[4]則考慮了一種新的迭代組合方法對原油價格進行預測,研究發現,迭代組合預測和傳統的組合預測方法都能夠提供優于基準模型的原油價格預測。相比之下,迭代組合預測的預測精度更高。組合預測方法不僅表現優異且十分穩定可靠,在原油價格預測的研究中被廣泛使用[39-41,45,113-116]。總體而言,組合預測方法可以解決原油價格預測中的參數及模型不確定性問題,是一種提高原油價格預測精度的穩健方法。
3.7.1降維方法 降維是一種處理多元信息的方法,而且可以有效防止模型過擬合等問題[5-6,40,70,72,117]。原油價格預測的文獻常常會涉及幾十甚至上百個變量[4,27,39,73],亟需進行降維處理。其中,常用的降維方法包括主成分分析法(Principal Component Analysis,PCA)、偏最小二乘法(Partial Least Squares,PLS)以及縮放主成分分析法(Scaled Principal Component Analysis,SPCA)等。
Yin等[70]利用PCA 方法從經濟變量和技術指標中提取主成分,并對原油價格進行預測,結果表明,PCA 可以有效地從預測指標中提取信息,對原油價格的預測較為準確。相比于PCA 的無監督降維,PLS是一種有監督的降維方法。Zhang等[39]和Wen等[41]基于PLS方法對原油價格進行預測。與PLS的思想類似,Huang等[118]提出SPCA 方法也是一種有監督的降維方法。He等[40]基于技術指標,使用SPCA 方法預測原油實際價格,研究發現,SPCA 能夠識別對原油價格預測能力強的技術指標,從而提升原油價格的預測效果。最近,Zhang等[6]將PCA 和組合預測方法進行結合,提出了一種新的降維組合預測方法,實證結果顯示,該降維組合方法優于相關的競爭預測模型,對原油收益率的預測更加準確。總體而言,降維方法可以有效解決因變量數目多而產生的多重共線性和過度擬合問題,在原油價格預測領域取得了一定的成效。
3.7.2變量選擇 變量選擇是另一種適合多變量環境的預測方法,在原油價格預測中也經常被使用[6,27,39-41,72]。Lasso(Least Absolute Shrinkage and Selection Operator)[119]和彈性網[120]是常見的變量選擇方法。這些方法由于在普通最小二乘的目標函數上進一步引入了L1范數的懲罰項,可以讓一些相對“無用”變量的回歸系數收縮為零,從而實現變量選擇的功能。換言之,回歸系數非零的變量就是被選擇的變量。
Zhang等[39]利用變量選擇模型對原油價格預測進行了一個全面的研究,發現Lasso和彈性網的預測表現優于嶺回歸、組合預測和主成分分析法等競爭模型,并進一步探究了原油價格預測的變量選擇問題,給出了一些有意義的發現:①Lasso和彈性網并不總是選擇預測能力強的變量,也會兼顧那些能夠提供互補信息的變量;②變量選擇呈現出有趣的動量效應;③基于每一期所選擇的變量,普通的多元線性回歸模型也可以表現出較好的預測能力;④模型的變量選擇及預測能力與投資者情緒緊密相關。這些有價值的發現對進一步解釋和理解變量選擇模型的預測能力是很有幫助的。Miao等[27]考慮供給、需求、金融市場、商品市場、投機和地緣政治6個方面的預測指標,使用Lasso模型對原油價格進行預測,結果表明,Lasso模型的預測性能優于無變化預測和期貨基準預測。Wen等[41]在考慮經濟約束的前提下利用Lasso和彈性網等模型對原油價格進行預測研究,發現變量選擇模型確實可以準確地預測原油價格,并且考慮經濟約束后,它們的預測性能可以得到進一步提升。
總體而言,變量選擇模型通過引入了L1范數的懲罰項,放棄了普通最小二乘法的無偏估計,通過犧牲估計的偏差來提高估計的穩定性,從而實現提高預測精度的目標。因此,和降維方法一樣,變量選擇模型也可以解決多變量環境下的過度擬合和多重共線性問題,在原油價格預測領域頗有建樹。
3.7.3神經網絡模型 真實的原油市場具有復雜的非線性、高波動性和不規則的特點[121],導致傳統計量模型在進行原油價格預測時不可避免地存在一定的局限性。因此,眾多學者考慮使用能夠捕捉預測指標與原油價格之間非線性關系的神經網絡模型對原油價格進行預測[107,122-127]。
現有文獻表明,神經網絡模型對原油價格預測具有優越的性能。Tang等[122]構建了一個多小波遞歸神經網絡(Multiple Wavelet Recurrent Neural Network,MWRNN)仿真模型,并利用該模型對原油價格進行預測,然后通過結合一個反向傳遞神經網絡(Back Propagation Neural Network,BPNN),得到原油價格的最優預測,仿真結果表明,該模型具有較高的預測精度。Xiong等[123]提出了一種基于經驗模態分解(Empirical Mode Decomposition,EMD)和前饋神經網絡(Feed-forward Neural Network,FNN)的修正混合模型,該模型能夠捕捉原油價格的復雜動態。Godarzi等[128]研究發現,在石油價格平穩期和振蕩期,帶外生輸入的非線性自回歸神經網絡模型的預測結果比線性時間序列和靜態人工神經網絡模型的預測結果更準確。范秋楓等[125]將模糊邏輯系統與神經網絡進行結合,采用量子粒子群智能算法調整模糊神經網絡系統中的參數,使用此系統對Brent原油價格進行預測,結果表明,基于量子粒子群智能算法的模糊神經網絡系統對原油價格的預測精度高于BP神經網絡算法和普通最小二乘法。
3.7.4其他預測方法及小結評述 除了上述用于原油價格預測的機器學習方法,學者們也探索并使用了其他可提高預測精度的方法對原油價格進行預測,例如支持向量機(Support Vector Machine,SVM)、小波分析以及眾多混合方法。
李建立等[129]通過建立多因素SVM 模型對原油價格進行預測,實證結果表明,基于此模型的原油價格預測相對于誤差修正模型和基于油價本身的自回歸SVM 模型具有更好的預測效果。Fan 等[130]在原油價格預測中也使用了SVM 模型。Lin等[131]運用小波分析與其他模型結合,提出了一種新的原油價格預測方法,發現新模型在極端事件期間具有優越的預測能力。劉金培等[105]和Jammazi等[132]也基于小波分析預測原油價格。此外,眾多混合方法也被用于原油價格的預測。Wang等[133]將復雜網絡方法與人工智能算法進行混合;Chai等[134]將變點識別方法、時變轉移概率馬爾科夫機制轉換模型、貝葉斯模型平均和時變結構時間序列模型進行混合;Abdollahi[135]將完備集合經驗模態分解方法、支持向量機、粒子群優化算法和馬爾科夫轉換GARCH 模型進行混合;Abdollahi等[136]將自適應神經模糊推理系統、自回歸分數積分移動平均以及馬爾科夫轉換模型進行混合;張金良等[137]將小波變換、神經網絡以及GARCH 模型進行混合。其他很多文獻也利用混合方法進行原油價格預測[106,138-141]。
機器學習方法通過解決原油價格預測中存在的復雜性問題,提高原油價格的預測精度。例如,降維方法和變量選擇模型都可以處理多變量環境下的過度擬合問題,而神經網絡方法則可以捕捉到變量之間非線性的交互信息。單個模型可能無法同時解決預測過程中的多個問題。為了綜合各個模型的優點,現有文獻進一步混合多種預測方法進行原油價格預測,結果顯示,確實可以提高預測精度。然而,相較于單個模型,混合模型更加難以解釋,其背后的經濟邏輯和理論基礎都不夠清晰。此外,混合模型存在過多超參數調試、模型設定及多個方法排列組合等選擇偏誤問題,更加容易引起數據挖掘和p值操縱的實證問題,使得這些復雜模型的預測能力缺乏擴展性和可復制性。在研究這類預測方法時,需要重點關注這些問題,并予以解決14)將在5.3小節繼續對該話題進行了相關討論。
原油是經濟生產過程中最重要的工業原材料之一,因此,油價變化會影響宏觀經濟的運行情況。Narayan等[142]對原油價格能否預測經濟增長進行探究,考慮了28個發達國家和17個發展中國家的經濟增長與原油價格的關系,結果表明,名義原油價格相比于實際原油價格可以為經濟增長的預測提供更多的信息。Hamilton[143]和Kilian等[144]指出,原油價格沖擊是導致經濟衰退的主要原因之一。其他大量文獻也對原油價格和宏觀經濟的關系進行了論證[145-147]。
總體而言,原油價格是評估宏觀經濟狀態及經濟運行風險的重要依據。政府監管部門(如央行、財政部和工信部等)在進行宏觀經濟調控時,應該根據原油價格的當前水平和未來預期,實行對應的政策和措施。例如,在油價急劇上升時,經濟生產的成本會升高,宏觀經濟會面臨通貨膨脹和失業率增加的風險。政府監管部門應該實行相關經濟保護措施和經濟刺激手段以避免發生經濟衰退。此外,原油儲備關乎國家能源安全問題。油價預測是國家原油儲備動態調整的重要依據。
原油價格變化也會影響相關企業的成本預算、投資決策和經營管理。例如,當油價下降時,OPEC希望成員國的石油開采企業通過降低原油的開采與供應來維持油價。原油價格是航空公司重要的運營成本,對其成本預算和機票定價都有重要影響。油價上升通常會提高機票的燃油附加費。此外,油價水平會影響消費者對燃油汽車和新能源汽車的購買決策,同樣也會影響汽車生產廠商的研發和生產決策。隨著原油的慢慢耗竭或價格上升,汽車廠商有更強的動機去研發生產新能源汽車。
在相關研究中,Driesprong等[148]發現,由于原油是大多數公司的重要投入,原油價格上漲會增加其運營成本,從而減少利潤。Gupta等[149]對不同宏觀經濟條件下原油價格和企業風險承擔之間的關系進行研究,結果表明,隨著原油價格上漲,如果宏觀經濟條件有利(不利),企業會增加(減少)風險承擔。
原油及其衍生的金融產品(如期貨、期權和基金15)美國石油指數基金(United States Oil Fund,USO)是全球最有名的原油價格指數交易基金等)是機構和個人投資者的重要投資對象。眾多文獻分析了原油價格收益率預測值的經濟價值[4,6,39-41,70-72]。油價預測的經濟價值檢驗主要分為兩大類:第1類是從資產配置的角度,根據油價收益率的預測值構建基于原油期貨和無風險資產(如國債)之間的投資組合,并檢驗其投資組合的經濟效益[4,12,39,41,70,72];第2類是從市場擇時的角度,根據原油預測的漲跌,買入或賣空原油產品,并檢驗其市場擇時的投資效益[12,40-41,44]。
除了投資目標以外,油價預測還可以應用于避險。原油的多頭(如原油生產廠商)和空頭(如航空公司)都可以利用原油期貨進行套期保值。雖然套期保值主要取決于現貨和期貨之間的相關性(或協方差),但是油價預測可以為是否避險提供決策依據。例如,當預測油價上升(下降)時,原油的多頭(空頭)方就沒有必要進行套期保值的避險,而空頭(多頭)方則需要進行避險。這與市場擇時的邏輯是相似的。
總之,政府、企業到個人投資者都很關心原油價格的預測,并從中獲得幫助。政府可以從原油價格預測中了解經濟的現狀和走勢,制定合理的經濟調控政策。相關企業可以依據原油價格預測,合理調整投融資決策以提高企業價值。投資者可以根據油價預測進行投資組合或市場擇時以提高投資收益或降低投資風險。因此,油價預測具有重要的現實意義。需要注意的是,對于不同領域的實際應用,需要關注不同的原油價格預測對象。
隨著全球變暖和極端天氣的頻繁出現,氣候風險正成為金融學的熱門研究話題。金融學頂級期刊Review of Financial Studies和Journal of Financial Economics分別在2020年和2021年組織了以“氣候金融”為主題的專刊16)據不完全統計,近年來,以“氣候金融”和“綠色金融”等相關主題組織專刊的期刊還包括Review of Finance、Journal of Corporate Finance、Journal of Banking &Finance、Journal of Financial Stability、Ecological Economics和Finance Research Letters等。眾多研究發現,氣候風險可以顯著影響房地產[150-151]、債券[152-153]、股票[154-156]和其他金融衍生產品[157]的定價。氣候風險包括氣候變化風險和應對氣候變化的政策風險。在“雙碳”目標下,從長期來看,化石能源的使用應是逐漸減少的,但氣候風險的短期效應還不明確。目前為止,氣候風險如何影響原油價格,相關文獻的研究還明顯不足。
但是,原油的開采、提煉和消耗都是碳排放強度高的活動。因此,氣候風險對原油及其金融衍生產品的定價影響具有扎實的經濟理論基礎。如何從眾多氣候風險因素中找出對原油價格預測的有效變量是未來值得研究的方向。
隨著大數據技術的發展,可以在傳統預測變量的基礎上進一步構建新的預測指標。具體而言,可以利用網絡數據采集、文本分析、圖像識別和語音識別等技術獲取及處理豐富的多源異構數據。目前,原油價格預測在這方面的研究還比較缺乏。Fantazzini等[158]、Han等[85]和Yao等[159]都利用網絡數據進行了油價預測的指標構建。劉嶺等[160]利用新聞數據構建了新聞影響力指數衰減指標來預測油價。Kertlly de Medeiros等[47]根據EIA 的原油市場報告數據,提取構建了一個文本情緒指標。
石油鉆井平臺、煉油廠、大型油桶、港口集裝箱和海洋冰川等衛星圖像數據反映了原油的供應與需求、經濟活力和氣候風險等信息。Mukherjee等[161]發現,投資者會根據儲油罐上空的衛星圖像計算石油庫存量,但晴天的圖像可以清晰地獲得該信息,但陰天的衛星圖像因云層遮擋而不能反映該信息。此外,石油行業上市公司的年報和電話視頻會議數據反映了具有專業背景的管理者對于油價行情的預期和原油市場的情緒。能否從這些文本、圖像和音頻等多源異構數據中提取出有效的原油價格預測信息是未來值得研究的問題。
本文回顧了大量機器學習與原油價格預測的文獻。這些文獻發現,機器學習方法可以提升原油價格的預測表現,但沒有給出預測模型成功背后的因果邏輯和經濟理論基礎。顯然,這會造成數據挖掘和p值操縱的問題,使得實證結果不可靠,缺乏擴展性和可復制性。特別地,大量文獻采用了多種統計方法和機器學習模型相互混合的形式來預測原油價格,這種混合模型對梳理經濟理論解釋造成較大難度。
機器學習是原油價格預測領域未來可以進一步研究的方向。但其重點是打開機器學習的“黑箱”,給出對應的經濟理論解釋,避免數據挖掘和p值操縱的陷阱。Chinco等[162]利用Lasso方法進行橫截面股票收益率的預測研究,并證明了Lasso預測能力的經濟理論解釋是:那些包含基本面信息的公司股票收益率總是在新聞發布前10 min 左右被Lasso所提前捕捉到。Gu等[163]發現,回歸樹和神經網絡模型是預測股票收益率最成功的機器學習方法,因為它們能夠捕捉變量之間的交互信息,這是其成功的關鍵;此外,還發現,動量、流動性和波動率是所有眾多變量中最成功的變量,這3類變量都是富有經濟理論基礎的。總之,剖析機器學習方法成功預測原油價格背后的因果邏輯和經濟理論,是未來值得進一步研究的方向。