袁杰 徐鵬 張少龍



摘 要:本文提出了一種新的模型平均法,其權重的計算方式是將傳統方法的權重與貝葉斯方法的模型概率相結合。先用模擬數據驗證了該方法的有效性,再用Fama-French三因子的數據進行實證,結果顯示該模型平均法可進一步提升模型的預測精度。
關鍵詞:模型平均法 ?貝葉斯 ?預測精度
中圖分類號:F270.7 文獻標識碼:A 文章編號:2096-0298(2020)09(b)--04
模型平均法因其具有良好的預測性質一直受到廣泛關注,被應用于計量經濟學、社會科學和金融等諸多領域。雖然單一的模型在很多情況下可以解決問題,但這要求模型建立足夠準確,否則就會丟失大量有用信息,導致預測誤差較大。當模型的自變量很多且并不存在線性相關時,單一的全模型會包括很多自變量子集構成的模型,模型平均法恰好可以將這些模型包含的信息充分利用,有效地提升預測精度。
模型平均法的核心是如何計算加權的權重,權重的分配合理與否,直接影響預測的精度。所以如何提高權重的準確度一直都是討論的熱點。本文的創新點正是在傳統的權重計算方法上結合了貝葉斯方法的模型概率,進一步提升了權重的合理性,最終分別通過模擬數據和真實數據證實了預測精度的提高。
本文結構安排如下: 第1部分是文獻綜述;第2部分是新模型平均法原理說明;第3部分是模擬分析,第4部分是實證分析,最后是結語。
1 文獻綜述
Hansen(2007)提出了Mallows 模型平均法 (MMA),該方法與之前的方法類似,仍需要對模型的標準誤進行初步估計,再計算加權權重,雖然一定程度上提升了預測精度,但不適用異方差和小樣本情形。Hansen and Racine (2012) 提出了jackknife模型平均法(JMA),該方法無需估計模型標準誤,同時又適用于異方差情形。但在同方差或小樣本情形下,該方法表現劣于MMA。Zhang et al.(2015)基于Kullback–Leibler距離,提出了一種修正的MMA方法(KLMA)。該方法在小樣本和異方差情形下表現優于MMA。Xie, T.(2015)提出了一種不依賴于模型的標準誤的模型平均法(PMA),該方法的表現優于前面三種方法。
Francisco Barillas and Jay Shanken(2018)提出了一種基于標準F-統計量計算的封閉式的貝葉斯資產定價檢驗。該檢驗利用貝葉斯概率的思想,通過計算給定自變量子集的所有可能模型集合的模型概率,比較模型的定價能力。
本文受到Francisco Barillas and Jay Shanken(2018)計算模型貝葉斯概率的啟發,將模型的貝葉斯概率與以往的模型平均法結合,提出了一種新的計算加權權重的方法。
2 新模型平均法原理說明
是一個隨機樣本,且。假設數據產生的過程是,其中,且。y、、u可為的矩陣。對于一個線性近似模型序列,有個回歸方程,例如在模型中,其中是一個的系數。令,則模型的的最小二成估計為。
令為各模型的權重,且。用模型平均法估計的為
以往的權重計算方式通常為定義一個以為參數的目標函數,令目標函數取最小值時的即為模型平均法的加權權重。PMA,MMA,JMA,KLMA四種方法分別對應的目標函數如下:
(1)
其中表示有效參數。
(2)
其中為包含全部自變量模型的標準誤。
(3)
其中,,是最小二乘法的殘差,是的對角矩陣且其對角元素為,是矩陣的第個對角元素。
(4)
其中為全部自變量模型的標準誤,是其參數個數。
模型的預測值即為,其中為與做回歸分析得到的系數。
Francisco Barillas and Jay Shanken(2019)通過計算給定自變量子集的所有可能模型集合的模型概率,比較模型的定價能力,計算公式如下:
(5)
其中是基于數據的模型貝葉斯概率,用于衡量超額收益,即模型截距項是否等于0。根據有效市場理論,該概率越大表示模型資產定價能力越強。是基于貝葉斯原理計算的各模型的邊際概率,作為后驗概率,為各模型的先驗概率。
基于以上所述,從本質上來說也可以作為一種模型平均法的加權權重,即定價能力越強的模型賦予越大的權重。后驗概率可以根據數據計算,但先驗概率該如何設置才合理?前人的做法通常為等權重設置,或根據理論知識主觀判定,這顯然存在擴大誤差的風險。
George (1997)等也提出了用擴散單位信息先驗分布作為一種基準先驗概率分布。本文針對這一問題,提出了新的觀點,用PMA,MMA,JMA,KLMA四種模型平均法的加權權重作為先驗概率帶入式(5),將得到的新模型貝葉斯概率作為模型平均法(以下簡稱為CBMA)的新加權權重。
3 模擬分析
本文采用Xie, T.(2015)的模擬方法生成數據,分別測試將PMA,MMA,JMA,KLMA四種方法的加權權重作為先驗概率,比較CBMA的表現。
假設模型為,為的矩陣,第一列為常數項,其他列為相互獨立且服從分布的隨機變量,,為與不相關的誤差項,且服從分布。通過設置參數可調節,使其范圍為0.01~0.99。本文的模擬參數設置為,模型常數項為1。
評測方法表現的指標本文選取每個對應的風險,其中為模擬生成的真實值。分別以PMA,MMA,JMA,KLMA方法的加權權重為先驗概率得到CBMA,重復模擬1000次后取均值,得到的CBMA方法表現如圖1至圖4,圖中橫坐標為,縱坐標為Risk。
由模擬結果可以看到,當低于0.1左右時,CBMA方法表現較差,其原因可能是過低時真實值的方差很大,導致與模型平均結果偏差較大;但當超過0.1左右時,CBMA方法的表現優于其他四種傳統的模型平均法,即相同時對應的Risk值更小,可有效地減少預測風險。說明CBMA方法在大于0.1的情形下,可以有效地減小預測誤差。
4 實證分析
本文選取Fama-French三因子模型作為實證測試模型,自變量為1927—2018年的Fama-French三因子月度數據,因變量選取Fama-French構建的size 1 ME 2 BM Portfolio月收益率。依然分別以PMA,MMA,JMA,KLMA方法的加權權重為先驗概率得到CBMA,用指標均方預測誤差(mean squared forecast error,MSFE)評測表現效果:,其中表示測試集,是用模型平均法估計的訓練集模型系數,是訓練集的樣本個數。為了避免代表性偏差,本文采用隨機抽樣的方法抽取50個樣本,前40個樣本作為訓練集,后10個作為測試集,重復這一操作1000次后取平均值。
為了使結果更直觀,表1中所有的MSFE都以CBMA的MSFE為基數進行標準化處理,即用其他方法的MSFE除以CBMA的MSFE。表1結果說明CBMA模型平均法在實證中表現優于其他四種模型平均法,確實提升了預測精度。
若單從實際應用的角度來說,為了更好地發揮CBMA方法的優勢,可采取優中取優的思路,對模型平均法的精度進一步提升。具體做法以PMA方法為例,先比較訓練集的結果,若CBMA的結果優于PMA,則測試集的預測采用CBMA計算預測值,反之則采用PMA計算預測值,對于其他三種方法原理相同。以下仍沿用表1中的實證數據,對這一實際應用上優化思路進行驗證,實證結果如表2所示。
由表2可知,優化的思路確實能在實際應用中進一步提升CBMA模型平均法的預測精度,說明在對于PMA,MMA,JMA,KLMA方法不適用的樣本情形下,CBMA方法能很好的形成互補,取得更好的預測表現。
5 結語
本文提出了一種新的模型平均法(CBMA),用傳統模型平均法的加權權重作為先驗概率,將貝葉斯方法的模型概率作為后驗概率,最終得到新的加權權重。首先,在模擬數據的情形下,驗證了該方法在大于0.1左右時,可以獲得比PMA,MMA,JMA,KLMA四種模型平均法更好的表現,減小了預測風險。其次,在真實數據的情形下,本文選取了Fama-French三因子模型作為測試,驗證了CBMA方法的有效性,展示了比其他四種傳統方法更高的預測精度。最后,對于CBMA方法提出了一種在實際應用中的優化思路,并通過實證驗證了其可行性,確實能在原有基礎上進一步提升預測精度。
參考文獻
Fama. Eugene F. and Kenneth R. French. The cross-section of expected stock returns[J]. Journal of Finance 1992a,47.
Fama, Eugene F.and Kenneth R. French. Common risk factors in the returns on stocks and bonds[J]. Journal of Financial Economics, 1993,33.
Francisco Barillas and Jay Shanken. Comparing Asset Pricing Models[J]. The Journal of Finance, 2018,VOL.LXXIII,NO.2 APRIL
George E I,McCulloch R E.Approaches for Bayesian variable selection[J].Statistica Sinica, 1997(2).
Hansen, B.E. Least squares model averaging[J]. Econometrica, 2017,75(4).
Hansen, B.E., Racine, J.S. Jackknife model averaging[J]. Econometrics, 2012,167(1).
Xie, T. Prediction model averaging estimator[J]. Economics Letters, 2015,131.
Zhang, X., Zou, G., Carroll, R.J. Model averaging based on Kullback–Leibler distance[J]. Statistica Sinica, 2015,25.