余 味
(安徽大學 大數據與統計學院,安徽 合肥 230601)
資產定價是金融研究的核心問題。資產定價的常用方法有兩種:均衡定價和無套利定價。均衡定價的思想與經濟學中實物商品的價格決定機制類似,也就是尋找使得商品的供給和需求達到平衡時的價格。Sharpe[1]提出了資本資產定價模型,可以表示為
其中,Ri表示我們關注的風險資產i的收益率,RM為市場組合的收益率,rf為無風險利率,βi衡量資產的風險大小。按照此模型,不同資產的均衡價格滿足一種線性關系,其超額收益率與風險系數βi成正比。風險系數用下式衡量:
其中,σiM表示資產i與市場組合的收益率協方差,σ2M表示市場組合收益率的方差。該模型揭示了資產風險的本質是資產收益率波動不能夠被市場上其他資產對沖的部分,在表達式中表現為資產i與市場組合的收益率協方差。無論組合的資產種類如何增加,這部分風險都無法被分散,通常稱為系統風險。而能夠通過資產組合來分散的風險稱為個體風險,二者之和就是總風險。因此資產i的風險溢價E(Ri)-rf就可以表示為“風險溢價=風險的度量×風險的價格”[2],風險的度量是βi,而風險的價格是E(RM)-rf。
資本資產定價模型在金融實踐中得到了廣泛的應用,也有很多關于其有效性的討論。申婧怡[3]基于CAPM 研究了2012年至2017年萬科股票指數,通過回歸模型判斷該項資產的收益效果。張燕、王一登[4]利用CAPM 研究了不同牛市和熊市下證券商業股票市場的系統風險和總風險,驗證了資本資產定價模型在證券行業的有效性,并且說明了系統性風險與總風險的關系在牛熊市存在差異以及分析了造成差異的可能原因。崔勁等[5]使用A 股上式公司的數據,發現小規模公司存在明顯的超出CAPM 模型下期望報酬的規模溢價。Bai 等[6]在一般均衡模型中考慮災害的影響,來幫助解釋CAPM 模型的失效情形。Rubinstein[7],Lucas[8],Breeden[9],Grossman 和Shiller[10]將資產價格與消費聯系起來,建立了基于消費的資本資產定價模型(C-CAPM)。Choi[11]在考慮股票溢價的弱可預測性和無風險利率謎題的情形下,討論了基于消費的資本資產定價模型所存在的問題和爭議。
由于β系數對于資產的定價有重要意義,而且不同行業股票的β系數往往呈現不同的特征,這為我們分行業探討股市走向提供了思路,而β系數的估計是一個技術性較強的線性回歸問題。由于突發狀況的影響,一些股票可能在某段時間出現大漲或大跌,導致股市數據經常會出現離群值。本文將分析使用實際收益率數據來估計資本資產定價模型時存在的問題,尋找數據存在離群值的情形下較好的估計方法,并用此方法來分析各行業股票的風險特征。
實踐中我們通常使用線性回歸模型來估計β系數。用R(j)*i=R(j)i-rf表示資產i的超額收益率,其中R(j)i,j=1,…,n表示資產i的收益率的n個觀測值;R(j)*M=R(j)M-rf表示市場組合的超額收益率,其中R(j)M,j=1,…,n表示市場組合的收益率的n個觀測值。 那么根據資本資產定價模型應該有但是用真實數據來擬合時,這種關系一般不會精確地成立。因此我們通常擬合的是含有截距項的模型,也就是
該模型是一般的線性回歸模型
的一個特例。模型(4)中,α和β是待估參數,εj是擾動項,滿足E(εj)=0 的假定。用(xj,yj),j=1,2,…,n表示一組觀測樣本,α和β的最小二乘估計是尋找,,使得殘差平方和達到最小。然而,當樣本存在離群值時,殘差平方和增加得很快。離群值會將回歸線極大地拉向自己,導致回歸的結果不準確(圖1)。

圖1 離群值對回歸直線位置的影響Fig.1 Effect of outliers on the position of regression line
為了解決參數估計中離群值的影響,將最小二乘估計量擴展為一般的M 估計量,其定義為求解如下的最優化問題:
其中ρ(·)是定義在(-∞,∞)的連續函數,滿足ρ(0)=0,ρ(-u)=ρ(u)。
經典的最小二乘估計法實際上就是在(5)式中使用ρ(u)=u2。為了得到受離群值影響較小的估計結果,一個思路是使用其他的ρ(·)函數來替代平方損失函數。最小絕對值法使用ρ(u)=|u|.Huber[12]和Huber[13]使用如下的ρ:
Geman-McClure 方法(Pennacchi[14])使用如下形式的ρ:
其他穩健估計方法還有Andrews 法(Andrews[15]),Hampel 法(Hample 等[16]),Tukey 法(Lee 等[17]),Danish法(Knight 和Wang[18])等。下面我們將探討穩健估計方法是否能夠減小估計偏差。
在模型(4)中,設置α=2,β=1。xj從均值為10 的指數分布中產生,εj從標準正態分布中產生,然后根據模型計算出yj的模擬值。對于每一個模擬樣本,按以下4 種情況構造離群點:
情形1:無離群點;
情形2:第5 個點的y值加上粗差10;
情形3:第5 個點的y值加上粗差10,第10 個點的y值加上粗差-10;
情形4:第5 個點的y值加上粗差20。
然后使用4 種方法來估計α和β——最小二乘法(記作LS),最小絕對值法(記作LA),Huber 法(記作Huber)以及Geman-McClure 法(記作GM).對于Huber 法,設置其參數c=1.5。估計的過程就是求解(5)式的最優化問題,可以使用選權迭代法。
重復以上過程B次,得到B個和的模擬估計值(k),(k),k=1,…,B。用平均絕對偏差來衡量估計量的準確性,也就是
考慮樣本量為n=10,20,30,40,50。不同樣本量以及離群值情形下模擬計算的結果顯示在表1~4中。
表1 離群值為情形1時,不同樣本量下4種方法的和估計的平均絕對偏差Table 1 Mean absolute error of the estimators α^ and β^ based on the four methods under different sample sizes when the outlier is in case 1

表1 離群值為情形1時,不同樣本量下4種方法的和估計的平均絕對偏差Table 1 Mean absolute error of the estimators α^ and β^ based on the four methods under different sample sizes when the outlier is in case 1
MAE(α^)MAE(images/BZ_6_1250_1625_1276_1679.png)n=10 n=20 n=30 n=40 n=50 n=10 n=20 n=30 n=40 n=50 LS 0.4034 0.2693 0.2107 0.1856 0.1571 0.0351 0.0215 0.0165 0.0136 0.0119 LA 0.5043 0.3212 0.2568 0.2314 0.1976 0.0424 0.0260 0.0203 0.0173 0.0151 Huber 0.4089 0.2715 0.2146 0.1880 0.1625 0.0353 0.0217 0.0167 0.0138 0.0121 GM 0.5338 0.3717 0.3087 0.2719 0.2257 0.0441 0.0287 0.0236 0.0206 0.0176
表2 離群值為情形2時,不同樣本量下4種方法的和估計的平均絕對偏差Table 2 Mean absolute error of the estimators α^ and β^ based on the four methods under different sample sizes when the outlier is in case 2

表2 離群值為情形2時,不同樣本量下4種方法的和估計的平均絕對偏差Table 2 Mean absolute error of the estimators α^ and β^ based on the four methods under different sample sizes when the outlier is in case 2
MAE(α^)MAE(images/BZ_6_1250_1625_1276_1679.png)n=10 n=20 n=30 n=40 n=50 n=10 n=20 n=30 n=40 n=50 LS 1.4159 0.7052 0.4834 0.3819 0.2911 0.1063 0.0489 0.0327 0.0233 0.0195 LA 0.5573 0.3488 0.2913 0.2244 0.1969 0.0513 0.0284 0.0214 0.0174 0.0142 Huber 0.5154 0.2957 0.2467 0.1964 0.1673 0.0477 0.0242 0.0181 0.0144 0.0121 GM 0.5280 0.3916 0.3272 0.2625 0.2420 0.0440 0.0292 0.0243 0.0202 0.0179
表3 離群值為情形3時,不同樣本量下4種方法的和估計的平均絕對偏差Table 3 Mean absolute error of the estimators α^ and β^ based on the four methods under different sample sizes when the outlier is in case 3

表3 離群值為情形3時,不同樣本量下4種方法的和估計的平均絕對偏差Table 3 Mean absolute error of the estimators α^ and β^ based on the four methods under different sample sizes when the outlier is in case 3
MAE(α^)MAE(images/BZ_6_1250_1625_1276_1679.png)n=10 n=20 n=30 n=40 n=50 n=10 n=20 n=30 n=40 n=50 LS 1.4242 0.6839 0.4556 0.3102 0.2629 0.1533 0.0677 0.0432 0.0294 0.0245 LA 0.7128 0.3637 0.2930 0.2264 0.2041 0.0713 0.0308 0.0224 0.0177 0.0153 Huber 0.6660 0.3298 0.2496 0.1982 0.1664 0.0709 0.0288 0.0197 0.0153 0.0126 GM 0.5726 0.3993 0.3315 0.2668 0.2364 0.0485 0.0304 0.0249 0.0206 0.0179
表4 離群值為情形4時,不同樣本量下4種方法的和估計的平均絕對偏差Table 4 Mean absolute error of the estimators α^ and β^ based on the four methods under different sample sizes when the outlier is in case 4

表4 離群值為情形4時,不同樣本量下4種方法的和估計的平均絕對偏差Table 4 Mean absolute error of the estimators α^ and β^ based on the four methods under different sample sizes when the outlier is in case 4
MAE(α^)MAE(images/BZ_6_1250_1625_1276_1679.png)n=10 n=20 n=30 n=40 n=50 n=10 n=20 n=30 n=40 n=50 LS 2.8880 1.3368 0.9101 0.6651 0.5334 0.2339 0.0884 0.0578 0.0414 0.0337 LA 0.5679 0.3510 0.2800 0.2308 0.2099 0.0589 0.0265 0.0208 0.0174 0.0150 Huber 0.5410 0.2982 0.2537 0.1925 0.1745 0.0573 0.0228 0.0180 0.0148 0.0128 GM 0.5491 0.3905 0.3238 0.2680 0.2499 0.0474 0.0285 0.0235 0.0206 0.0183
從表1~4 可以看出,當不存在離群值(情形1)時,四種方法的MAE 差不多。幾種方法的MAE 都隨著樣本量的增大而減小。但是當存在離群值時,穩健估計法的表現明顯比最小二乘法好。在較小的樣本量下,Huber 和GM 方法的表現都比較好。隨著樣本量的增加,Huber 方法的表現優于其他方法。當離群值的粗差加大,由10 變為20,最小二乘法的MAE 增加的幅度很大,但三種穩健估計法的MAE幾乎沒有變化。
綜合以上結果,Huber方法在離群值情形下能夠得到較好的估計結果,因此后文將使用Huber方法進行實證分析。
這里我們分析6 只股票,包括上海證券市場的浦發銀行(PFYH,600001),上海機場(SHJC,600009),包鋼股份(BGGF,600010)以及深圳證券市場的平安銀行(PAYH,000001),深科技(SKJ,000021),華聯控股(HLKG,000036),使用綜合A 股市場作為市場組合。股票的月收益率數據從CSMAR 數據庫下載(https://www.gtarsc.com),時間從2015-01 到2018-06,因此樣本量是n=42。用活期存款利率0.3%作為無風險利率。轉化為月度利率也就是rf=0.003/12。各支股票和市場組合的基本信息和描述統計如表5 所示。

表5 各支股票的基本信息和描述統計Table 5 Basic information and descriptive statistics of the 6 stocks
用公式R(j)*i=R(j)i-rf和R(j)*M=R(j)M-rf分別計算股票的超額回報率和市場組合的超額回報率,其中R(j)M的數據使用綜合A 股市場的回報率。然后用Huber 方法擬合(3)式的模型。圖2 畫出了R(j)*M(橫軸)和R(j)*i(縱軸)的散點圖以及得到的擬合直線。和的值列在表6 中。我們看到6 支股票的系數有顯著的差異。總的來說,銀行、鋼鐵、交通運輸業的β系數相對較小,在證券市場線圖上處于較左側的位置(圖3),而電子和房地產行業有較大的β系數,在證券市場線圖上處于較右側的位置(圖3)。

表6 6只股票Huber方法的α 和β 估計Table 6 The estimators of α and β for the 6 stocks based on the Huber method

圖2 市場組合的超額回報率和單只股票的超額回報率散點圖以及基于Huber方法估計的回歸直線Fig.2 Scatter plots of excess returns for market portfolio versus excess returns for individual stocks,and regression lines estimated based on theHuber method

圖3 證券市場線和6支股票的相對位置Fig.3 The relative position of the security market line and the 6 stocks
本文使用蒙特卡羅模擬來研究資本資產定價模型穩健估計量的表現,發現數據中有離群值時,最小二乘估計量會變得很不穩定,而穩健估計量仍然能夠保持較小的誤差。我們用這些方法來擬合CAPM 模型并分析了中國A 股市場2015 到2018 年幾只股票的特征,發現不同行業風險系數的一些規律:銀行、鋼鐵、交通運輸業的β系數相對較小,而電子和房地產行業有較大的β系數。