白雪 牛鋒



摘要:基于多種數據生成方式全面檢驗了核正則化最小二乘法(KRLS)的樣本擬合效果和樣本外預測能力,在此基礎上使用KRLS方法對傳統定價模型進行修正,分析我國四種類型開放式股票型基金的風險偏好特征。研究發現:與廣義線性模型相比,KRLS方法能夠有效捕捉隨機變量之間復雜的非線性相關關系。從橫截面維度來看,我國不同風格的基金均偏好于投資高市值股票,其中指數型基金的投資比例最高;除成長型基金外,價值型和平衡型基金也均熱衷于投資“成長型”股票。從時間維度來看,我國指數型基金的風險偏好相對穩定,而三類主動型基金表現出明顯的風險調整行為,并且風險偏好的變化特征較為相似。
關鍵詞:基金風格;風險偏好;風險調整;KRLS
中圖分類號:F224;F830.9文獻標識碼:A文章編號:10037217(2017)05004607
一、引言
一般來說,基金風格反映基金管理者投資過程中的總體風險狀況,能夠作為投資者和監管部門進行風險管理的基礎。然而,由于基金經理人與投資者之間的委托代理問題,基金經理通常會采取主動的風險調整策略。基金宣稱的投資風格能否反映其真實的風險偏好,各種類型基金在面臨不同的金融市場環境時會做出怎樣的風險調整等問題一直是學術界和實務界的關注熱點。
現有文獻大多基于多因素模型考察投資基金的風險溢價,以此判斷基金經理人投資過程中的風險偏好。但是金融資產超額收益與風險因子之間通常具有非線性、非可加的復雜相依關系,傳統多因素模型的線性假設并不成立[1]。雖然部分文獻通過引入高階項等方法對傳統定價模型進行了改進[2],但仍無法克服定價模型在形式設定上存在的主觀性。為了克服傳統定價方法在模型設定等方面存在的缺陷,本文將核正則化最小二乘法(Kernel Regularized Least Squares,KRLS)引入金融研究領域,并基于多種數據生成方式對KRLS的有效性進行全面檢驗。在此基礎上,使用KRLS方法對傳統定價模型進行修正,從多個維度考察我國開放式股票型基金的風險偏好特征。
本文的主要貢獻體現在以下幾個方面:研究內容上,一方面,我們從橫截面維度和時間維度兩個層面考察了不同類型基金的風險偏好特征,有助于認清我國開放式股票型基金的總體風險偏好和變化趨勢;另一方面,分析了基金投資風格與其真實風險偏好的關系,這對把握基金的真實風險狀況、完善證券投資基金監管具有重要的現實意義。研究方法上,將KRLS方法引入到金融研究領域,對傳統的定價模型進行修正,不僅考察了風險因子對超額收益的平均影響,還對投資基金逐點的風險偏好加以分析,這在一定程度上彌補了傳統模型的局限性。
二、文獻綜述
基金的投資風格是判斷其風險偏好以及風險投資行為的重要基礎。然而,大量的研究文獻表明許多因素會導致基金的投資風格和風險偏好發生改變,從而使基金發生投資風格漂移現象[3,4]。王敬和劉陽發現歷史業績對基金的投資風格持續性具有一定影響[5]。艾洪德和劉聰、肖繼輝和彭文平發現基金經理的教育經歷、從業經驗等個人特征與基金的投資風格漂移傾向顯著相關[6,7]。
除既定的投資風格外,基金行業錦標賽、基金經理職業憂慮等多種因素都會對基金的投資風險偏好產生影響。Brown等首次將錦標賽理論引入基金行業,指出前期業績較差的基金經理人傾向于在后期提高投資風險[8]。此后,這一理論得到眾多學術研究的支持[9,10]。羅真和張宗成認為基金經理的職業憂慮水平會對基金投資風險產生顯著影響[11]。劉莎莎等從委托代理問題等方面概況了基金經理調整投資風險的動機[12]。此外,金融市場環境同樣會對基金的投資風險產生影響[13]。
鑒于諸多因素會影響基金的投資風險偏好,國內外眾多學者圍繞基金的投資風格以及投資風險行為展開了廣泛研究。目前來看,識別基金的投資風格、考察基金風險偏好的方法眾多,其中多因素模型的應用最為廣泛。Fama和French通過市場資產組合、市值因子和賬面市值比因子對股票的超額收益進行解釋,該三因子模型在解釋金融資產的橫截面收益上得到了廣泛應用[14]。隨后,學者對三因子模型進行了拓展,如Carhart構建的加入動量因子的四因子模型、Fama和French提出的五因子模型等[15,16]。然而,現有的多因素模型通常基于線性假設考察金融資產超額收益與不同風險因子之間的關系,因而存在一定的局限性。
傳統的多因素模型不能捕捉風險偏好的時變性和不同風險因子之間的交互影響,為此許多學者對多因素模型進行了拓展研究。如Olmo和Pouliot基于變點檢驗考察了基金績效以及風險承擔的動態變化[17]。隨后,Bandi和Renò使用半參數擴散模型研究了金融變量之間復雜的非線性關系,但是,這一方法由于模型的局限性難以在資產定價中得到廣泛應用[18]。為了解決模型的設定難題,Rifkin等基于機器學習算法提出正則化最小二乘法,這一方法無需對模型形式進行事前假定,能夠兼顧模型的靈活性和簡潔性[19]。此后,Hainmueller和Hazlett將Gaussian核函數應用到正則化最小二乘法中,不僅有效解決了模型設定的難題,還對估計系數構造了相應的假設檢驗[20]。
綜上所述,諸多因素可能導致基金的風險偏好偏離既定的投資風格,為了確定不同類型基金的總體風險狀況,需要對基金的風險偏好特征進行多維度的考察。目前利用收益率研究基金風險偏好的文獻廣泛使用基于相關性的回歸方法,但這類方法依賴于模型形式的正確設定,模型設定的偏誤會影響估計結果的無偏性和有效性。而核正則化最小二乘法(KRLS)無需對模型形式進行事先假定,且可以同時考察基金的平均風險偏好和逐點的風險偏好特征,為考察多維數據的相依結構提供了靈活準確的處理方法。
因此,本文首先對KRLS方法的模型構建和參數選擇進行詳細闡述,并利用多種非線性相關關系的隨機樣本數據檢驗KRLS方法的樣本擬合效果和樣本外預測能力,以證明KRLS方法的有效性。在此基礎上,使用KRLS方法對傳統定價模型進行修正,進而從多個維度考察我國開放式股票型基金的風險偏好特征。endprint
三、研究設計
(一)樣本及數據
本文選取我國開放式股票型基金作為研究樣本,研究區間為2010年1月1日到2015年6月30日。根據各個基金公示的投資風格、投資策略和投資目標,將投資基金劃分為成長型、平衡型、價值型和指數型四類。最終得到的樣本包含161只成長型基金、34只平衡型基金、43只價值型基金、63只指數型基金。基金收益率為根據復權單位凈值計算的對數收益率,不同風格的基金指數收益根據各基金收益率等加權平均得到。此外,本文使用FamaFrench三因子模型中的市場風險因子(MKT)、規模風險因子(SMB)和價值風險因子(HML)考察基金的風險偏好特征。為了降低其他“噪聲”對基金收益率的干擾,基金收益率和風險因子均采用周頻數據。
財經理論與實踐(雙月刊)2017年第5期
2017年第5期(總第209期)白雪,牛鋒:中國開放式股票型基金的風險偏好特征——基于核正則化最小二乘法的分析
(二)基于KRLS的定價模型
KRLS模型通過一個對稱、正定的核函數(Kernel Function)衡量不同觀測點之間的相似程度,進而能夠對風險因子與超額收益之間的復雜相關關系進行擬合。假定(yi,xi)為一組樣本觀測數據,其中i=1,2,...,N,xi∈RD表示D維自變量,即風險因子,yi∈R為對應因變量,即基金超額收益。Gaussian核函數的形式如式(1)所示:
k(xi,xj)=exp(-‖xi-xj‖2σ2) (1)
其中,exp(·)為指數函數,‖xi-xj‖為自變量xi與xj的歐氏距離,σ2為Gaussian核函數的窗寬(Bandwidth)。
自變量觀測值之間的歐氏距離越小,Gaussian核函數的值越大,對應的樣本點之間的相似程度越高。對于任意給定的自變量x*,f(x*)的取值可以表示為各觀測值與x*相似程度的線性函數,如式(2)所示:
f(x*)=c1k(x*,x1)+c2k(x*,x2)+…+cNk(x*,xN)(2)
其中,ci為各觀測值對應的權重,k(x*,xi)為Gaussian核函數。可以看出,觀測值與x*越相似,對x*處因變量預測值的影響越大。使用類似方法,可以得到任意自變量x對應的f(x)預測值。這樣,我們可以基于“相似程度”將定價模型的方程形式f(x)表示為:
f(x)=∑Ni=1cik(x,xi)(3)
由式(3)可以看出,KRLS模型假定變量之間的相關信息蘊含在觀測值的“相似程度”中,風險因子的取值越為“相似”,對應的超額收益應當越為接近。為了書寫方便,將式(3)的定價函數由式(4)所示的矩陣形式表示:
y=k(x1,x1)k(x1,x2)…k(x1,xN)k(x2,x1)k(xN,x1)…k(xN,xN)c1c2cN=Kc (4)
(三)模型求解及參數設定
為了對樣本數據進行擬合,需要對不同觀測點的權重c進行估計。權重c的選擇應當滿足以下兩個條件:一方面,擬合方程應當使預測偏誤的平方和最小;另一方面,為了避免過度擬合,估計方程應當盡量平滑簡單。這里,在目標函數中加入正則項,通過式(5)所示的最小化問題得到最為合適的權重向量c*。
minf∈H ∑i(V(f(xi),yi)+λR(f))(5)
其中,V(f(xi),yi)為損失方程,表示擬合方程對于各觀測點的估計偏誤。R表示“正則化項”,用來對擬合方程的復雜程度施加懲罰。λ為模型參數,控制著模型求解中對于擬合偏誤和模型復雜程度的權衡。
與線性模型相似,式(5)中的損失方程V可以用∑i(f(xi)-yi)2=(y-Kc)T(y-Kc)衡量。此外,我們采用Tikhonov提出的正則化方法[21],使用‖f‖2K=∑i∑jcicjk(xi,xj)=cTKc作為模型復雜程度的“懲罰項”R(f)。式(5)所示的最優化問題可以表示為:
minc∈RD (y-Kc)T(y-Kc)+λcTKc (6)
c*=(K+λI)-1y (7)
給定核函數窗寬σ2以及正則化參數λ時,對(6)中目標方程的一階條件進行求解,能夠得到式(7)所示的權重c的最優解。這樣,通過y*=Kc*能夠得到任意自變量對應的因變量的條件期望。
為了得到式(7)所示的最優權重c*,需要對核函數窗寬σ2以及正則化參數λ進行設定。其中,核函數中的窗寬σ2控制著對“相似程度”進行判斷的尺度,合適的窗寬應當能夠對樣本點是否相似進行有效界定。我們使用Hainmueller和Hazlett的方法[20]選擇合適的窗寬。正則化參數λ控制著模型求解中對于擬合偏誤和模型復雜程度的權衡,借鑒Hastie等的研究,根據“留一誤差”(LeaveOneOut Errors)方法選擇合適的λ[22]。
(四)基金的風險特征分析
根據y*=Kc*能夠得到給定風險因子數值條件下基金超額收益的條件期望,為了分析基金的風險偏好,根據式(3)計算單個自變量對應的偏導數,考察各風險因子對基金超額收益的邊際影響。假定自變量X=(x1,…xd,…xD),自變量在風險因子xdj處對應的逐點偏導數可以表示為:
yxdj=-2σ2∑iciexp-‖xi-xj‖2σ2(xdi-xdj)(8)
分別計算逐點偏導數在各個樣本點處的取值,可以得到風險因子xd對超額收益y的平均邊際影響,如式(9)所示:
ENyxdj=-2σ2N∑j∑iciexp-‖xi-xj‖2σ2(xdi-xdj)(9)
式(9)所示的樣本平均偏導數含義與FamaFrench三因子模型中的類似,表示其他自變量不變時,某一風險因子變動一單位對超額收益的平均影響。endprint
四、模擬結果
(一)KRLS的擬合效果
為了對KRLS的樣本擬合效果進行直觀分析,我們基于四種常見的非線性相依關系(F1,F2,F3和F4)生成樣本數據,分別模擬指數型、結構突變型、三角函數型以及跳躍型相依關系;在此基礎上,分別使用OLS模型、廣義線性模型以及KRLS方法對模擬數據進行擬合。圖1為三種模型的樣本擬合效果。
可以看出,由于數據的真實相依結構不滿足線性假定,傳統的OLS方法難以捕捉自變量和因變量之間真實的相關關系。在F1和F2兩種數據生成過程下,GLM能夠在一定程度上刻畫因變量的非線性變化趨勢。但是由于受到模型形式限制,廣義線性模型對變量的非線性變化不夠敏感。而KRLS方法由于不需要對模型形式進行事先假定,能夠更加準確地捕捉變量的非線性變動,當變量間的非線性關系較為復雜時,這一優勢表現更為明顯。
圖1-1、1-2、1-3、1-4分別對應四種數據生成過程,F1:y1=exp(5*(x-0.25)2)+05*exp(x-05)+ξ;F2:y2=1+2*int(x/025)*x+ξ;F3:y3=02*sin12πx+05*cos3πx+ξ;F4:y3= 1+2*I(03 表1報告了不同數據生成方式下三種模型的均方誤差(MSE)和擬合優度(R2)。可以看出,三種模型中,OLS模型對四種非線性樣本擬合的均方誤差(MSE)均明顯較高;即便在加入自變量的高階項之后,GLM對應的均方誤差仍高于KRLS。這一結果表明,核正則化最小二乘法對樣本數據的擬合效果最佳。根據擬合優度系數能夠得到相似的結論,KRLS方法對四種類型數據的擬合優度系數均最高。 注:樣本量N=100。 (二)樣本外檢驗 為了提高模型的預測能力,KRLS在目標函數中加入正則項對模型的“復雜程度”施加懲罰,從而保證擬合曲線的平滑性。我們利用四種數據生成方式得到模擬樣本,取其中50%的樣本觀測值估計模型,使用估計模型對剩余50%的樣本點進行預測,從而得到樣本外預測的均方誤差(MSE)和擬合優度(R2)。表2報告了樣本量分別為100、200和500時三種模型的樣本外預測結果。 可以看出,在不同的樣本容量下,使用OLS模型得到的樣本外MSE均較高,相應的樣本外R2也低于另外兩類模型。對于GLM和KRLS模型,當樣本容量較小(N=100)時,廣義線性模型在四種數據生成方式下的樣本外MSE均大于KRLS模型;根據樣本外R2得到的結論基本一致,四種數據生成方式下KRLS模型的樣本外預測R2均大于GLM模型。隨著數據生成樣本的不斷增大,這一結論始終成立,說明核正則化最小二乘法具有較強的樣本外預測能力。 五、實證分析 (一)描述性統計 表3中四種基金指數收益率的描述性統計結果顯示,我國四種風格的基金指數收益均為正,說明研究區間內基金凈值總體呈上升趨勢。其中,指數型基金平均收益最低,但波動幅度卻最大。其他三類基金中,價值型基金的平均收益較高,成長型基金的平均收益最小;從標準差以及極端分位點信息可以看出,價值型基金的波動幅度較高,成長型基金次之,而平衡型基金的波動最小。此外,相應的JB檢驗顯示,成長型、平衡型和價值型基金指數收益接近服從正態分布,而指數型基金指數收益率分布存在明顯的“尖峰厚尾”特征。 注:表中收益率的單位為%;Q_10%和Q_90%分別表示收益率的10%和90%分位點;*、**和***分別表示在10%、5%和1%的水平下顯著。 (二)基金的平均風險偏好 Fama和French提出的三因子模型將單個資產的超額收益表示為市場風險因子(MKT)、規模因子(SMB)和價值因子(HML)的線性形式[14]。由于超額收益與風險因子之間的關系可能是非線性的,并且具有復雜的交叉效應,因此我們使用KRLS模型對基金指數超額收益與風險因子之間的關系Rit=f(MKTt,SMBt,HMLt)進行擬合,進而反推各風險因子對超額收益的邊際影響。 表4為相應的實證結果。可以看出,四種風格基金對應的R2均超過94%,說明FamaFrench三因子能夠對四種風格基金的超額收益進行很好的解釋。從不同風險因子來看,四類基金的市場風險因子(MKT)系數均較高,并且在1%的水平下顯著,說明各類基金均具有顯著的市場風險。其中,指數型基金的市場風險最高,價值型和成長型基金的市場風險較為接近,而平衡型基金的市場風險相對略低。 規模因子(SMB)方面,表4中四類基金SMB的系數均為負,說明我國開放式基金偏好投資市值較大的股票。其中,指數型基金的規模因子系數絕對值最大,與我國開放式指數基金主要跟蹤大盤股指數有關;與指數型基金相比,其他三類基金指數的SMB系數絕對值較小,說明其他主動型基金為了追求高于市場組合的收益,會適當增加小市值股票的投資比例。 價值因子(HML)方面,指數型基金的系數為正,說明我國指數型基金主要投資具有較高賬面市值比的股票;成長型基金的HML系數為負,說明其偏向投資具有較低賬面市值比的股票,與投資公告中宣稱的投資風格相符;值得注意的是,價值型基金在投資公告中宣稱偏重于高賬面市值比的股票,但是其對應的HML系數平均為負,說明我國價值型基金依然偏好投資“成長型”股票,出現投資風格漂移現象。 注:*、**、***分別表示在10%、5%和1%的水平下顯著,括號內的值為使用KRLS方法得到的t統計量。 (三)逐點的風險偏好特征
由于許多市場因素可能引起基金管理者的風險偏好發生改變,并且各風險因子與基金超額收益之間可能存在復雜的非線性關系,因此,分析各風險因子逐點的邊際效應有助于全面了解基金的風險偏好特征。
圖2為四種基金對應的風險因子逐點的邊際效應及其變化趨勢。可以看出,圖2中規模因子(SMB)取值為正的情形較為多見,說明研究區間內我國股票市場存在一定的規模溢價現象。而價值因子(HML)取值為負的觀測值過半,說明我國股票市場的價值效應并不明顯。值得注意的是,我國成長型、平衡型和價值型基金均呈現出明顯的風險調整行為,并且風險溢價的變化特征較為相似,而指數型基金的風險偏好相對穩定。除個別極端點外,指數型基金的MKT系數均接近于1,且其規模因子和價值因子系數也相對穩定。其中,我國指數型基金的SMB系數一般為負,而HML系數一般為正,說明指數型基金主要投資于“大盤股”以及具有高賬面市值比的“價值型”股票。
其他三類基金指數的MKT系數均呈現先升后降的態勢。說明在市場收益適中時,開放式基金傾向于持有具有較高市場風險的投資組合,而當市場組合收益較高或較低時,基金經理人會通過調整投資策略降低投資組合的市場風險。規模因子(SMB)方面,三類基金指數的SMB系數均呈現上升趨勢,說明當規模溢價較低時,各類基金通常會持有較高比例的高市值股票,而隨著規模溢價的增長,投資基金傾向于增加小市值股票的比例。此外,三類主動型基金的價值因子(HML)系數一般為負并且呈“V”形變化趨勢,說明我國主動型基金通常偏好投資具有低賬面市值比的股票,并且當HML在2%左右時成長型股票的投資比例最高。
注:圖中橫軸分別為市場因子(MKT)、規模因子(SMB)和價值因子(HML)的取值,縱軸為三類風險因子對應的邊際效應,實線為通過局部加權回歸散點平滑法(Locally Weighted Scatter Plot Smoothing,LOWESS)得到的邊際效應變化趨勢。
六、結論與啟示
本文詳細介紹了KRLS方法的模型構建和參數選擇過程,并通過檢驗樣本擬合效果和樣本外預測能力證明了該方法的有效性;更重要的是,使用KRLS方法對傳統定價模型進行修正,更加準確地考察了我國開放式股票型基金的風險偏好特征。研究結果表明:(1)KRLS方法的樣本擬合效果和樣本外預測能力均顯著優于廣義線性模型,這一優勢在復雜非線性樣本中表現更為突出。(2)從平均風險偏好來看,研究區間內我國指數型基金偏好于投資“大盤股”和“價值型”股票,而三類主動型基金偏好于投資“成長型”股票,其對“大盤股”的偏好明顯弱于指數型基金。(3)我國開放式股票型基金中,指數型、成長型和平衡型基金的風險偏好基本與其投資公告中宣稱的投資風格相符,但價值型基金存在明顯的投資風格漂移現象。(4)我國三類主動型基金表現出明顯的風險調整行為,并且風險偏好的變化特征相似,而指數型基金的風險偏好較為穩定。
本文的研究結論可以為我們帶來如下啟示:第一,與傳統定價模型相比,核正則化最小二乘法(KRLS)更具有效性,該方法為研究金融資產風險溢價等問題提供了有效工具。第二,我國部分類型的基金與其公告的投資風格存在偏離現象,因此,投資者不應只關注基金公告的內容,而應綜合考慮市場環境因素的變化,選擇正確的投資策略。第三,隨著風險因子的改變,我國三類主動型基金的風險偏好呈現明顯變化,監管機構應當密切關注投資基金的風格演變特征。第四,我國三類主動型基金的投資偏好以及風險調整行為表現出趨同性。這不僅不利于滿足投資者多元化的風險管理需求,還無益于金融市場的系統風險控制,因此,相關監管部門應當完善基金的信息披露制度,促進基金業的規范發展。
參考文獻:
[1] King G,Zeng L.The dangers of extreme counterfactuals [J].Political Analysis,2006,14(2):131-159.
[2] Brambor T,Clark W,Golder M.Understanding interaction models:improving empirical analyses [J].Political Analysis,2006,14(1):63-82.
[3] Kim M,Shukla R,Tomas M.Mutual fund objective misclassification [J].Journal of Economics and Business,2000,52(4):309-323.
[4] 曾曉潔,黃嵩,儲國強.基金投資風格與基金分類的實證研究[J].金融研究,2004(3):66-78.
[5] 王敬,劉陽.證券投資基金投資風格:保持還是改變?[J].金融研究,2007(8):120-130.
[6] 艾洪德,劉聰.基金經理個人特征與基金投資風格[J].財貿經濟,2008(12):26-31.
[7] 肖繼輝,彭文平.基金經理特征與投資能力、投資風格的關系[J].管理評論,2012(7):40-48.
[8] Brown K,Harlow W,Starks L.Of tournaments and temptations:an analysis of management incentives in the mutual fund industry [J].The Journal of Finance,1996,51(1):85-110.
[9] Taylor J.Risktaking behavior in mutual fund tournaments [J].Journal of Economic Behavior and Organization,2003,50(3):373-383.endprint
[10] 肖繼輝.基金行業錦標賽及其激勵效應研究——來自開放式基金的經驗證據[J].南開管理評論,2012(5):44-55.
[11] 羅真,張宗成.職業憂慮影響基金經理投資行為的經驗分析[J].世界經濟,2004(4):63-71.
[12] 劉莎莎,劉玉珍,唐涯.信息優勢、風險調整與基金業績[J].管理世界,2013(8):67-76.
[13] 肖繼輝,彭文平.錦標賽制度與基金風險調整:理論拓展與經驗證據[J].管理科學學報,2015(1):87-98.
[14] Fama E,French K.Common risk factors in the returns on stocks and bonds [J].Journal of Financial Economics,1993,33(1):3-56.
[15] Carhart M.On persistence in mutual fund performance [J].Journal of Finance,1997,52(1):57-82.
[16] Fama E,French K.A fivefactor asset pricing model [J].Journal of Financial Economics,2015,116(1):1-22.
[17] Olmo J,Pouliot W.Tests to disentangle breaks in intercept from slope in linear regression models with application to management performance in the mutual fund industry [R].Department of Economics,University of Birmingham,2014.
[18] Bandi F,Renò R.Timevarying leverage effects [J].Journal of Econometrics,2012,169(1):94-113.
[19] Rifkin R,Yeo G,Poggio T.Regularized leastsquares classification [J].Nato Science Series Sub Series III Computer and Systems Sciences,2003,190:131-154.
[20] Hainmueller J,Hazlett C.Kernel regularized least squares:reducing misspecification bias with a flexible and interpretable machine learning approach [J].Political Analysis,2014,22(2):143-168.
[21] Tikhonov A N.Solution of incorrectly formulated problems and the regularization method [C].Soviet Math.Dokl.,1963,5:1035-1038.
[22] Hastie T,Tibshirani R,Friedman J.The elements of statistical learning:data mining,inference,and prediction [M].New York:Springer,2009.
(責任編輯:王鐵軍)endprint