程建華 孫 陽
(安徽大學,安徽 合肥 230601)
1998年3月,我國首兩只基金基金開元、金泰成立,截至2018年1月底,我國122家基金公司共發行基金產品3347只,其中證券投資基金占90%,成為基金市場的主力軍。
證券投資基金作為一種共同投資產品,具有專家經營、分散風險的優點,日益受到投資者的青睞。短短20年間,基金從無到有,數量迅速增加,種類愈發豐富,但同時也給投資者的選擇帶來困擾。如何在信息有限的情況下,依據其收益狀況且能準確判斷基金的風險水平,選擇與自身投資偏好相適應的基金,是投資者面臨的一大考驗。
基金業績評價方法中應用最多的是傳統的指數評價法,如 Sharpe、Jensen指數等單因素評價模型及其改進方法。上述模型雖已比較成熟,但存在兩點爭議:一是市場有效性的前提假設是否可靠;二是如何準確定位市場基準組合。而DEA(Data Envelopment Analysis)是用以評價地區或部門投入產出績效的一種方法,該方法是以樣本自身來構建一個相對有效評價體系,無需事先確定市場基準組合,彌補了傳統模型存在的不足。鑒于此,本文擬同時采用DEA法與傳統評價模型進行實證分析,將結果進行綜合比較,為我國基金投資者的選擇提供參考。
基金業績評估研究始于國外學者,經歷了半個世紀仍在不斷發展中。1952年,Markowitz建立了現代資產組合理論,開啟了資產組合研究的先河[1]。他的學生Sharpe(1964)等隨即在此基礎上提出了資本資產定價模型CAPM,單因素風險調整收益指標開始出現,隨后基金業績評估的研究迎來了一次春天[2]。
20世紀60年代中期,三大經典風險調整收益衡量方法陸續被提出。利用CAPM模型中明確定義的貝塔系數,Treynor(1965)提出用單位系統風險的超額收益來評價基金業績[3]。隨后Sharpe[4](1966)和Jensen[5](1968)基于不同角度分別提出新的單因素指數。這三個經典指數有一個共同判別標準:指數值越大,基金表現越好。但它們僅僅是以數值的形式給出了評估結果,只考慮收益和風險因素,很難對結果進行經濟意義的解釋。
在不斷地探索中,學者們試圖在單因素模型的基礎上增加其它指標以對評估結果提供合理的解釋,為此,Treynor and Mazuy(1966)在 CAPM 模型中加入二次項,構建了T-M模型以度量基金經理的選股擇時能力[6]。在此基礎上,Henriksson and Merton(1981)對T-M模型的假設條件進行簡化,提出帶虛擬變量項的H-M模型[7]。
當上述方法被廣泛應用時,也受到了Roll等人的質疑,質疑的焦點有二,即CAPM模型的有效性與投資基準組合的選擇問題。Roll(1977)認為,應用CAPM模型需要確立一個基準組合,這就意味著組合的選取上存在著人為主觀因素,基準選取不同,基金業績的排序也就可能不同[8]。 Grinblatt and Titman(1989)進一步指出,CAPM模型可能并不是一個正確的定價模型,影響證券收益和風險的因素是多方面的,而CAPM只考慮市場這一因素,無法解釋市場上的一些異常現象[9]。
針對CAPM有效性的問題,有學者提出用多因素模型代替傳統的單因素模型,比如Fama and French[10](1992)建立的三因素模型與 Carhart[11](1997)建立的四因素模型。多因素模型固然增強了解釋性,但依然基于CAPM的理論基礎,因素的選擇有較強的主觀性,且操作的難度大大增加。因此,這類多因素模型在實際基金業績評估中的運用很少,諸多基金評級網站依然沿用單因素指數作為主流評價指標。而對于市場基準組合的選擇問題,至今仍無定論。
同樣的,也有學者將焦點放在解決基準選取帶來的問題上,試圖找出一種合理的無基準度量方法。有學者指出數據包絡分析法(DEA)可以彌補這個缺陷,它由Charnes等(1978)提出,是使用數學規劃模型評價具有多個輸入和多個輸出單元的決策單元間相對有效性的一種非參數方法,稱為CCR模型[12]。Murthi等(1997)首次將DEA應用到基金業績評價,得出交易成本對基金的業績沒有顯著影響[13]。Choi and Murthi(2001)繼續對問題進行研究,發現大部分基金的收益都表現出遞增的規模效應[14]。Basso and Funari(2001)則對DEA模型的可靠性和適用性提出質疑,對以前的DEA模型進行擴展,提出了一個多投入多產出的綜合DEA模型[15]。但以上學者將DEA法與傳統評價方法割裂開來,過多地把注意力集中于無基準的修正上,利用DEA的效率得分進行排序,實質上與傳統評價方法利用指數排序殊途同歸,并未證明出DEA法的結果比之傳統評價方法得出的結論的優越性在哪。
我國基金業績研究起步晚,大多在國外研究的理論基礎上進行實證研究。我國學者起初沿用單因素指數進行評價,比如徐涵江(2000)分別采用三大指數對10只基金進行排名并測度其名次相關性大小,發現三者相關性較高[16]。王聰(2001)則認為這三大指數適用性不同,并指出Jensen指數用來衡量基金實際收益率最好,另兩種指數對基金績效的評估更具客觀性[17]。吳啟芳、汪壽陽(2003)則對傳統評價方法持保留態度,他們認為傳統三大單因素評價指標基本可以評價歷史數據,但對未來收益解釋能力不強,不宜用做趨勢分析[18]。郭放(2010)試圖考察傳統評價方法對我國整個基金市場的效用,利用H-M模型,他發現中國市場大部分基金表現優于市場基準表現,基金經理表現出較強的選股能力[19]。
隨著DEA法進入人們的視線,我國學者嘗試從全新的角度去看待基金績效。比如羅紅浪等(2003)引入多輸出單產出DEA模型進行業績評價,得出單位交易成本和基金收益率是影響基金相對業績的主要因素[20]。趙秀娟、汪壽陽(2007)比較分析78只基金的相對業績發現,多數基金處于無效狀態,基金業績不存在明顯的業績持續性,但投資風格和業績之間具有一定的相關性[21]。徐美萍、張波(2009)承襲了上述研究證明的多數基金處于無效狀態的論斷,分析了39只基金的技術有效性與規模有效性,給出了無效仿效的標桿[22]。當然,究竟傳統評價方法與DEA法哪一種更佳也是學者關心的話題,趙子瑤(2016)采用Sharpe和DEA法分別計算排名,結果表明不同的評價體系對基金業績的評價結果并不相同,但卻沒法說明哪一種方法效果更好[23]。
本文在對上述文獻進行歸納時發現,國內外學者對DEA的研究有一個共同的弊端,他們將DEA法與傳統評價方法放在對立的角度,過多地強調經過無基準調整的DEA模型更具合理性,利用DEA的效率得分對基金進行排名并給出結論。實際上,這與傳統評價方法通過指數排序不謀而合,且CAPM模型并未被證明出是錯誤的,傳統評價方法仍有其可信度。本文認為,應將這兩種從不同角度出發的方法綜合而不是割裂,對比而不是對立,優勢互補。鑒于此,本文嘗試利用DEA法無基準、無有效性假設的優勢,綜合傳統方法模型成熟、表達直觀的特點,對基金業績作出合理準確的評價,并對結果的可靠性與適用性進行驗證。
本文評價的基本思想是先利用DEA法對樣本基金進行評價,根據得出的綜合效率值對基金進行排名;再分別對樣本基金和樣本期進行處理,將基金按類型和規模進行分類,求出各類的平均效率值進行對比分析;同時將樣本期分為前3個月、前半年期、一年期進行測度,以觀察其短期業績表現。最后,本文將DEA分析結果與傳統評價指數進行比較,給出綜合分析結果結論。
模型上選取DEA的BCC模型,以及主流評級網站常用的Sharpe和Jensen模型。
BCC模型用線性規劃的方法來衡量多元投入與產出項的效率,假設有n只基金,每只基金都有m種輸入指標和s種輸出指標。設Xj和Yj分別是第j只基金的輸入和輸出向量[24]:

模型一(BCC):

其中,S+、S-分別對應剩余、松弛變量,θ是基金的相對有效水平,該模型可理解成一個生產前沿面,利用非有效DMU(決策單元)在相對有效前沿上的“投影”,可觀測到其非有效的原因和程度,從而提供改進方案,這是該模型的一大優點[25]。
模型二(Sharpe):
E(Rp)為基金在樣本期的平均收益率,Rf是無風險收益率,σ是基金的總風險,即標準差,Sharpe指數越大,基金的表現越好[26]。
模型三(Jensen):

Rp表實際收益率,Rm是市場基準組合的收益率,βp表系統性風險,αp即為詹森指數,表示基金的實際收益率高于其預期收益率的絕對值大小,αp越大,基金的業績越好[27]。
為避免新基金經營時期較短對實驗的影響,本文選取2013年前成立的24只具有代表性的基金的周收益數據,樣本期為2017年1月至2018年1月,數據來源于CSMAR(國泰安金融數據庫)和天天基金網。

從投資者的角度,最關心的是基金實際收益率,期末單位凈值和累計凈值增長率這兩個指標能較好地度量收益情況,本文將它們作為DEA模型的輸出變量。相應的,輸入變量應選取最能影響收益率的指標,其中,費用對于基金回報率的影響十分顯著,而基金承擔的風險也與收益率緊密相關。因此本文選擇單位運營成本和基金總風險的標準差作為輸入變量。用于比較的Sharpe、Jensen指數,分別從總風險和系統風險上度量業績,與考慮總風險的DEA法構成對照。
為對實驗進行全面分析,文中將24只基金分為股票型、混合型和債券型,各8只;同時還按規模大小將其分為三類,各8只。多數文獻選取2-3年甚至更久來評價基金業績,但Dorms and Walke[28](2001)的研究表明短期的業績表現更能反映基金的收益情況,故本文只選取一年期作為考察期,并將這一年分為三個評估階段,分別為:前三個月、半年期和一年期,以此對基金的短期業績表現進行考察,為投資者提供參考。
此外,DEA模型要求各指標不能為負,但原始數據存在負數,故先采用功效系數法對原數據進行處理,公式為:
同時,DEA模型要求輸入、輸出變量各自不存在顯著相關性,我們用Pearson法分別測度投入、產出指標的相關性,得出輸入、輸出變量相關系數分別為0.34和0.42,均小于0.5,滿足DEA前提條件。
本文采用DEAP2.1軟件進行DEA分析,數據經過正數處理且指標間相關性較弱,可直接用BCC模型進行運算,結果如表1所示。
表1中的綜合效率=技術效率*規模效率。綜合效率為1時,樣本基金處于相對有效狀態;若不為1,則沒有達到有效。
從表1可以看出,參與評價的24只基金中,共有5只是相對有效的(華夏大盤、嘉實增強等),表明其處于有效生產前沿面。有10只基金的綜合效率低于40%,長城久恒的效率最低只有11.2%。總體上看,綜合效率表現較好的基金僅占33%,大多數基金處于規模報酬遞減階段,只有少數幾只基金規模報酬遞增,初步推測市場上大多數基金處于相對無效狀態,側面反映了傳統評價方法有效性假設所存在的理論不足問題。同樣的步驟,本文根據DEA得出的綜合效率整理出3個月、半年期和一年期的排名情況并進行對比,如表2所示:


表1 2017年一年期基金業績DEA分析效率值

表2 2017年3個階段排名對比情況
由表2可看出,華夏大盤、嘉實增強、南方中債和易方達在2017年的表現都非常好,其中華夏大盤與南方中債的效率在三個度量時期都表現為相對有效,穩居第一;嘉實增強和易方達則表現出較強的短期持續性,其相對效率一直保持在一個較高的水準。相對來說,華夏復興、國聯安等5只基金的表現不盡如人意,始終在一個較低的效率水平上下波動。整體上看,各基金的排名情況反映出了一定的短期持續性。
對基金業績與測度時期的關系有了基本的了解后,再看基金類型是否會顯著影響基金的業績表現,如圖1所示:

圖1 按基金類型分類比較
不難看出,三個測度期內,半年期的基金效率表現最佳,三類基金效率水平均高于50%。橫向比較上,三個測度期都呈現出遞增的階梯型。股票型基金的業績表現相對較差,可能原因是股票型基金承擔了較高的系統風險,從而給其收益率帶來了嚴重影響。債券型基金平均業績表現最好,這可能與我國的市場因素相關,投資者普遍認為債券型基金的風險更低,容易獲得超額收益。再看混合型基金,其平均效率始終保持在一個穩定的水平,波動幅度很小,反映出我國基金市場中混合型基金切實將其分配初衷付諸實際。
既然不同類型的基金的業績表現差異顯著,那么基金規模大小是否會帶來同樣的效果呢?其表現如圖2所示:

圖2 按規模大小分類比較
對比圖1,按規模大小分類進行比較,差異更為顯著。從圖2中可直觀地看出,無論在哪個測度期,中等規模的平均業績表現都最佳,保持在80%左右的水準。反觀另兩類,其相對效率表現在60%左右波動,不宜作為投資者的第一選擇。對小規模基金來說,其技術效率難以達到有效狀態;而對大規模基金而言,已有研究表明,一只規模大的基金在進行交易時,會對資產的價格造成影響,從而侵蝕其業績[29]。
從上述對比中不難看出,一只基金業績的優劣與否,受很多因素影響,很難全面地去給基金業績作出一個最準確的評價,因此本文從比較分析的角度出發,試圖綜合傳統基金業績評價方法的優點,給出更具可靠性的參考意見。
根據模型2、3,我們分別計算出各基金的Sharpe指數和Jensen指數,如表3所示:

表3 2017年一年期Sharpe和Jensen指數
不難發現,無論是Sharpe還是Jensen模型,都有9只基金表現出負值,說明這9只基金的業績表現不佳,低于市場基準組合利率水平0.061。且兩種指數表現出了同步性,即Sharpe指數度量為負,Jensen指數也基本為負。任意選出幾只業績不好的基金與表3中DEA法給出的排名相對比,如華夏復興和中海債券,其效率排名分別為第19、17名;再看華夏大盤、嘉實增強這類兩種指數都表現較好的基金,其DEA效率值達到了1,即相對有效水平,初步印證了根據DEA得出的排序具有較強的可信度。
為了更直觀地給出DEA模型與傳統模型的對比,利用DEA效率值和這兩種指數值繪制折線圖,結果如圖3所示:

圖3 DEA與傳統分析指數對比
整體上看,圖中展現的趨勢近似相同,傳統指數的測度值較高時,DEA的效率水平也較高,傳統指數表現不佳時,綜合效率也相應有所下降。但也有異常現象發生,如第12只基金南方中債,其Sharpe、Jensen指數均表現較差,但其效率測度卻出現一個小高峰,此時,根據傳統評價方法很難給出一個合理的解釋,而從DEA來看,南方中債作為一個有效生產前沿面,其規模效率和技術效率表現都較好,但其凈資產規模自2017年3月的2.15億元銳減至0.62億元,這直接導致投資者的動搖情緒,從而影響其業績評價。從波動幅度看,Sharpe指數和DEA效率波動明顯更為劇烈,因為這兩個指標都考慮了總風險,而Jensen指數是基于系統性風險計算得到,其波動較為平緩。圖3反映的結果進一步驗證了DEA法測度基金業績的可信度。
據此,本文進一步展示三者排名的對比情況,如表4所示:

表4 DEA、Sharpe和Jensen排名比較
由表4,這三種方法對24只基金的評價結果并不相同,比如南方中債的DEA排名為1,而Sharpe和Jensen排名卻低至24、20名。但這并不能說明DEA不適合用于基金業績評價,因為DEA法與傳統評價方法的出發點不同,得出不同的結果是正常的。從另一角度來看,Sharpe和Jensen指數同時表現不好的基金,其DEA效率值90%表現不好,如華夏復興、長城久恒等;而這兩個指數表現都非常好的基金,其DEA排名一定處于靠前的位置,如華夏大盤、博時富裕等。分別取表現較好與較差的基金各6只,跟蹤其2018年1月-2月的表現,如表5所示:

表5 2018年1-2月12只基金收益情況及屬性
由表5明顯看出,表現較好的6只基金,測度期內平均收益率都為正值,其中業績最優的3只基金為混合型,收益率都處于較高的水平,且有兩只是中等規模。而對表現不佳的基金來說,其收益率有的小于0,有的則處于較低的水準,債券型最多,中等規模最少。結合圖1、2來看,表5直觀地反映出中等規模的基金業績最好,與之前對圖2的判斷相一致;從類型上看,表現最好的多為混合型,而圖1得出的結論是債券型的平均表現最好,據此判斷,整體上債券型基金的平均表現略占優勢,但部分混合型基金具有更優異的表現。
綜上,本文認為對DEA與Sharpe和Jensen評價結果進行綜合比較,可以優勢互補,不僅能給投資者提供更充分的信息,同時也有助于研究者發現一些關鍵的問題并進行深層次的挖掘。
據上述實證結果顯示,DEA法排名結果與Sharpe和Jensen排名結果有一定程度的差異,這種現象是合理的。參與評價的24只基金中,全年看只有5只基金是有效的,不足30%。據此,初步推斷我國基金市場中多數基金可能處于無效狀態。
從時間維度看,華夏大盤、嘉實增強等的短期持續性較好,相對效率一直維持在一個較高的水平;而華夏復興、融通藍籌等則表現出較強的負向的持續性。初步推測我國基金業績具有一定的短期持續性。對基金的分類比較發現,債券型基金的綜合效率最高,平均高達70%,混合型次之,股票型最低,但排名靠前的基金中,混合型占據了大多數。另外,從規模上看,DEA效率的差異性更顯著,中等規模表現最佳,大部分基金處于規模報酬遞減階段。
綜合來看,DEA法彌補了傳統基金評價方法的不足,從樣本基金自身出發構建一個有效生產前沿面。在指數反映上,三種方法對24只基金的測度值走勢基本一致,但在波動性上有所差異。從排名上看,DEA法可以很好地與傳統方法相結合,篩選出表現良好的和表現較差的基金。因此,本文認為利用DEA法消除對于基準組合選取的爭議,從不同角度對基金業績展開評價,有助于給投資者提供更加合理可靠的建議。