趙留彥 寧 可
(1.北京大學經濟學院 北京 100871)
(2.中國人民銀行營業管理部 北京 100045)
證券分析師通過對上市公司進行投資評級和盈利預測等方式向投資者提供投資信息。作為信息中介,分析師的研究報告是股票市場投資者——尤其是中小投資者——進行決策的重要依據。因此,分析師是否具備增加信息供給、引導價值投資的專業能力,一直是投資業界和學術界關注的重要話題。大量文獻表明,分析師可以在一定程度上影響投資者行為,并改善中小投資者保護和資本市場效率。例如,針對成熟市場的實證研究很早便發現根據證券分析師的建議進行投資可以獲得超額收益(例如,Davies和Canes,1978;Womack,1996;Asquith等,2005)。國內的相關實證研究也得到同樣結論,例如王征等(2006),王偉峰和何鎮福(2012),朱衛東等(2016)。
具備公信力的分析師評選結果有助于提高投資者甄別分析師的專業能力,如歐美市場上的“Institutional Investor All Americans”評選和中國市場上的“新財富最佳分析師”評選。評選中獲獎的個人或團隊(即明星分析師或明星券商)會收獲極高聲譽。有研究表明,明星分析師的確具備更高的研究價值。例如,Stickel(1992)發現,相比一般分析師,明星分析師的盈利預測更為準確,而且其上調盈利預測以后股價的積極反應更明顯。Fang和Yasuda(2014)發現明星分析師“強烈推薦”的組合能夠獲得更高的超額收益,并且超額收益是源于明星分析師的優秀技能,而非市場對明星分析師的過度反應。李麗青(2012)和王春峰等(2015)根據中國樣本也有類似發現。對于分析師個人而言,具有行業公信力的分析師評選結果直接決定了他們在行業內的聲譽,而良好的聲譽意味著高薪和廣闊的職業發展前景(Bruce,2002;Hong和Kubik,2003)。因此,分析師普遍會積極維護和提高聲譽。他們會勤勉工作以提供準確的預測和評級,而不是故意扭曲預測結果以迎合投行業務客戶(Hansen和Sarin,1998)。由于數據可得性問題,以往文獻一般采用盈利預測頻率作為分析師努力程度的度量指標。這一做法始于Jacob等(1999),他發現分析師預測頻率與預測準確度正相關。①樊錚和宋樂(2010)使用中國數據也得到了類似結論。伊志宏等(2015)認為努力程度是影響分析師挖掘公司信息的重要原因。尹玉剛(2014)發現預測頻率越高的分析師在發布“買入”評級后的累計超額收益率也越高。
自2003年開始,一年一度的新財富最佳分析師評選(以下簡稱“新財富評選”或“評選”)一直是我國證券分析師行業最重要的聲譽激勵機制。獲得“新財富最佳分析師”稱號(俗稱上榜“新財富”)既帶來了榮譽又帶來了巨大物質激勵。因為絕大多數分析師的薪酬與評選結果直接掛鉤,并且“新財富”上榜與否可以導致成倍的差距。長期以來新財富評選活動對A股市場的投資和研究體系產生了深遠影響。它推動了市場對證券研究的重視以及各個券商對證券研究的大力投入。不過它也助長了評選過程中花樣迭出的“拉票”不正之風。正是由于某些券商拉票所產生的負面輿論影響,活動的主辦方《新財富》雜志社于2018年9月21日忽然宣布停止該項評選活動。②從時點上看,評選取消的導火線是2018年9月18日開始在媒體上流傳的某券商研究員拉票時的不雅飯局視頻。由于針對該事件的負面輿論持續發酵,9月21日三十家券商宣布集體退出“2018年度新財富最佳分析師評選”,中國證券業協會則在其官網上發布了標題為“中國證券業協會支持證券公司退出有關分析師評選活動”的公告。幾個小時后,《新財富》雜志官方微博宣布:“鑒于突發原因,新財富決定暫停2018年度新財富最佳分析師評選投票。”此后直至本文完稿時該評選未再啟動。關于評選取消事件的詳細報道請見“炮制財富人生:賣方分析師的人生五幕戲”,《中國經營報》2018年10月21日。那么,分析師的勤勉程度及研究質量是否隨著新財富評選的開展或停止而改變?該評選驟然中止事件提供了研究聲譽激勵與證券分析師行為的良好契機。為此,我們收集了2010年至2019年間A股證券分析師的35 756條調研行為數據以及34 552條證券評級調整數據,通過該評選取消前后分析師行為和研報質量的變化,考察了聲譽激勵機制對分析師的影響。我們發現,分析師所做的投資評級調整總體上具有良好的投資參考價值;相比一般分析師而言,上榜“新財富”的明星分析師所做的評級上調可以進一步獲得超額收益。但評選取消后分析師的薦股能力顯著下降,工作勤勉程度也有一定程度下降。
本文的貢獻在于兩方面。首先,在選題方面,我們首次采用大樣本定量研究了新財富評選的效應。作為我國證券分析市場上最重要的分析師聲譽評價機制,新財富評選在過去很長時間內受到了投資界的高度重視,然而學術界對其研究相對不足,有限的文獻一般是使用評選初期的數據,并且關于評選效果也存在較大爭議。③使用新財富評選最初十年(2003—2012)的數據,吳偎立等(2016)認為新財富評選結果與分析師的研究質量無關,因而評選是無效的;肖萌(2015)則認為“新財富”明星分析師評級調低會帶來負的異常收益。為此我們收集了最近十年間(2010—2019)所有分析師的評級調整數據,并以新財富評選終止作為“準自然實驗”,研究了評選的聲譽激勵效應。①應該說明的是,從這一角度切入研究聲譽機制仍可能產生內生性問題。因為明星分析師評選被取消并非完全外生事件的沖擊,而是暴露了評選過程中的問題,尤其是拉票亂象。其次,與以往關于分析師行為的文獻相比,我們拓展了分析師努力程度和薦股能力的度量方法。以往文獻一般使用盈利預測的調整頻率來度量分析師的努力程度。不過很顯然,頻繁調整盈利預測的分析師不一定比其他分析師更努力,因為每次盈利預測中蘊含的信息含量并不相同。甚至,頻繁調整預測值也許僅意味著原有預測偏誤較大,不值得信賴。本文從信息輸入端(實地調研頻率)和信息輸出端(研報發表頻率)兩個維度度量分析師努力程度。這是因為相比研報上盈利預測數字的調整,實地調研會耗費分析師更多的精力,并提高其信息關注深度(Lees,1981;Lang和Lundholm,1996;胡奕明和林文雄,2005;賈琬嬌等,2015)。此外,以往文獻一般使用盈利預測準確度來度量分析師的薦股能力,然而關于盈利的準確預測并不意味著能夠獲得超額收益,而且不同公司盈利預測準確度也不可比,例如強周期行業的盈利預測要比弱周期行業困難得多。因此,我們使用薦股準確度(即股票的超額收益)而非盈利預測準確度來度量分析師能力。本文以下的結構安排是:第二節是本文的計量模型設定;第三節是數據介紹;第四節是實證結果;最后一節是結論。
在中國證券市場上,為了迎合上市公司、投行業務客戶以及機構投資者,分析師習慣上很少發布“中性”或者更低評級的研究報告。他們即使對某些股票不看好,也往往不愿意明確給出負面評級,常見的只是由“買入”下調至“增持”,有時甚至維持原有較高評級不變,僅是在報告正文中透露出消極的信號。②證券業界對股票投資評級并無統一標準。最為常見(例如中信建投、海通證券、光大證券、申銀萬國等券商研究部)的是五級分類:買入、增持、中性、減持與賣出,代表分析師對股票的推薦程度依次遞減。也有少數券商是四級分類。例如,招商證券和國信證券評級分為:強烈推薦、審慎推薦、中性和回避。由于五級分類體系中最低一級(回避)評級的情況十分罕見,因此為計量研究的便利,本文統一分為五級,將四級分類的體系對應五級中的前四級。因此,投資者往往需要通過對研究報告正文措辭的揣摩或者與分析師私下的交流來認識分析師的真實態度。分析師和投資者的一個共識是,研究報告給出“中性”、“減持”或“賣出”評級時的確表明分析師認為該股票不值得買入,但給出“買入”或“增持”評級時未必意味著分析師真的認為股票值得買入。③這一現象在中國證券業的主流媒體上有頻繁報道。例如《中國證券報》2019年3月22日的一則報道的標題為“證監會將高度關注評級機構評級虛高等失信行為”。相比而言,評級調整方向(上調或下調)更能夠代表分析師的真正態度。因此我們感興趣的不是分析師給出的股票評級本身,而是分析師的評級調整動態。本文關注的變量是股票評級調整前后若干交易日內該股票的累計超額收益率(CAR)。我們利用市場調整收益法計算超額收益率來衡量分析師的相對業績,即時間窗內股票收益率減去同期行業指數的收益率。我們采用行業指數(申萬一級行業指數)而非全市場指數作為基準收益率,是因為一位行業分析師的研究覆蓋范圍僅限于特定行業的上市公司而不是整個市場,因而使用其所在行業的指數而非全市場指數作為業績基準更為合適。
研報發表日表示為0日,我們的事件窗設定為自-3日(研報發表前3個交易日)起,分別持續至+5、+20、+60日。其中,以-3日為起始日是為了排除研報提前泄露的影響;窗口期最長截至研報發布后5、20和60個交易日,分別對應大約一周、一個月和一個季度的時間長度。在檢驗分析師評級報告與股票表現的關系時,我們以事件窗內的CAR作為被解釋變量,以分析師特征和公司個體特征作為解釋變量,進行如下回歸:

新財富評選完全由機構投資者投票決定,得票的關鍵在于機構投資者對分析師的認可程度。相比普通分析師,我們設想明星分析師的評級報告對于股票走勢可能會有更大的影響力:一個原因是明星分析師具有較深專業積淀,他們更有可能深入認識公司的投資價值;另一個原因是明星分析師被投資者廣泛認可,他們的買入(或賣出)建議本身便可能影響到股價的短期走勢。如果該假說成立,即股票的評級被明星分析師上調(下調)后,股價有更優(更差)的表現,那么我們將發現回歸方程(1)中,對于股票評級上調樣本組β1>0;而對于股票評級下調樣本組β1<0。反之,如果β1=0,意味著與普通分析師相比,明星分析師的評級調整效果并沒有顯著差異。
為了對比新財富評選取消前后不同群體分析師的薦股能力變化,我們進一步估計如下模型:

相比基準模型(1),模型(2)中新加入了解釋變量cancel,這是表示新財富評選取消的虛擬變量。它以評選取消日(2018年9月21日)為分割點,此前取值為0,此后取值為1。如果評選取消后,分析師的薦股能力整體上出現下降,那么對于評級上調的樣本組,預期γ1<0;而對于評級下調的樣本組,預期γ1>0。也就是說,分析師薦股能力的下降體現在評級上調的股票表現并不好,或者評級下調的股票表現并不差。這樣我們可以考察評選取消前后,分析師的行為是否存在顯著變化。此外,交叉項也被加入到解釋變量中,代表新財富評選取消后明星分析師發表的研報。如果其系數(γ2)顯著區別于零,則意味著新財富評選取消后,明星分析師與普通分析師的薦股能力變化并不一致。
本文中涉及的數據包括:(1)研究報告相關數據,包括發表日期、作者姓名、股票代碼、標準化評級,來源于國泰安數據庫;(2)分析師聲譽相關數據,即歷年明星分析師評選結果,來源于《新財富》官方網站;(3)股票市場相關數據,包括個股所屬的申萬行業分類、個股行情、行業行情、財務指標,取自Wind數據庫,我們將1%和99%分位數以外的數據進行縮尾處理;(4)實地調研相關數據,包括調研日期、調研對象、參與人員姓名和所屬機構,來源于Choice金融終端。
我們的樣本覆蓋2010年1月至2019年3月國內所有券商發布的股票評級調整(包括上調和下調)報告。樣本期內共有上市公司股票評級報告549 556篇,分為買入、增持、中性、減持、賣出五個等級。我們遵循以下原則對原始評級報告進行進一步篩選:(1)剔除未進行評級或分析師姓名缺失的報告。(2)剔除宏觀報告、策略報告等不針對個股的報告。(3)剔除作者為外籍分析師或就職于外資券商的分析師的報告,因為除了宏觀、策略類的分析師之外,他們一般不參與評選。(4)剔除樣本期內曾經被ST股票的研究報告。進一步地,對于某分析師關于同一只股票的研究報告,我們剔除首次評級和維持前一次評級的報告,只保留評級調整的報告。這樣,剩余共34 552篇評級調整報告,其中評級上調的報告18 768篇,評級下調的報告15 784篇。評級調整報告的年度分布情況見表1。新財富評選取消后(自2018年第三季度末開始)的樣本約占樣本總量的7%。除了2012年(持續時間較長的一段熊市)評級上調的比例明顯較低之外,其他年份上調(或下調)的比例大體穩定。

表1 股票評級調整樣本的年度分布
表2顯示了上市公司的評級變動情況。可以看出,絕大部分的評級變動發生在“買入”與“增持”之間。其中從“增持”上調到“買入”的報告數與從“買入”下調到“增持”的報告數非常接近。中性及中性以下評級大多向上調整,其中直接上調到“買入”評級的較多,中性進一步下調到“減持”或“賣出”的情況比較少見。事實上,“減持”或“賣出”評級的報告不足樣本總量的1%。

表2 股票評級轉移矩陣
表3分列出了樣本的基本統計特征。我們將全部樣本分為“評級上調”和“評級下調”兩組。可以看到,上調評級之后所有事件窗內(5日至60日)的CAR均值都為正數。在新財富評選時段內,CAR均值很大而且隨著事件窗延長而提高。

表3 評級調整后公司的累計超額收益率和公司財務特征
具體而言,評級上調之后一周內的累計超額收益率(CAR5)均值高達3.6%,一個季度內的累計超額收益率(CAR60)進一步提高至5.8%。新財富評選取消后,評級上調CAR均值盡管仍維持為正值,數值卻相比此前時段明顯下降。評級上調之后一周內的累計超額收益率為2.7%,而一個季度后則降低至僅0.9%。相反,評級下調之后,所有事件窗內的CAR均值都為負數,數值在評選取消前后并無大的差異,一個季度內的累計超額收益率(絕對值)均為2%左右。可見,分析師的評級調整報告具有良好的投資價值。根據分析師的評級調整進行交易(買入分析師上調評級的股票,或者賣出分析師下調評級的股票),可以獲得超額收益。不過還應注意到,分析師上調評級和下調評級所產生的超額收益并不對稱,下調評級后的超額收益(絕對值)相比上調評級的情形要小得多。這一現象可能的原因有:缺乏做空機制導致投資者準確捕捉到低估和高估股票的潛在收益不對稱,因此分析師更有動力去挖掘低估股票信息,而對于高估股票的研究則相對不足;相比關于股價低估(給予上調評級)的判斷而言,股票高估(給予下調評級)的判斷本身更加困難。另外,新財富評選取消后,評級上調的公司平均而言仍然有正的超額收益,不過這種超額收益主要體現在短期,并且數值也大幅度下降了。也就是說,新財富評選取消后分析師評級上調的投資參考價值變小了。我們還注意到,被上調評級和下調評級的兩組公司在財務特征上并沒有明顯區別,兩組公司在資產規模、市凈率或ROA等方面差異并不明顯。無論是評級上調報告還是下調報告,由明星分析師發布的大約各占1/4。有趣的是,評選取消后明星分析師發布的評級下調情況有較大幅度增加,在所有評級下調報告的比例由此前的23%提高至36%。也就是說,他們更頻繁地發布公司的負面評級報告,這或許是由于缺少評選壓力的原因。
我們首先將分析師的調研頻率(平均每旬調研次數)作為度量他們勤勉程度的指標。由于調研呈現季節性,為了比較新財富評選取消前后的差異,我們將2018年10月至2019年3月(簡記為2018.10—2019.3)的數據與此前三年對應月份的數據進行比較。在2015.10—2016.3、2016.10—2017.3和2017.10—2018.3三個時段,樣本中所有分析師平均每旬的調研次數分別是483.9次、494.0次和521.6次,調研次數逐年略有增加。不過,形成鮮明對比的是,新財富評選取消后(2018.10—2019.3)分析師調研頻率均值驟降為382.4次,相比上一年度同期的降幅達1/4。①大量公司的調研報告中未披露參與調研的分析師姓名和人數,無法逐一確定分析師。因此我們只考慮了特定時段內分析師調研的總次數,而不考慮分析師個人情況。我們對不同時段分析師調研頻率進行配對樣本t檢驗,結果見表4。在進行新財富評選的幾個年度(2015—2018)中,分析師的調研頻率緩慢上升(盡管這種上升缺乏統計顯著性),然而評選取消之后的調研頻率卻大幅度下降了。評選取消之后的調研次數與上一年調研次數之差的t值高度顯著。Wilcoxon符號秩檢驗的結果與t檢驗的結論一致,這意味著新財富評選取消是分析師調研頻率變化的一個重要轉折點。

表4 證券分析師旬度調研頻率的變化
表5細分了不同類別券商的分析師的調研頻率。我們根據分析師就職的券商,將全體分析師分為三組:在上一年度的新財富評選中獲得“最有影響力研究機構”的前5名、第6—10名和未獲得榮譽的券商研究機構。將2018.10—2019.3和2017.10—2018.3的分析師調研頻率數據進行逐旬配對(即前后兩年間同一旬度的數據之差),并進行差異顯著性檢驗。表5顯示,評選取消后,每組分析師調研頻率都有所下降。其中影響力較強券商的分析師調研頻率下降幅度較小,而影響力較弱券商的分析師下降幅度較大。由于后者在分析師群體中占據優勢比例,總體而言分析師調研頻率的下降在統計上是顯著的。

表5 新財富評選取消前后分析師努力程度差異
我們還使用研報發表頻率替代調研頻率作為度量分析師勤勉程度的指標。研報發表頻率為每旬內平均每人發表的研報篇數。具體地,對于某一研究機構,給定某旬的研報發表頻率定義為,該機構在該旬發表的研報總數,除以該機構在該旬及此前兩個月發表過研報的分析師總人數。由于研報發表頻率也呈現季節性,我們將新財富評選取消后的 2018.10—2019.3的數據與前一年度相同時段數據進行配對樣本檢驗。評選取消后,所有分析師研報發表頻率(平均每人每旬發表研報條數)0.629篇,而上一年度同一時段的研報發表頻率為0.792篇。不同類型券商分析師差異性檢驗的結果見表5第二欄。結果表明,無論分析師任職的券商排名如何,在評選取消后的半年內,分析師平均每人每旬發表的研報數量下降幅度相似(均下降0.2篇左右,降幅約為20%)。而且這種下降統計上非常顯著。為了考察分析師本人聲譽是否與新財富評選取消后研報發表頻率的變化有關,我們還計算了評選取消前后明星分析師與普通分析師的研報發表頻率(以第一作者為準)。無論是t檢驗還是秩檢驗都認為兩組分析師的研報頻率在評選取消后的下降幅度沒有顯著的差異。也就是說,新財富評選取消后明星分析師和普通分析師研報發表頻率發生了幾乎同等幅度的下降。①除了計算單人研報發表頻率之外,我們還直接以券商為單位,統計每一時間段整個券商發表的研究報告數量。結果也表明,在新財富評選取消后,所有參評券商的研報發表頻率均顯著下降,而未參評的中金和中信這兩家券商研報發表頻率沒有發生顯著變化。
接下來我們估計方程(1)來驗證明星分析師是否具有更強的薦股能力,結果見表6。

表6 股票評級調整與超額收益
顯然,明星分析師的上調評級報告無論是在短期還是長期都具有更高的投資價值。相比普通分析師上調評級的情況,被明星分析師上調評級的股票一周(5個交易日)內平均獲得0.9%的超額收益。如果將事件窗延長至上調評級后的一個季度,超額收益則高達1.4%。反過來,明星分析師評級下調的股票也有負的超額收益,且絕對值也隨著事件窗的延長而提高。以上結果意味著,相比普通分析師所做的評級調整而言,明星分析師上調評級的股票總體上會表現更好,而下調評級的股票總體上表現更差。不過評級下調與上調的效果并不對稱:評級下調股票短期的超額收益并不明顯(一周的超額收益幾乎為零),較長時期的超額收益絕對值也低于評級上調情形。當事件窗為一個季度時評級下調的超額收益(絕對值)為0.6%,不足評級上調時超額收益的一半。這一結論與Stickel(1992)、王春峰等(2015)的發現是一致的。表6還顯示,股票的超額收益一定程度上受到公司基本特征的影響。公司市值(size)變量的系數一般為負值,這意味著中國股市中存在小股票溢價現象,即整體而言小市值股票相比大市值股票會獲得超額收益。回歸中價值因子(BM)系數的符號并不一致,我們在樣本期內并沒有發現穩健的價值股溢價現象。
我們在回歸方程的解釋變量中加入代表新財富評選取消的示性變量cancel,即估計方程(2),結果見表7。我們仍然發現,相比普通分析師而言,明星分析師的評級調整總體上更有投資價值。當窗口期為一個季度時,明星分析師上調和下調評級的超額收益(絕對值)平均為 1.4%和 0.6%,這與表6中的結果幾乎相同。不過我們還發現,在上調評級的樣本組中,cancel的系數均為負值,而且事件窗較長時是顯著的。例如考察的事件窗為一個季度時,評選取消后上調評級的超額收益降幅平均高達3.8個百分點。但在下調評級的樣本組中,cancel的系數總體上較小且顯著性弱。這表明新財富評選取消前后,下調評級股票的超額收益情況并無明顯變化。此外,交叉項star?cancel的系數在上調評級的樣本組中顯著為負值,而在下調評級的樣本組中并不顯著。這意味著,評選取消后明星分析師(相比普通分析師)薦股能力下滑更為嚴重,這主要體現在被他們上調評級的股票獲得超額收益的能力下降,而被他們下調評級股票的表現則并無特別變動。

表7 新財富評選與分析師的超額收益
圖1是分析師上調評級后不同事件窗內CAR的中位數,可以看出,新財富評選取消后,所有分析師的薦股能力都下降了,但明星分析師相比普通分析師的下降幅度更大。這在事件窗較長時體現得更為充分。這一現象與表7中的回歸結果是一致的。①使用不同窗口期CAR的均值替代中位數,也有相似的發現。不過均值可能會受到極端值的影響。例如,一只“超級牛股”或“超級熊股”就足以影響整個樣本均值。

圖1 分析師上調評級報告的累計超額收益中位數
本文通過“新財富最佳分析師”評選,研究了聲譽激勵機制對證券分析師行為的影響。我們整理了2010—2019年間A股證券分析師關于股票評級的大樣本數據,重點考察了該評選活動取消前后,分析師的工作勤勉程度和薦股能力兩個方面的變化。結果表明,分析師的投資評級調整總體上具有良好的投資參考價值;相比一般分析師而言,上榜“新財富”的明星分析師所做的評級上調可以進一步獲得超額收益。但評選取消后,分析師的薦股能力顯著下降,工作勤勉程度也有一定程度下降。這表明作為中國證券市場上最重要的聲譽激勵機制,新財富評選能一定程度上衡量分析師的研究能力,并提高他們的努力程度和工作業績。這證實了聲譽激勵機制對分析師行為的影響,為完善分析師業績考核機制提供了經驗支持。這一經驗結果除了對于投資實踐有一定的參考價值之外,理論含義在于提供了有效市場假說的反面證據,因為分析師可以通過努力搜集基本面信息,來獲得顯著的超額收益。
近年來,在新財富評選過程中,產生了與證券研究工作無關的拉票行為和評選活動的娛樂化,這最終導致了該評選在2018年被取消。不過,我們發現,“新財富最佳分析師”的榮譽為分析師提供了一種有效的激勵機制,有利于證券市場的價值發現和參與者的投資決策。因此,我們認為,面對評選“亂象”而簡單取消評選并不利于證券研究行業的發展。①本文付梓之際,我們注意到新財富最佳分析師評選已經重啟,新一屆(第17屆)新財富最佳分析師榜單已于2019年12月25日揭曉。與原有評選規則相比,新的評選規則減少了主觀性,在參評資格、投票資格和投票權重等方面均增加了客觀量化指標。行業監管部門有必要規范分析師聲譽市場的培養和發育,證券研究行業有必要在規范評選的基礎上,重建聲譽激勵機制。只是在評選中應設定客觀可量化指標來評估分析師的表現,盡可能地降低主觀性。