文/周敏(上海大學)
Fama于1970年提出有效市場假說,該假說認為,投資者是完全理性的,并且能夠對市場上的信息做出有效的反應,因此資產價格充分反映其內在價值。隨著資本市場狀況愈加復雜多元,有效市場假說無法很好地解釋金融市場中的一些異常現象,行為金融學理論在此基礎上逐步發展起來。投資者情緒作為行為金融學的基石,在分析投資者行為解釋資產價格波動中發揮著重要的作用。投資者情緒自20世紀80年代起就已經被廣泛應用于解釋金融異常現象,目前在研究封閉式基金折價、IPO折價、小公司效應等方面發揮著重要作用,本文將重點介紹投資者情緒指標的構建。
投資者情緒的概念可以從多個角度進行理解,目前尚未形成較為統一的說法。部分學者從資產定價的角度對投資者情緒進行了定義,De Long et al. (1990)[1]認 為 投 資 者情緒是對資產基本面的錯誤認知;Lee(1991)[2]等則認為資產價值預期中不能被基本面解釋的部分就是投資者情緒。另一部分學者從心理學中的信念以及偏好的角度對投資者情緒進行了定義, Mehra和Sah(2002)[3]認為投資者情緒就是對股票預期價格的主觀偏好;Baker和Wurgler (2007)[4]則將投資者情緒定義為投資者進行投機的傾向以及對未來資產價格樂觀或者悲觀的預期。綜上所述,我們可以將投資者情緒歸納為投資者進行投資決策時對于理性預期的偏移或對資產價格進行的非理性預期。
投資者情緒的直接指標是指通過問卷調查、人物訪談等市場調研獲取到的數據。直接指標有著直觀、簡便的特點。國內外很多學者利用了不同類型的直接指標來衡量投資者情緒。比如,國外學者Brown和Cliff(2002)[5]利用“美國私人投資協會(AAII)”和“投資者智慧(II)”的抽樣調查數據,分別構建了衡量個人與機構投資者的情緒指標。國內學者王美今和孫建軍(2004)[6]利用了央視發布的“央視看盤”數據來衡量投資者情緒,陳其安(2012)[7]則利用了《股市動態分析》發布的好淡指數作為指標來衡量投資者情緒。直接指標雖然有著不少優點,但是采集相關指標時需要消耗大量的人力物力,并且采集到的數據與真實的投資者情緒之間可能存在較大誤差。
投資者情緒的間接指標是指資本市場交易行為產生的各種數據。間接指標相較于直接指標,在可獲得性與連續性上有著天然的優勢,并且間接指標種類豐富,能夠反映市場整體的信息。在使用間接指標衡量投資者情緒時,一部分學者選擇使用單一指標來衡量投資者情緒,如江宵(2012)[8]使用的A股平均市盈率、劉維奇和劉新新(2014)[9]使用的個人與機構投資者的新增開戶數、易力和王序東(2021)[10]使用的股市換手率等等。利用單一指標衡量投資者情緒存在片面性,因此部分學者將研究的重心放在了構建綜合的投資者情緒指標上。其中,Baker和 Wurgler(2006)[11]通過對封閉式基金折價率、紐交所股票周轉率、IPO的數量、IPO首日平均收益率、新發行的股票數量和股息溢價六個指標進行主成分分析,構建了相對綜合的投資者情緒指標,也證實了投資者情緒會對股票的收益產生不同的影響(我們將此種方法成為BW方法)。然而,易志高和茅寧(2009)[12]認為BW方法只適用于歐美成熟的資本市場,因此他們研究我國市場時,在BW方法的基礎上加入了消費者信息指數這一主觀指標,建立了適合我國國情的月度投資者情緒指標。近年來,學者們從兩個方向對間接指標構建投資者情緒的方式進行了改進,部分學者對構建投資者情緒的間接指標進行了拓展,部分考慮了技術指標如相對強弱指標、乖離率、融資融券余額、兩融交易占比等等;而另一部分學者則對研究方法進行了改進,如使用卡爾曼濾波法剔除市場噪聲帶來的干擾。
對于利用網絡文本數據構建的投資者情緒指標,我們可以根據網絡文本數據的來源將其分為媒體報道數據構建的投資者情緒指標、論壇數據構建的投資者情緒指標兩類。
利用媒體報道的數據來構建投資者情緒指標,可以分為以下幾個步驟:首先收集一段時間內的新聞并對收集到的文本數據進行分詞與處理;然后建立相應的目標詞庫對文中表達積極情緒的詞匯與表達消極情緒的詞匯進行統計;最后根據統計的結果建立投資者情緒指標。汪昌云和武佳薇(2015)[13]利用了IPO公司上市前財經媒體的報道作為分析文本并構建投資者情緒指標。石善沖和康凱立(2019)[14]收集了微信朋友圈的文章并利用微信提供的認證信息,對機構投資者的觀點與普通投資者的觀點進行區分,構建了機構投資者與個體投資者情感指標。Hamza(2020)[15]則使用美聯儲主席與媒體溝通內容中出現的正負面詞匯數量,并結合BW方法構建了綜合的投資者情緒指標。
利用網絡論壇數據構建投資者情緒指標可以分為以下兩步:首先需要通過爬蟲等技術收集各大論壇中的文本數據,然后通過自然語言處理的方式對文本信息進行情感分類,并計算其中正負面情緒帖子的數量。國外的學者McGurk Z和Nowak A(2014)[16]利用推特中的推文構建了投資者情緒指標;Kiyoak等(2015)[17]認為推特的推文中包含較多的無效信息,因此選擇使用雅虎財經作為構建投資者情緒的數據來源;Checkley等(2017)[18]則同時選用了推特的推文與股票投資者更多聚集的StockTwits論壇作為文本數據的來源。國內的研究者大多是從東方財富與雪球兩大論壇上獲取數據。楊曉蘭等(2016)[19]基于我國東方財富網股吧論壇的數據,對論壇內的帖子進行文本分析并構建了相應的投資者情緒指標。鄧敏娜(2019)[20]利用雪球論壇對投資者發帖來源的分類,構建了PC端與手機端投資者情緒指標。
通過上文的梳理我們可以看到,目前已經存在多種構建投資者情緒指標的方式,但是我們認為,隨著計算機技術的不斷發展,利用網絡文本數據構建投資者情緒指標將會成為主流。利用網絡文本數據構建投資者情緒指標存在以下兩個方面的優勢。(1)時效性,我們可以利用網絡數據構建不同時刻的投資者情緒,而利用直接指標或者間接指標構建投資者情緒指標時只能建立日度或者月度指標;(2)針對性,我們可以篩選出特定群體的網絡數據,構建針對特定群體的投資者情緒指標,如:機構投資者、普通投資者等等。