王佳歡



【摘 要】行為金融學認為投資者心理活動會影響資產價格,投資者由于精力和注意力有限,無法注意并吸收市場上全部的信息,從而導致對資產價格認知的偏差。通過對投資者關注度變化的研究,有助于我們理解與預測市場的波動性。本文基于淘股吧論壇,運用爬蟲程序爬取用戶12年1月至18年8月的留言數據,以含有“銀行”關鍵字的留言數在當日總留言數中的占比為投資者關注度代理指標,研究關注度變化對銀行股票下一交易日漲跌幅的影響。結果表明,銀行股出現大幅度波動的概率與關注度與水平成正相關,且高關注度水平在一周的交易日內的分布具有不均勻性。
【關鍵詞】投資者關注度;銀行股票;數據挖掘
一、研究背景
由于投資者的精力和注意力有限,金融市場上的投資者無法注意并理解市場上的所有信息(Barberis & Thaler,2003)從而導致對信息理解的不全面和對資產價值預測的偏差。投資者對于市場信息的認識和理解會直接影響到他們的投資決策和交易行為,從而對金融市場產生影響。
通過對投資者關注度變化的研究,有助于我們理解與預測市場的波動性。
二、意義及創新點
股吧是投資者交流意見和獲取信息的重要途徑,投資者在股吧中瀏覽他人的觀點,并留下自己的判斷,在交流的過程留下的瀏覽記錄以及發言記錄無疑都是投資者個體內心的寫照,通過分析其留言中是否含有‘銀行關鍵字,可以判斷該投資者是否關注到了銀行股,因此本文使用涉及關鍵字‘銀行的留言在總留言數中的占比作為投資者對銀行股的關注度代理指標。將下一交易日,標的漲跌幅度作為因變量,研究關注度的變化對下一交易日的影響。
根據數據來源的不同,傳統的投資者關注的度量方式可以分為以下兩種:第一種方式是利用金融資產的交易特點度量投資者關注度。通常的做法是使用交易量、換手率、成交量等變量測度股票是否受到了投資者關注(Chemmanur & Yan, 2009; Hou et al, 2009; Loh, 2010)。第二種方式是基于財務報表和公告數據測度投資者關注。
傳統數據(交易數據及公司報表、公告等)能在一定程度上度量投資者關注和投資者情緒,但這些數據仍存在以下弊端:第一,傳統數據缺乏對投資者關注和情緒的直接度量。第二,傳統數據種類單一,缺乏以投資者為對象的數據,為深入研究投資者行為和心理帶來了阻礙。第三,大多傳統數據數量較少,計量誤差較大。
相較傳統交易數據或財務報表數據,股吧數據具有規模性、多樣性、高速性的特點。
本文以淘股吧作為數據來源,新增了一個分析投資者關注度及其情緒的數據來源,并以涉及關鍵字的留言占比作為投資者關注度的代理指標,新增了一種投資者關注度的代理指標。
三、數據來源
(1)淘股吧介紹
淘股吧論壇成立于09年,發展至12年后論壇基本成熟,用戶活躍度及數量都保持在一個較高水平,根據淘股吧內的帖子來看,淘股吧用戶股票操作風格大多激進,其用戶層面比之東方財富較窄,少有中長線價值投資者,多為快進快出的短線投機客,本文正是基于對短線投機客對于銀行股關注度的變化來研究其對后一交易日銀行股整體情況的影響。
(2)樣本選取
本文選取的是12年1月1日至18年8月31日的共2435日近150萬帖子數據。通過python軟件爬取了淘股吧論壇的所有帖子,將帖子的標題、內容、發帖人、發帖時間,以及所有跟帖的內容、跟帖時間、跟帖人保存在mongodb數據庫中。共得到426761條有關銀行的留言。
(3)對應標的選取
因為是以‘銀行為關鍵字進行檢索,所以選取銀行板塊指數作為對應標的進行對銀行板塊整體情況的研究,該指數包含了A股所有的銀行股,能較好的反應銀行股的整體情況。
四、數據處理
在數據庫中以日為單位對當日數據進行統計,記錄下當日留言的總條數以及包含‘銀行關鍵字的留言條數,生成當日談及銀行的留言在總留言數中的占比。
以日為單位,在excel中生成日期、星期、關鍵字留言數、總留言數、占比、下一交易日漲跌幅項目。
五、數據分析
刪除一些無效數據后得到共2399日數據,將數據按照關注度水平進行降序排列,取前2.5%數據(60個)作為高關注度組,取后2.5%數據(60個)作為低關注度組,對比研究與總體的差異。
分別對總體、高關注度組以及低關注度的下一交易日漲跌幅進行描述統計。(表2、表3、表4)
研究發現:
(一)下一交易日出現大幅波動的概率與關注度水平成正相關
與總體相比,高關注度水平下,方差顯著變大(從2.48增大至5.40),表示下一個交易日出現大幅度波動的可能性顯著增大。
與總體相比,低關注度水平下,方差顯著減小(從2.48減小至1.19),表示下一個交易日出現大幅度波動的可能性顯著減小。
以漲跌幅超過3%作為大幅度波動,從歷史數據來看,我們也可以驗證這一點。以本文選用的2012年1月1日至2018年8月31日之間的1622個交易日數據來看,共有92個交易日漲跌幅超過3%,出現大幅度波動的概率為5.67%。
在高關注度組,60個樣本中共有7次下一日漲跌幅超過3%(且指向的下一交易日非重復),出現大幅度波動的概率為11.67%。
在低關注度組,60個樣本中共有2次下一日漲跌幅超過3%,由于這兩次指向的下一交易日正好重疊,所以記為一次,所以出現大幅度波動的概率為1.67%。
可見,關注度水平確實影響出現大幅波動的概率。
(二)高關注度出現在一周內頻率并不相同,交易日間的風險不同
高關注度出現在周六周日周一的頻率顯著最大(周日頻率最高),意味著周一、周二出現大幅度波動的可能性最大。
可見,周一的風險明顯大于其他4個交易日,周二其次。
六、結論
本文通過對淘股吧內投資者對銀行股的關注度水平建立代理指標,研究銀行股關注度水平與其對應標的(板塊指數)之間的關系,研究發現:
(一)關注度水平與下一交易日的出現較大的漲跌幅的概率成正相關。
(二)高關注度水平在每周交易日的不平均分布(周六、周日、周一顯著較高)可能是導致周一出現大幅波動的原因。
七、不足與展望
一、本文只從關注度角度出發,得出了高關注度導致銀行股出現大幅度波動的概率增大,但是無法從關注度角度得出變化的方向,下一步將希望通過語義分析分類等方法分析投資者的情緒,研究關注度與情緒結合起來對資產價格的影響。
二、對于結論二,只是發現銀行股高關注度分布的不均勻性(在周六、周日及周一顯著高于其他),以及從歷史數據得出的出現大幅波動的概率在周一最高、周二其次的現象,而并沒有準確地分析這兩個現象之間的因果關系,下一步將尋找一些模型和方法來準確論證其中的因果關系。
【參考文獻】
[1]Barberis, Nicholas. & Richard Thaler (2003) A Survey of Behavioral Finance. In: George M. Constantinides, Milton Harris, and RenéM. Stulz, eds. Handbook of the Economics of Finance: Volume 1B, Financial Markets and Asset Pricing. Elsevier North Holland, Chapter 18:1053~1128.
[2]Chemmanur, T. & A. Yan (2009). Product market advertising and new equity issues. Journal of Financial Economics, 92(1):40-65.
[3]Hou, K.et al. (2009). A tale of two anomalies: The implication of investor attention for price and earnings momentum. Social Science Electronic Publishing, 45:416-418.
[4]Loh, R.K. (2010). Investor inattention and the underreaction to stock recommendations. Financial Management, 39(3):1223-1252.
[5]Grullon, G.et al. (2004). Advertising, breadth of ownership, and liquidity. Review of Financial Studies, 17(2):439-461.
[6]Solomon, D. H.et al. (2014). Winners in the spotlight: Media coverage of fund holdings as a driver of flows. Journal of Financial Economics, 113(1):53-72.
[7]Kaniel, R. & R. Parham. (2017). WSJ Category Kings: The impact of media attention on consumer and mutual fund investment decisions. Journal of Financial Economics, 123(2):337-356.
[8]許柳英, 陳啟歡. 公眾注意力影響買入行為嗎?——基于投資者行為的分析[J].上海管理科學,2005.27(4):39-41.
[9]譚偉強, 我國股市盈余公告的“周歷效應”與“集中公告效應”研究[J].金融研究,2008.2:39-41.
[10]楊曉蘭我國股票市場的網絡關注度效應——一個基于和訊關注度的實證檢驗[R].工作論文,2010.
[11]饒育蕾, 彭疊峰, 周相宜. 基于有限注意的排行榜效應研究[C].第六屆中國金融學年會論文,2009.
[12]饒育蕾, 王攀. 媒體關注度對新股表現的影響——來自中國股票市場的證據[J].財務與金融,2010.3:1-7.
[13]于李勝, 王艷艷. 信息競爭性披露、投資者注意力與信息傳播效率[J].金融研究,2010.8:112-135.
[14]周嘉南, 黃登仕. 投資者有限注意力與上市公司年報公布時間選擇[J].證券市場導報,2011.5:53-60.
[15]張雅慧, 萬迪防, 付雷鳴. 股票收益的媒體效應:風險補償還是過度關注弱勢[J].金融研究, 2011.8:143-156.
[16]李冬昕, 李心丹, 張兵. 分析師的盈利預測偏差與本地優勢[J].財經科學, 2011.3:26-33.
[17]董大勇, 肖作平. 交易市場與網絡論壇間存在信息傳遞嗎[J].管理評論, 2011,11:3-11.
[18]張永杰, 張維, 金曦等. 互聯網知道的更多么?——網絡開源信息對資產定價影響[J].系統工程理論與實踐, 2011.4:577-586.
[19]俞慶進, 張兵. 投資者有限關注與股票收益——以百度指數作為關注度的一項實證研究[J],金融研究, 2012.8:152-165.
[20]謝世宏. 基于互聯網搜索的有限注意與我國股票市場的關系研究[D].南京大學,2012.