[摘要]股票間偏相關系數可以更合理地反映剔除大盤指數影響后的股票間關聯。本文以股票間偏相關系數為指標,建立A股上海板塊的金融地產、信息技術和醫藥衛生三大行業的動態最小生成樹,分析和研究股票聚類的變化過程。
[關鍵詞]偏相關系數;最小生成樹;聚類
一、引言
上海是我國資本市場的發源地,現代市場金融體系較完善,資本運作經驗豐富,在全國起著帶動和示范作用,另一方面,上海有眾多上市公司,特別是有70余家中央企業,因此上海板塊可以稱為我國股票市場的縮影。研究上海板塊股票間的關系具有代表性,對推動其他地區上市公司的發展也具有重要的參考價值。
Mantegna(1999)首次將最小生成樹(Minimum Spanning Tree, MST)方法研究美國SP500只股票間關聯性。該方法受到了廣泛的關注,產生了一系列后續研究。這些股票網絡中節點間距離是基于股票序列間的皮爾森相關系數。股票價格的變化不僅受公司自身基本面和相關上市公司的影響,而且大盤指數的升跌容易導致個股價格的變化。為了更合理地衡量股票間關系,控制大盤指數影響是必要的,這就需要計算股票間的偏相關系數。
本文將以股票收益率序列之間的偏相關系數為指標,建立A股上海板塊的金融地產、信息技術和醫藥衛生三大行業的動態最小生成樹,分析和研究股票聚類的變化過程。
二、 基于偏相關系數的最小生成樹構建
1.計算股票間偏相關系數
偏相關系數是一種在控制其他變量影響的條件下,專門考察多個變量中某兩個變量的凈相關關系的指標。在股票市場中,股票之間的偏相關系數計算過程如下:
(1)計算收益率。股票i和j在時間t的收盤價格為和,對應大盤指數s在時間t的收盤指數為,對股票價格和大盤指數分別求收益率:
任意兩只股票的距離組成了距離矩陣 , 用于確定股票的最小生成樹。MST是一個無環網絡圖,滿足連接所有節點的邊長之和最短,可以由Krustal算法得到。
三、A股上海板塊實證
1.數據來源和處理
上海是以金融、信息技術和醫藥為三大支柱產業,從而本文選取了在上交所上市的A股上海板塊中的金融地產、信息技術和醫藥衛生三個行業從2005年1月1日到2009年6月30日的個股收盤。剔除缺失數據超過1/5的股票。本文還采用上證綜指在2005年1月1日至2009年6月30日的收盤指數。
2.實證結果與分析
金融地產等三大行業的動態MST由6個MST組成, 每個MST包含研究股票對象兩年的數據,相鄰MST之間的間隔為半年,如圖1至6所示。節點代表股票,連線代表股票間距離。
(1)金融地產行業。金融地產主要形成銀行、證券信托和房地產聚類。由于交通銀行是在2007年以后在上交所上市,因此交通銀行只出現在圖5和6中,并與浦發銀行相連形成銀行子聚類。安信信托2005年11月、2006年第一季度和2006年12月停牌時間達5個月多,缺失數據過多而沒有出現在圖1至3。在圖1至3中,海通證券和愛建股份從分離到相互連接,在圖5至6中,海通證券、愛建股份和安信信托這三只股票相連。無論在哪個階段,房地產聚類效果都是非常好的,除了圖2和5外,其他圖中的房地產企業全部聚在一起。
(2)信息技術業。信息技術股票的分布狀態是一個從分散到集中的過程。在圖1、2和3中,信息技術股票比較分散,特別是圖1中飛樂股份和方正科技與華東電腦等的距離很大;在圖3和5中,除了寶信軟件外的信息技術股票形成聚類;在圖6中則所有股票聚成一類。值得注意的是,復旦復華和同濟科技始終相連,這可能跟它們是高校科技股有關。
(3) 醫藥衛生業。交大昂立或與其他醫藥股票分離或在醫藥聚類的邊緣,這可能與其以保健品為主有關。在圖6中,上實醫藥、中西醫藥與上海醫藥相連,這與今年3月這三家公司正式合并似乎能相呼應。
本文動態地描述了金融地產、信息技術和醫藥衛生三個行業的聚類變化過程。股票數目較少,變化過程清楚明了。下一步研究滬深300指數成分股的動態聚類變化過程。
參考文獻:
[1] Mantegna R N. Hierarchical Structure in Financial Markets[J]. The European Physical Journal B, 1999, 11(1): 193-197
[2] Garas A. and Argyrakis P., Correlation study of the Athen Stock Exchange[J]. Physica A, 2007, 380:399-410
[3] 黃飛雪等.基于最小生成樹的上證 50 指數分層結構[J].系統工程,2009, 27(1): 71-76
[4]莊瑞鑫, 葉中行.基于最小生成樹的超度量聚類的若干案例分析[C].第三屆中國智能計算大會論文集.濟南.2009:105-109