摘要:以股票為節點,選取適當閾值量化股票收益率序列間相關關系從而構建復雜金融網絡。基于復雜網絡的理論,討論金融網絡的度分布、平均最短路徑和聚集系數,發現面向金融時間序列的股票網絡具有小世界效應,無標度特性和一個很重要的特性—自相似性。該文用兩種方法分析了網絡的自相似性:一是提出用網絡節點的度構造Hurst指數,定量分析金融網絡的自相似性;二是金融網絡的平均路徑長度和聚集系數定性地分析了復雜網絡的自相似性。
關鍵詞:金融市場;復雜網絡;無標度;自相似
中圖分類號:F830文獻標識碼:A文章編號:1009-3044(2011)04-0723-03
Self-similarity Research of Stock Complex Networks
WANG Xiao-xia, LI Xing-ye
(Business School, University of Shanghai for Science and Technology, Shanghai 200093, China)
Abstract: network is constructed from data such as these in the following way: first each stock is treated as a node ,the correlation of stock prices' fluctuation is taken as an edge on a network; then some metric and a suitable threshold are chosen. Using the theories and methodology of complex networks, we discussed the degree distribution, average path and clustering coefficient of the stock market network and found that the network has statistical characteristics of networks-small world effect and scale-free property. We also obtained another important property-self-similarity with two methods:one is quantitative analysis node degree distribution with R/S theory by getting Hurst index of structure, the other is qualitative analysis and comparing volume dimension by average path length and clustering coefficient of network with Box Cover method.
Key words: financial market; complex network; scale-free property; self-similarity
證券市場素有經濟晴雨表之稱。證券市場由于受企業經濟效益,居民收入水平,投資者的心態等諸多因素影響,所以它是一個涵蓋大量信息的復雜系統。近年來以復雜網絡角度理解和分析證券市場,構建金融網絡的方法層出不窮。Boginski [1]等研究了美國證券市場6546支股票,發現股票相關性呈現無標度性。莊新田[2]等基于相關系數構建以上海證券交易所持續交易的股票為節點的復雜網絡,討論上海證券市場的股票價格波動,魯巍巍[3]等對滬深A股構建復雜網絡,計算網絡的聚集系數,吸引率,討論不同行業的聚合強度及其對滬深A股市場股價波動的影響,這些研究都是基于網絡的拓撲結構特征:節點度分布、平均路徑長度、聚集系數、吸收率等,都從網絡節點對網絡的影響程度方面考慮,對于復雜金融網絡的另一特性——自相似性并無研究。
復雜網絡的自相似性是指網絡局部和整體在某些特征上相似。對于固定網絡自相似性的研究一般是利用節點內部互動性來探測網絡的演化過程。自相似系數的測量方法是由 C.M.Song與S.Havlin[4]提出利用重構化測量,以及R.Guimera,L.Danon[5]提出利用郵件系統測量社區結構的相似性,他們也用這些方法描述了一些現實網絡的自相似性[4]。
1 復雜金融網絡建模
1.1 數據來源
筆者隨機抽取從2007年9月28日至2010年2月26日滬深A股的500只股票作為研究對象。根據每只股票月數據的開盤價、收盤價、最高價和最低價平均值計算股票的對數收益率,然后用對數收益率序列建立相關關系,通過相關關系數值化研究復雜金融網絡的拓撲特征[6]。
1.2 復雜金融網絡建模
以滬深A股為節點,股票相互影響關系為連邊構建無權無向網絡。設股票i在第t時刻的平均價為xi(t),xi(t)為股票i在t時刻開盤價,收盤價,最高價和最低價的平均值。
為股票i對數收益率。定義股票i和股票j的相關系數為:
其中E(yi)表示股票i在n期的平均收益率,
由定義知:ρij的值域為[-1,1]。若ρij=1,表示股票i和股票j完全正相關,表現為同向增長或降落;若ρij=-1,表示股票i和股票j完全負相關,表現為反向變化;若ρij=0,股票i和股票j完全不相關。計算n只股票對數收益率的相關系數,得到一個n×n階對稱相關系數矩陣p。選取合適的閾值,將系數矩陣p進行量化,得到一個只有0和1的稀疏矩陣,此矩陣便作為金融網絡的鄰接矩陣。
1.3 復雜金融網絡的拓撲結構特征
1.3.1 節點度分布
節點度是指連接節點的邊數,節點度分布是指一個任意選擇節點恰好度數為k的概率,也等于網絡中節點度數為k的節點數占網絡節點總數百分比,用分布函數p(k)來表示。
1.3.2 平均最短路徑長度
若一個包含n個節點的無向網絡,,其中dij為節點i和節點j的最短距離,也是節點i,j最短路徑所經過的邊數??紤]到每個節點到期自身的距離為0,無關聯節點的距離為無窮大,此時存在問題,所以對進行修改,得到“調和平均”最短路徑長度。在股票網絡中,平均最短路徑長度是任意兩只股票相關中介數量的平均值,反映網絡的大小和分離程度。
1.3.3 聚集系數
考慮節點i,它通過ki條邊和其他ki個網絡節點相連接,則它們之間最多有ki(ki-1)/2條邊連接,但ki個節點實際有Ei條邊,所以節點i的聚集系數ci,,網絡的平均聚集系數為。聚集是用來刻畫網絡的小集團形態,說明鄰近集團在相關性意義上的凝聚程度。
2 復雜金融網絡的自相似性研究
相識性是現實世界客觀存在的一種現象,描述相識性的方法一般分為兩種:一種是將對象看作為某k個維特征空間的點,對象的相似由點與點間的距離來確定,另一種衡量相似性方法是比較對象之間的一般特征和一些典型特征。自相似性是一種特殊的相似,是對象本身的一種特性,是對象局部和整體相似。
雖然C.M.Song等用重構化能測量網絡的自相似性,但此時網絡只能是固定結點的網絡,而現實生活中的網絡是動態增長的過程,如社會網中每個人認識的朋友數在不斷地增加,隨著市場經濟的完善,上市公司數量越來越多,在證券交易所交易的股票數量也在不斷的更新和變化。鑒于這些動態變化的網絡,本文分別采用以下兩種方法來研究復雜金融網絡的自相似性
2.1 基于R/S分析的金融網絡自相似性分析
設網絡為動態增長的,網絡節點不斷地增長記為n1,n2,…ni,計算節點在ni時度分布的累積極差R(k)和標準差S(k)。
設x(k)為網絡節點是ni時各節點的度數,的均值,也為網絡的平均度數。
累積極差R(k):R(k)=max x(k,ni)-min x((k,ni)
標準差S(k):,則關系式為,
R/S為重標極差,H為Hurst指數,所以
具體計算:以ln ni為自變量,lnR/S為因變量采用最小二乘進行線性擬合,所得直線的斜率即為H的估計值
復雜網絡自相似性與Hurst指數的關系[6]
若0≤H<0.5,說明復雜網絡具有很強的突變性和不穩定性
若H=0.5, 說明復雜網絡節點是互相獨立的,度分布是隨機的。
若0.5 2.2 基于容量維數的自相似性分析 基于分形思想,用半徑為r的尺子去測長度為l的尺子,所需尺子個數為 用半徑為r的小圓去覆蓋面積為S的圓,所需小圓個數為 用半徑為r的小球去覆蓋體積為V的球,所需小球個數為 以此類推可用半徑為r的客體去覆蓋被測對象,所需個數N(r)的值與r的取值關系表示為, 定義D為相似容量維數,取對數得相似容量維數[7] 本文計算平均最短路徑長度和聚集系數的D來分析復雜金融網絡自相似性 3 實證分析 由于本文是分析動態復雜網絡的自相似性,所以用不同數量的股票來構造網絡。 1) 分別用200,250,300,350,400,450,500不等數量的股票構造金融網絡,然后基于R/S分析用各網絡節點度分布來求Hurst指數,在matlab編程基礎上得到H=0.823,可知復雜金融網絡具有自相似性。取閾值為0.85,構建股票網絡并計算各網絡的平均最短路徑長度和聚集系數。 實證研究發現在網絡平均度數緩慢增長時,網絡平均路徑長度和聚集系數呈現相似的變化趨勢,這也是網絡拓撲特性自相似性表現。 2) 選用200,250,300,350,400,450,500只股票分別構造金融網絡,用比較分析法分析金融網絡的自相似性。 比較300,400,500只股票時相關系數的概率分布,然后采用修正法[3]求相關系數的概率分布。文獻[3]提出采用修正法求相關系數矩陣,來消除時間因素的影響。但筆者認為不能做修正,盡量保持原有信息,這才能反應真實的市場環境。因為首先證券股票市場存在在投機行為,趨利性等很容易造成追殺跌漲的“羊群效應”,其次證券市場受到經濟周期和行業因素的影響,而每個行業都要經歷幼稚期、成長期、成熟期、衰退期的發展演變過程,這個過程成為行業生命周期,再次證券市場還受到產業政策等影響。筆者用修正法[3]對300,400,500只股票構建的網絡進行了修正,得到圖3~圖4。 顯然修正后的相關系數的概率密度是正態分布,符合強勢有效市場的假設,但中國證券市場目前狀況是弱勢有效市場,證券價格只能反映歷史信息,還存在內幕信息等,所以本文不對收益序列做任何修改。 在閾值為0.85時各股票網絡都表現出很好的無標度特性(如表1所示):(最小二乘法)。 給出在閾值為0.85時節點為300、400、500的度分布圖1。 以500只股票構造的網絡為整個復雜網絡,300只和400只都為局部小網絡,得到容量相似維數。 從表2中可以看出Dl,Dc都比較相近,所以得動態的網絡也具有自相似性。 4 結束語 本文基于復雜網絡的理論分析了金融市場的網絡特性—小世界效應和無標度特性。無標度則表示網絡節點分布不均勻,網絡中有地位比較重要的“中心點”,可知股票市場存在影響力比較大的股票或是行業。實證研究結果得出,金融網絡的冪律指數大概為1,這與莊新田[2]等人得出上海證券市場網絡的冪律指數為0.8219和0.7930差異不大。本文還著重介紹了兩種方法分析金融網絡的自相似性,這說明金融市場變化趨勢有一部分依賴于過去,到底依賴程度有多少,就需看整個金融市場自相似程度,這便成了下一步的研究內容。 參考文獻: [1] Boginski V,Burenko S,Pardalos P M.Statistical analysis of financial networks[J].Computational Statistics Data Analysis,2005,48(2). [2] 莊新田,閔志峰,陳師陽.上海證券市場的復雜網絡特性分析[J].東北大學學報:自然科學版,2007,28(7). [3] 魯巍巍,林正春.基于復雜網絡理論的滬深A股分析[J].科學技術與工程,2009,9(11). [4] Song Chao-ming,Havlin S,Makse H A.Complex networks are self-similar[J].Nature,2005,433. [5] Guimera R,Danon L,Dlaz-Guilers A,et al.Self-similar community structure in a network of human interactions[J].Physical Review E,2003,68. [6] 周艷波,蔡世民,周佩玲.金融市場的無標度特征研究[J].中國科學技術大學學報,2009,39(8). [7] 宣蕾,盧錫城,于瑞厚,等.網絡威脅時序的自相似性分析[J].通信學報,2008,29(4). [8] 陶少華,劉玉華,許凱華,等.復雜網絡的自相似性研究[J].中山大學學報:自然科學版,2006,45.