○康 宏 張建剛 劉 宇
(1、山東科技大學經濟管理學院 山東 青島 266590 2、國際關系學院信息科技學院 北京 100091)
近年來,隨著復雜性研究的蓬勃發展,自然界中存在大量的復雜系統,如細胞網絡、城市交通網絡、社會網絡、萬維網等都可以用復雜網絡來描述。復雜網絡是對復雜系統的抽象和描述方式,它突出強調了系統結構的拓撲特征。原則上說,只要是存在相互關系的系統,當把構成單元抽象成節點、單元之間的相互關系抽象為邊時,都可以當作復雜網絡來研究。

圖1 滬深300股票復雜網絡圖
證券市場是一個復雜系統,其行為是通過證券指數來表征的。Mantegna首次根據股票價格數據構建了股票關聯網絡,運用該股票關聯網絡對標準普爾500支股票進行了聚類等級分析。隨著對現實世界中復雜網絡研究的不斷深入,人們逐漸發現現實中的很多復雜網絡都表現出鮮明的、區別于隨機網絡和規則網絡的特征,這種特征被稱為小世界特性和無標度特性。Kim等建立了標準普爾500支股票價格變化相關性加權網絡,研究發現網絡節點的影響強度服從無標度分布;Onnela等研究了紐約證券交易所477支股票形成的關聯網絡拓撲性質,如派系數量和規模、平均聚集系數,并將實際網絡與同等規模的隨機網絡進行了對比。國內研究中,莊新田等建立了上海證券市場網絡,分析了該網絡的拓撲結構,發現該網絡具有典型復雜網絡的統計特性——小世界效應和無標度特性。本文以滬深300股票網絡為研究對象,通過計算不同閥值下的復雜系統參數,得出滬深300股票網絡具有小世界特征,是無標度網絡。研究結論說明,在該網絡中存在少量占主導地位的股票來影響和反映整個股市,這些股票的價格波動很容易影響到其他股票。
要建立金融市場中股票的網絡模型,首先需要確定金融市場中進行交易的不同股票間的相互關聯。本文以滬深300股票為節點集,以股票價格波動相關系數為邊,構造一個無向無權網絡。
記股票i在時間t的收盤價格為P(t)。股票i從時間(t-1)到時間t的對數收益率定義為Ri=lnPi(t)-lnPi(t-1)。
通過計算兩支股票收益時間序列之間的相關系數,確定一對股票的相似程度,文中采用應用最為廣泛的Pearson相關系數,股票i和股票j的相關系數ρij可表述如下:

式中,i,j是股票的標號,E(Ri)為股票i在n期內的平均收益率。計算n支股票的相似程度,可以得到一個n×n的關聯矩陣。由定義可知,ρij的值域為[-1,1],并且ρij=-1,i,j兩支股票是完全負相關的;ρij=1時,i,j兩支股票是完全正相關的;ρij=時,兩支股票是不相關的。因為計算兩支股票的相似程度時,ρij=ρji,因此,相關系數矩陣是對稱矩陣。當相關系數小于0時,股票節點對之間負相關,即一支股票的價格漲跌情況會引起另外一支股票朝著相反的方向變化。但負相關也是節點間相關性的表現,所以本文在計算時對相關系數取絕對值。
為了實現金融市場的復雜網絡建模,需要對關聯矩陣進行量化。考慮隨機噪聲的影響,為關聯矩陣設定一個閥值θ(θ∈[0,1]),只有兩支股票間的相關系數的絕對值大于θ,才能表明他們之間有邊相聯,對應元素設為1。并假設連接節點的邊沒有方向,且權系數等于1,即該邊是無向無權的邊。當兩支股票間相關系數絕對值小于θ,它們之間沒有邊相連,對應元素設為0。同時考慮到同一支股票的自相關系數為1,而對應網絡不允許自連接,所以矩陣對角元素全部設為0。用這個二元矩陣作為股票網絡的生成矩陣,將金融市場中股票之間的相互關聯抽象為一個網絡。
圖1是用pajek做的滬深300股票復雜網絡圖,其中θ取值為0.50,繪圖時,去掉了節點度為0和1的節點。
統計物理學家把小的平均路徑長度和大的聚集系數兩個統計特征合在一起稱為小世界效應,具有這種效應的網絡就是小世界網絡(smallworldnetwork)。這就是Watts和Storgatz提出的小世界網絡模型。
網絡中兩個節點i和j之間的距離d(ij)定義為連接這兩個節點的最短路徑上的邊數。網絡的平均路徑長度l定義為任意兩個節點之間距離的平均值,表示為:

其中n為網絡節點數。
聚類系數用來表示網絡中節點的聚集的疏密程度。假設網絡中的一個節點i通過ki條邊和其他節點相連,這ki個節點就稱為節點i的鄰居,它們之間最多有ki(ki-1)條邊連接。節點i的實際存在的邊數Ei和總的可能的邊數之比就是節點i的聚集系數ci,即:

網絡的平均聚集系數c為所有節點的聚類系數的平均值,即:

這里0≤c≤1,當c=0時,表明網絡中的所有節點全部為孤立節點,即網絡中沒有任何的連邊;當c=1時,表明網絡中任意兩個節點都直接相連。
度分布是描述網絡性質的一個重要統計量。節點度是指連接節點的邊數,節點度分布是指一個任意選擇節點恰好度數為k的概率,也等于網絡中節點度數為k的節點數占網絡節點總數的百分比,用分布函數p(k)表示。從某種意義上說,節點的度越大,說明該節點越“重要”;反之,如果節點的度很小,則說明該節點在網絡中所起到的作用較小,不會對網絡產生很大的影響。
實驗研究發現,大量真實網絡的節點度服從冪律分布。就是說,具有某個特定度的節點數目與這個特定的度之間的關系可以用一個冪函數近似的表示,即:

其中,γ 是冪律指數,(5)式也可等價表示為:

冪函數曲線是一條下降相對緩慢的曲線,這使得度很大的節點可以在網絡中存在,這些度很大的節點稱為網絡的Hub點,Hub點對無標度網絡的運行起著主導作用。把節點度服從冪律分布的網絡叫做無標度網絡(scale-free networks),并稱這種節點度的冪律分布為網絡的無標度特性。
選取滬深300指數中的300只股票作為研究對象。滬深300指數是由上海和深圳證券市場中選取300只A股作為樣本編制而成的成份股指數。滬深300指數樣本覆蓋了滬深市場六成左右的市值,是反映滬深兩個市場整體走勢的“晴雨表”,可以反映滬深兩個市場整體走勢,具有良好的代表性。
選取2014年1月1日,至2014年12月31日之間的238個交易日的數據點。剔除這個時段內停牌時間較長,或者上市較晚的股票17支,剩余283支股票。
在不同的閥值θ 下,由式(2)和(4)求滬深300的平均路徑長度和聚類系數。其中求平均路徑長度用的是佛洛依德(Floyd)算法。

表1 滬深300股票網絡的統計特征
與文獻中的普遍模型的基本統計數據相比較,表1中所列的平均路徑長度和聚類系數說明滬深300股票具有典型的小世界特征。它具有比較小的平均路徑長度,說明在滬深300網絡中,任意兩只股票都可以通過較少的網絡中其他節點而連接。由于網絡中的邊表示股票間價格波動的相關性,因此,說明該網絡中,當一支股票價格發生變化時,其他股票很容易受到影響而隨之發生變化。同時它又具有比較大的聚類系數,說明某支股票的價格波動,該股票的鄰近股票更容易受到影響而隨之波動,影響程度較大。
當θ=0.50時,網絡中節點度小于或等于1的節點為65個;當θ=0.55時,網絡中節點度小于等于1的節點為107個,孤立節點較多,在計算平均路徑長度時,去除這些孤立節點的影響,剩余180個節點之間連通性較強,所以平均路徑長度從2.0636下降到1.0394。表明在θ=0.55時,去除掉的孤立節點較多,關鍵信息丟失,影響網絡拓撲結構特性。

圖2 θ=0.50時網絡度分布雙對數分布曲線

圖3 θ=0.55時網絡度分布雙對數分布曲線
本文選取了不同閥值θ,計算了滬深300股票網絡的度分布情況。當θfflt;0.50時,節點度不服從冪律分布;θ=0.60時,網絡中節點度小于等于1的節點為142個,多于選取的283支股票的半數,許多關鍵信息丟失,所以θ 的取值范圍為0.50≤θ≤0.60。
由圖2和圖3可以看出,當θ=0.50、θ=0.55,經過Matlab仿真,在雙對數坐標系下,其度分布曲線大約在一條直線的附近。當θ=0.50時,直線的斜率為-0.5563;當θ=0.55時,直線的斜率為-0.6409。表明當θ=0.50、θ=0.55時,滬深300股票網絡節點度服從冪律分布,冪指數分別為0.5563與0.6409,滬深300股票網絡是無標度網絡。表明滬深300股票遵從“馬太效應”,Hub節點股票價格波動更容易影響到其他的節點。
本文通過對滬深300股票網絡的分析,構建了滬深300股票收益率復雜網絡,討論了相關系數的取值范圍及其所代表的意義。通過分析對比不同閥值下的網絡平均路徑長度和聚類系數,分析了閥值的取值對分析結果的影響,并得出滬深300股票網絡具有較小的平均路徑長度和較大的聚集系數,具有明顯的小世界特性,說明在這個股票網絡中,單支股票的價格波動會對其他股票的價格波動產生影響。本文分析了不同閥值下滬深300股票網絡的節點度分布,得出其度分布服從冪律分布,在雙對數坐標下可以以一條直線來擬合,說明滬深300股票網絡同時為無標度網絡。同時,在該股票網絡中,存在對整個網絡具有重要作用的節點,這些股票價格波動會對整個股市產生影響,即通常所說的“龍頭效應”。因此,要加強對這些股票的監管。
[1]XinB,WuZ:Neimark—SackerBifurcationAnalysisand01 Chaos Testofan Interactions Model between IndustrialProduction and EnvironmentalQuality in a Closed Area[J].Sustainability,2015(8).
[2]莊新田、閔志鋒、陳師陽:上海證券市場的復雜網絡特性分析[J].東北大學學報,2007(7).