汪亞楠 朱家明



【摘要】針對股票的相關性,運用回歸擬合、時間序列分析、復雜網絡等方法,分別建立缺失值填補、股票間相關性度量、網絡拓撲結構、股市板塊劃分等模型,首先根據缺失值填補模型對股票的周開盤價和周收盤價進行預測,把缺少的個股回報率數據補齊;然后使用Matlab、Ucinet等軟件,度量出股票間相關系數矩陣,通過設定不同閾值,作出網絡拓撲圖,結合中心節點度最大化和股票網絡平均路徑最小化兩個原則選取最優的股票網絡,最后根據股票網絡進行股市板塊劃分。
【關鍵詞】股票相關性 網絡拓撲結構 股市板塊 Matlab Netdraw
中圖分類號:F830.91 文獻標識碼:A
股票市場瞬息萬變,使得普通的投資者對市場的掌控能力下降,從而增大了投資的風險。股票間的相關性對于風險管理、投資決策具有重要影響。己有研究表明,股票間相關程度遠超出了經濟基木面因素的影響。股票市場作為復雜系統日益受到人們的關注,近年來,經濟、數學、社會等領域的學者都開始用復雜網絡及其相關概念來研究股票市場,進而研究股票間相關性。因此,通過對股票市場的相關性進行研究,從而準確的描述不同股票之間的相關結構,特別是兩只股票之間的尾部相關結構就顯得尤為重要。而對于對普通的投資者來說,了解股票之間的相關關系,使用投資模型并結合自身的需求來對金融資產進行適當的組合投資,就可以達到分散風險、提高收益的目的,從而使投資行為更加理性化(安徽財經大學2014年數學建模第四次模擬)。
一、股票缺失值填補
(一)研究思路
為彌補缺失值,首先對附件所給數據進行篩選分析,可得只有指標考慮現金紅利再投資的周個股回報率(W1)和不考慮現金紅利再投資的周個股回報率(W2)含有缺失數據。針對W1,根據計算公式進行計算可求出該組缺失數據的值。對于不能根據此方法計算的缺失數據,對其相鄰數據進行歸納,估計出該缺失數據的值。然后使用函數擬合W1、W2之間的關系,根據擬合得函數關系式,計算出W2的缺失數據。
(二)研究方法
1.填補表中W1缺失值。通過查找資料得考慮現金紅利再投資的周個股回報率計算公式為:
上下周數據完整(即時間序列完整)時:
,pt表示t周的收盤價。
上下周數據不完整(即時間序列完整)時:
根據統計學不等距分組中開區間的組距用相鄰組距近似代替得:
運用公式代入已知數據即可補全W1中缺失數據。
2.填補表中W2的缺失數據。首先通過對數據(W1,W2)進行相關性分析,利用這些數據來求取近似函數W2=F(W1)。式中W1為輸出量,W2為被測量。
利用Excel求得W1與W2的相關系數為0.999985,相關系數接近于1,即W1與W2具有強烈的線性關系,故可以利用線性函數描述W1與W2之間的關系,由此利用此函數關系求出W2。利用Matlab擬合出W1與W2之間的函數關系式為:W2=F(W1)=0.9989 W1,該函數擬合優度極高,其模型顯著,顧客通過該函數對缺失值進行預測。根據函數,運用Excel計算補全W2中缺失數值。
二、股票間相關性度量指標
(一)研究思路
為找出度量股票間相關性的合適指標,首先通過Excel分析數據,確立時間序列;再根據需要剔除時間序列不完整相關數據,并通過隨機抽樣選取樣本數據;其次建立層次分析模型,選取股票的相關指標求股票的綜合指標來研究個股股票的特點;然后根據每股綜合指標研究股票間的相關性。
(二)數據處理
1.數據的篩選與處理。分析附件中數據,可得每股股票的時間維度大都為2012年1月1日至2013年8月31日,交易周為2012年第一周到2013年36周,因為在前期算收益率中剔除了交易周為2012年第一周的數據,故取2012-2周到2013-36周為時間序列。
因為附件表中由于停盤等原因出現交易周數間斷的數據,首先運用Excel將這些數據剔除,其次因為2011年53周數據未知,故無法與2012年1周的數據對比計算收益率,為減少誤差將2012年第一周的數據剔除。
首先通過百度百科,根據代碼對股票分類:代碼以300打頭的創業板、代碼以600、601打頭的滬市A股、代碼以900打頭的滬市B股、代碼以000打頭的深市A股、代碼以200打頭的深圳B股、代碼以002打頭的中小板。然后根據分類,用Excel進行隨機分層抽樣47個股票樣本進行分析。
(三)度量指標的確定
影響股票的主要的指標有每股票凈資產,每股收益,每股現金流等,通過主成分分析,最終選取個股周收益率、個股股價、個股流通市值為評價股票的指標來分析股票間的相關性。
1.指標的量化。收益率,為了能更好的描述數據的統計性質,在這里我們選擇幾何收益率。通過查找相關資料得個股周收益率的計算公式為:
其中Ri(t)表示第i股股票t周收益率,取周收盤價的對數進行計算,再運用Excel按公式計算出樣本數據的周收益率。
股價,個股股價指股票的交易價格,與股票的價值是相對的概念。股票價格的真實含義是企業資產的價值。本文中選取其對數進行分析,通過查找相關資料得個股周收益率的計算公式為:
個股股價=周交易金額/周交易股數
周個股流通市值,即在每周可交易的流通股股數乘以當時股價得出的流通股票總價值。
2.股票綜合度量指標——層次分析模型。設股票綜合度量指標為Z,收益率為Rt,股價為St,周個股流通市值為Ut,則通過層次分析得到各股票綜合指標表達式為:Z=ω1Rt+ω2St+ω3Ut,其中ωi表示各變量對綜合指標影響的權重。
構造結構模型
圖1 層次分析結構圖
兩兩判別矩陣
計算可得CI=2.2204×10-14,則CR=3.8284×10-16<0.1,則判斷矩陣通過一致性檢驗,則得權重分別為:收益率0.6、股價0.3、流通股市0.1。即綜合指標函數為:Zi=0.6Ri(t)+0.3Si(t)+0.1Ui(t)。Zi即為股票間的相關性的度量指標。
因此,首先可按上述公式求出每個股票不同時期的綜合指數,再利用按時間序列分析個股股票時序圖或建立函數,分析其變化規律。然后根據每股股票的綜合指數向量Zi求出向量間的相關系數,總結出股票間的相關性。當兩只股票相關性很強,可由一支股票的漲跌情況來粗略判斷另一支股票的變化規律。
三、股票網絡拓撲結構
(一)研究思路
根據相關性度量指標,求出相關系數矩陣,分析股票間相關性,再設置合適的閾值,通過Ucinet繪出復雜網絡拓撲圖,通過統計節點度,定量分析抽取的47支股票的影響力。
其中,節點i的度ki表示與該節點連接的其他節點的數目。節點的度的越大說明這個節點在某種意義上越“重要”,即這個節點所代表的股票的影響力越大。因此,通過統計出每支股票度的大小,可以分析出這只股票的重要性
(二)研究方法
利用問題二的結論,根據收益率、股價和流通市值各自的權重,計算得到的股票的綜合指標Zi,于是股票i和股票j的綜合指標相關系數Cij。
以抽取的樣本股票為節點集,當相關系數大于或等于指定的閾值θ時就認為股票i和股票j之間有邊連接,并假設鏈接節點的邊是雙向的,否則認為股票綜合指標之間沒有相關性,斷開連接。
(三)研究結果
1.相關性分析。通過Matlab計算股票間相關系數矩陣。本股票節點對的相關系數的絕對值越大,就表示股票節點對之間的關聯性越大。出現負值指股票節點對之間呈負相關,即一支股票的綜合指標的漲跌情況會引起另外一支股票朝著相反方向變化,反之相反。
2.網絡結構拓撲圖。當指定閾值θ=0.55時,中心節點度最大化和股票網絡平均路徑最小,此時股票網絡最優,通過Ucinet軟件繪出樣本股票的網絡拓撲結構圖,如圖2:
其中節點代表股票,節點之間的連邊代表股票價格波動(或其他反映股票關聯的度量)之間的相關性,兩股票間的相關系數大于0.55時,兩節點之間就會存在連線,連線越多代表股票與其他股票間的相關性強,當該股票的變動時會影響很多股票的變動。
圖2 樣本股票的網絡拓撲結構圖
(四)結果分析——股票影響力分析
統計得每只樣本股票的度為圖3所示
圖3 樣本股票度的統計結果
由圖3知第6,14,20,36,44,45支股票的度比較大,因此這六支股票影響力大,即對整個樣本股票集“重要”,它們變動時會影響多支股票的漲跌變化。而第10,11,13,15,17,18,23,26,30,38,40支股票的度為0,則這九支股票的影響力小,即對整個樣本股票集相對“不重要”,與其他股票間的相關性較弱。而剩余的32支股票對整個樣本股票集“重要性”適中。
四、股市的板塊劃分
(一)研究思路
針對問題三所德的股票網絡,可對股票進行板塊劃分并對投資者提出建議。首先設置閾值為0.55,畫出的股票間網絡關聯圖,利用UCINET進行可視化分析,從可視化分析圖中我們可以看到各個股票的相對影響力,然后利用復雜網絡的凝聚子群分析畫出股票不同緯度的分析圖。結合圖表,即可整合劃分出股票的不同板塊。
(二)研究方法
利用Ucinet的Net-Draw程序,在股票間聯系網絡的可視化結構圖的基礎上做中心性的可視化分析,結果如圖4:
圖4 中心性的可視化分析圖
將其進行凝聚子群分析得圖5:
圖5 股票網絡凝聚子群圖
(三)結果分析
根據以上分析結果,樣本股票大致可分為7個板塊,劃分結果如圖6:
圖6 股票板塊劃分
投資者在投資時,應關注所投資股票所屬板塊,并對同一板塊中的其他股票行情進行研究。根據股票間相關性,參考同一板塊中其他股票的行情進行投資,若同一板塊中的其他股票走勢低迷,即使該股行情良好,也不能輕易投資;若同一板塊中的其他股票走勢穩定,則可根據實情進行投資。
參考文獻
[1]高惠璇.應用多元統計分析[M].北京:北京大學出版社,2005.
[2]朱廣萍.應用統計學中樣本容量的確定方法[J].寧夏大學學報, 2002.2,23-24.
[3]賈鵬.基于Copula方法的中國股票市場相關性研究[D].湖南大學,2012.5.
[4]劉雅倩,朱家明,王昌海.基于DCC-MGARCH模型的股票網絡構建[J].嘉興學院學報,2015.3.
[5]李柏年,吳禮斌.Matlab數據分析法[M],北京:機械工業出版社,2012.1.
[6]楊來軍,楊治輝,路飛飛.基于復雜網絡理論的股票指標關聯性實證分析[J].中國管理科學,2014.12.
基金項目:國家自然科學基金(編號:11301001);安徽財經大學教研項目(acjyzd201429);安徽財經大學科研項目(XSKY1563)
作者簡介:汪亞楠(1993-)女,安徽安慶人,安徽財經大學統計與應用數學學院,研究方向:統計學;朱家明(1973-),男,安徽泗縣人,副教授,碩士,安徽財經大學數學建模實驗室主任,研究方向:應用數學與數學建模。